Komprese

Z MiS

(Rozdíly mezi verzemi)

Přejít na: navigace, hledání

Verze z 27. 3. 2017, 06:55

Obsah

1 Principy
- 1.1 Definice
- 1.2 Model dat
2 Pojmy
3 Rozdělení kompresních metod
4 Příklady metod

Principy

Definice

Kompresní metody: Postupy, vedoucí ke snížení objemu dat při zachování podstatné informace.

Model dat

Kompresi můžeme využít pouze tehdy, pokud umíme odlišit „podstatnou“ informaci od zbytku.
Musíme tedy vědět nějaké další informace o datech, které komprimujeme.
Pojem „model dat“ označuje souhrn pravidel, o kterých víme, že jsou v datech dodržena.

Příklad — Chceme komprimovat posloupnost nul a jedniček

Pokud o datech nic nevíme, pak:
- nevíme, co z těchto dat můžeme „ztratit“, aniž bychom poškodili původní informaci.
- Můžeme si ale všimnout, že se často opakují některé posloupnosti nul a jedniček a nahradit je jinými, kratšími posloupnostmi (za cenu toho, že jiné, málo se opakující, nahradíme delšími posloupnostmi).
- Naším „modelem dat“ tedy bude pravděpodobnost výskytu jednotlivých posloupností.
- (Pokud by však pravděpodobnosti výskytu jednotlivých posloupností byly stejné, komprese nám nic nepřinese.)
Pokud bychom ale věděli, že naše posloupnost nul a jedniček nese informace o barvách pixelů na fotce...
- pak víme, že tato data jsou již zatížena chybou při digitalizaci
- a že na fotce nejspíš sousední pixely budou mít „podobné“ barvy.
- Můžeme tak postavit mnohem přesnější model dat a vylepšit použitý kompresní algoritmus.

Pojmy

Kompresní poměr
- Poměr velikosti původních dat a velikosti zkomprimovaných dat.
- Závisí na konkrétních datech, která komprimujeme.

Kompresní poměr

Pro bezeztrátovou kompresi a obecná data je typický kompresní poměr 2:1.
Pro ztrátovou kompresi (obvykle obrázky, video atd.) je typický kompresní poměr cca 10:1.

Entropie
- Množství podstatné informace obsažené v datech.
- Velikost dat při použití ideálního kompresního algoritmu bezeztrátové komprese.

Rozdělení kompresních metod

Ztrátové × bezeztrátové

Ztrátové typicky u videa, audia, obrázků a dalších dat, která jsou již sama zatížena chybou.
Ztrátové mohou docílit výrazně vyššího kompresního poměru za cenu dílčího poškození (zhoršení kvality) komprimovaných dat.

Statistické × slovníkové metody

Statistické metody

Nahrazují jednotlivé hodnoty symbolů posloupností bitů.
Můžeme si představit třeba tabulku: E => 01, A => 100, T => 101,...
Vychází z toho, že pravděpodobnost výskytu znaků se dá spočítat a není stejná.
Pro běžná počítačová data malý kompresní poměr, jsou spíše součástí jiných metod.

Slovníkové metody

Nahrazují celé posloupnosti symbolů (slova) za posloupnosti bitů.
Převodní tabulka je větší, ale můžeme docílit lepšího kompresního poměru.
Do této skupiny patří většina běžně používaných metod.

Statické × dynamické metody

Statické metody

Po celou dobu komprese datového souboru se převodní tabulka nemění.
Většinou se převodní tabulka musí přiložit k souboru.
Často je třeba nejprve předzpracovat statistiku výskytu znaků.

Dynamické metody

Upravují převodní tabulku v průběhu komprese.

Příklady metod

LZ 77

Používá kompresní program ZIP a odvozené.
Bezeztrátová slovníková metoda
Autoři Lempel a Ziv, Izrael, 1977.

LZ 78

Tvoří základ algoritmů programů RAR a GZIP
Autoři Lempel a Ziv, Izrael, 1978.

@@ Řádka 1: / Řádka 1: @@
 [[Category:VSE]][[Category:Sítě]][[Category:Informatika]][[Category:Bezpečnost]][[Category:CRI]][[Category:Komprese]]
-== Definice ==
+== Principy ==
+=== Definice ===
 * Kompresní metody: Postupy, vedoucí ke snížení objemu dat při zachování podstatné informace.
+=== Model dat ===
+* Kompresi můžeme využít pouze tehdy, pokud umíme odlišit „podstatnou“ informaci od zbytku.
+* Musíme tedy vědět nějaké další informace o datech, které komprimujeme.
+* Pojem „model dat“ označuje souhrn pravidel, o kterých víme, že jsou v datech dodržena.
+<div class="Priklad">
+; Příklad &mdash; Chceme komprimovat posloupnost nul a jedniček
+# Pokud o datech nic nevíme, pak:
+#* nevíme, co z těchto dat můžeme „ztratit“, aniž bychom poškodili původní informaci.
+#* Můžeme si ale všimnout, že se často opakují některé posloupnosti nul a jedniček a nahradit je jinými, kratšími posloupnostmi (za cenu toho, že jiné, málo se opakující, nahradíme delšími posloupnostmi).
+#* Naším „modelem dat“ tedy bude pravděpodobnost výskytu jednotlivých posloupností.
+#* ''(Pokud by však pravděpodobnosti výskytu jednotlivých posloupností byly stejné, komprese nám nic nepřinese.)''
+# Pokud bychom ale věděli, že naše posloupnost nul a jedniček nese informace o barvách pixelů na fotce...
+#* pak víme, že tato data jsou již zatížena chybou při digitalizaci
+#* a že na fotce nejspíš sousední pixely budou mít „podobné“ barvy.
+#* Můžeme tak postavit mnohem přesnější model dat a vylepšit použitý kompresní algoritmus.
+</div>

Komprese

Verze z 27. 3. 2017, 06:55

Obsah

Principy

Definice

Model dat

Pojmy

Rozdělení kompresních metod

Ztrátové × bezeztrátové

Statistické × slovníkové metody

Statické × dynamické metody

Příklady metod

Osobní nástroje

Jmenné prostory

Varianty

Zobrazení

Akce

Hledat

Výuka

Navigace

Nástroje