1.
Analiza algoritmov stiskanja na primeru tekstovnih datotek v različnih jezikihKlemen Arzenšek, 2024, magistrsko delo
Opis: Magistrsko delo obravnava različne algoritme stiskanja tekstovnih datotek in analizira, ali jezik, v katerem je zapisana vhodna datoteka, vpliva na uspešnost stiskanja z izbranimi algoritmi. Preučeni in predstavljeni bodo izbrani algoritmi stiskanja, ugotovljene prednosti uporabe izbranih algoritmov stiskanja tekstovnih datotek, določene entropije analiziranih jezikov na ravni znakov, izvedeni praktični testi izbranih algoritmov stiskanja tekstovnih datotek s testnimi vzorci različnih jezikov, analizirano in ugotovljeno, ali jezik v izbranih testnih vzorcih vpliva na uspešnost posameznih algoritmov stiskanja tekstovnih datotek. Delo bo iskalo povezave med entropijo jezika in uspešnostjo stiskanja. Na koncu bo na primeru Huffmanovega algoritma, ki kodira posamezne znake, preverjeno, ali kodiranje daljših nizov izboljša učinkovitost kodiranja.
Ključne besede: naravni jezik, entropija jezika, algoritmi stiskanja, algoritem LZW, tekstovne datoteke
Objavljeno v DKUM: 23.12.2024; Ogledov: 0; Prenosov: 20
Celotno besedilo (2,04 MB)