| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Show document Help

Title:Lossless Compression of High-frequency Intervals in Digital Audio : bachelor's thesis
Authors:ID Benc, Ivan (Author)
ID Žalik, Borut (Mentor) More about this mentor... New window
ID Podgorelec, David (Comentor)
Files:.pdf UN_Benc_Ivan_2022.pdf (1,90 MB)
MD5: 316FBA11A2F20650BB93329DFB00B76D
 
Language:English
Work type:Bachelor thesis/paper
Typology:2.11 - Undergraduate Thesis
Organization:FERI - Faculty of Electrical Engineering and Computer Science
Abstract:In this Thesis, an algorithm for lossless audio compression in a time domain is developed and implemented. The algorithm is designed to estimate the signal frequency based on the number of local extremes, and adapts the encoding to the estimated high or low- frequency intervals. As possible adaptations, fitting line segments, quadratic Bézier curves to the signal, and dictionary compression are examined. Residuals are encoded with delta encoding and compressed with binary adaptive sequential coding. The difference in the proportions of line segments and curves used in the high and low-frequency intervals have been detected, but this is not significant enough for this kind of interval discrimination to be meaningful in the current design of the algorithm.
Keywords:lossless audio compression, delta encoding, binary adaptive sequential coding, greedy method
Place of publishing:Maribor
Place of performance:Maribor
Publisher:[I. Benc]
Year of publishing:2022
Number of pages:1 spletni vir (1 datoteka PDF (X, 25 f.))
PID:20.500.12556/DKUM-83232 New window
UDC:004.627.021:621.3.029.3(043.2)
COBISS.SI-ID:145510659 New window
Publication date in DKUM:07.11.2022
Views:582
Downloads:44
Metadata:XML RDF-CHPDL DC-XML DC-RDF
Categories:KTFMB - FERI
:
Copy citation
  
Average score:(0 votes)
Your score:Voting is allowed only for logged in users.
Share:Bookmark and Share


Hover the mouse pointer over a document title to show the abstract or click on the title to get all document metadata.

Licences

License:CC BY-NC-ND 4.0, Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International
Link:http://creativecommons.org/licenses/by-nc-nd/4.0/
Description:The most restrictive Creative Commons license. This only allows people to download and share the work for no commercial gain and for no other purposes.
Licensing start date:30.09.2022

Secondary language

Language:Slovenian
Title:Brezizgubno stiskanje visokofrekvenčnih intervalov v digitalnem avdiu
Abstract:V diplomskem delu smo razvili in implementirali algoritem za stiskanje avdia v časovni domeni brez izgub. Algoritem je zasnovan tako, da bo na podlagi ocene frekvence, temelječe na številu lokalnih ekstremov avdiosignala, prilagodil kodiranje ocenjenim visokofrekvenčnim ali nizkofrekvenčnim intervalom. Kot možne prilagoditve smo preučevali prileganje avdiosignala daljicam in kvadratnim Bézierovim krivuljam ter stiskanje s slovarjem, prvo v lastni implementaciji, slednje v zunanjem programu. Preostanke, ki jih predstavljajo odstopanja avdiosignala od daljice ali krivulje, zapišemo s kodiranjem delta in stisnemo z prilagodljivim binarnim zaporednim kodiranjem. Zaznali smo razliko v deležih rabe krivulj in daljic v nizkofrekvenčnih in visokofrekvenčnih intervalih, vendar ta ni dovolj signifikantna, da bi bilo tovrstno ločevanje intervalov smiselno pri sedanji zasnovi algoritma. V uvodnem poglavju izpostavimo izziv, ki ga predstavlja nižja stopnja stiskanja visokofrekvenčnih odsekov avdia, ki jo obstoječi brezizgubni algoritmi dosegajo v primerjavi z učinkovitosti stiskanja nižjefrekvenčnih odsekov. Vprašamo se, ali je naš algoritem lahko že v osnovi konkurenčen obstoječim metodam brezizgubnega stiskanja avdia, kako postaviti prag med visokofrekvenčnimi in nizkofrekvenčnimi odseki ter kako bi takšno razlikovanje lahko prispevalo uspešnejšemu stiskanju. V drugem poglavju opišemo teoretično ozadje naloge. V tretjem poglavju predstavimo lastno metodo, ki za razliko od drugih metod brezizgubnega stiskanja avdia ne napoveduje posameznega vzorca iz množice predhodnih vzorcev, ampak napove več vzorcev hkrati s čim optimalnejšo izbiro prilegajoče krivulje ali daljice iz danega nabora. Kot krivulje uporabimo kvadratne Bézierove krivulje, ki jih opišemo s tremi kontrolnimi točkami in preostanki, pri čemer moramo sredinsko kontrolno točko predhodno še izračunati. Izkazalo se je, da je bolj racionalno izhajati iz razlik med zaporednimi vzorci, torej iz kodiranja delta, kot iz samih vzorcev. Ob navedenih posebnostih naše metode smo tudi ugotovili, da je za kodiranje entropije preostankov bolje uporabiti prilagodljivo binarno zaporedno kodiranje namesto Riceovega kodiranja, ki ga uporabljajo drugi algoritmi brezizgubnega stiskanja avdia. Ločeno podpoglavje je namenjeno tudi poskusom določanja praga med visokofrekvenčnimi in nizkofrekvenčnimi intervali ter eksperimentiranju z drugačnimi pristopi stiskanja enih in drugih, kar pa ob trenutni zasnovi algoritma ni pomembno vplivalo na stopnjo stiskanja. V zaključku poglavja opišemo tudi posebnosti implementacije in uporabniški vmesnik konzolne aplikacije. V četrtem poglavju opišemo testno okolje in analiziramo rezultate testiranj. Najprej preizkusimo vpliv dolžine odsekov, ki jih modeliramo s krivuljami in daljicami, na čas obdelave in na stopnjo stiskanja. Ugotovimo, da se v večini primerov uporabljajo za aproksimacijo avdiosignala krajše daljice. Nato primerjamo rezultate stiskanja testnega nabora avdioposnetkov, dosežene z našo metodo, s kodirnikom FLAC in stiskanjem s slovarjem. Poskus ponovimo v enosekundnih intervalih s polsekundnim prekrivanjem, pri čemer smo iskali morebitne prednosti stiskanja s slovarjem. Naša metoda se izkaže za primerljivo z obstoječimi brezizgubnimi avdiokodeki, saj že v zgodnji fazi razvoja dosega le 10-40 % slabše rezultate. Časi dekodiranja povsem zadoščajo zahtevam realnočasovnega predvajanja, časi kodiranja pa so zaradi reševanja optimizacijskega problema izbire dolžin krivulj in daljic pričakovano slabši kot v obstoječih metodah. Zaenkrat nismo potrdili smiselnosti razlikovanja med nizkofrekvenčnimi in visokofrekvenčnimi intervali na podlagi števila lokalnih ekstremov avdiosignala v časovnem oknu, saj je to število močno zaznamovano s šumom in vsebnostjo časovno zakasnelih nižjefrekvenčnih komponent.
Keywords:brezizgubno stiskanje avdia, kodiranje delta, prilagodljivo binarno zaporedno kodiranje, požrešna metoda


Comments

Leave comment

You must log in to leave a comment.

Comments (0)
0 - 0 / 0
 
There are no comments!

Back
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica