1. Aplikacija za pregledovanje in podpisovanje slikovnih dokumentov PDF s pomočjo optičnega prepoznavanja besedila : diplomsko deloIgor Kepe, 2022, diplomsko delo Opis: V diplomskem delu smo razvili aplikacijo, ki bo pohitrila in olajšala podpisovanje dokumentov PDF. Implementirana je v programskem jeziku Python, optično prepoznavanje besedila pa je izvedeno z uporabo odprtokodne knjižnice Tesseract. Aplikacija je namenjena podpisovanju dokumentov PDF s slikovnimi in certificiranimi digitalnimi podpisi ter prepoznavanju besedila iz slik in slikovnih dokumentov PDF. Poleg tega nam lahko služi tudi kot enostavni urejevalnik besedila. V veliko pomoč je aplikacija lahko študentom ter vsem, ki se pri delu srečujejo z digitalizacijo ali arhiviranjem dokumentov. Prav tako vsem tistim, ki potrebujejo prepoznavo besedila natisnjenih ali skeniranih dokumentov. Ključne besede: Optično prepoznavanje znakov, Tesseract OCR, digitalni podpis, Python, dokument PDF Objavljeno v DKUM: 17.10.2022; Ogledov: 164; Prenosov: 23
Celotno besedilo (2,57 MB) |
2. Aplikacija odprtokodne knjižnice za optično prepoznavo znakov na operacijskem sistemu AndroidTina Nemanič, 2017, magistrsko delo/naloga Opis: Magistrska naloga obravnava odprtokodno knjižnico Tesseract za optično prepoznavo znakov (OCR, optical character recognition) na operacijskem sistemu Android. Podane so osnove in pregled aktualnih raziskav na področju optične prepoznave znakov. Raziskave so usmerjene v: a) prepoznavanje ročne pisave, b) samostojne aplikacije na mobilnih napravah, c) delovanje v realnem času v kombinaciji s prevodom, d) večjezične aplikacije in e) strojno učenje. Razlogi za odločitev za uporabo knjižnice Tesseract so: odprta koda, najboljši rezultati pri neodvisnih merjenjih in prilagojenost za operacijski sistem Android. Kot razvojno orodje je bil uporabljen Android Studio zaradi enostavnosti uporabe, ugodne krivulje učenja, možnosti uporabe čarovnika in močnih orodjih za razhroščevanje. Razvita rešitev je aplikacija za operacijski sistem Android 5.0 Lollipop, ki uporablja API 21. V letu 2016 bi razvito aplikacijo lahko uporabilo približno 40,5% naprav. Aplikacija deluje popolnoma avtonomno, čas prepoznave je pod eno minuto. Rezultati testiranja so pokazali, da v slabih svetlobnih pogojih, kot je na primer slika plinskega ali električnega števca, dobimo zelo nizko stopnjo prepoznanih številk. To stopnjo je možno povečati z dodatnim treningom aplikacije, vendar so tudi tu pomembne omejitve. Ključne besede: odprta koda, OCR-optična prepoznava znakov, Android, aplikacija, knjižnica Tesseract Objavljeno v DKUM: 28.06.2017; Ogledov: 1143; Prenosov: 180
Celotno besedilo (1,72 MB) |
3. APLIKACIJA ZA ARHIVIRANJE RAČUNOV IN GARANCIJJure Žnidarec, 2015, diplomsko delo Opis: Vsakemu od nas se je že kdaj zgodilo, da je ob poplavi računov kakšnega izgubil ali vrgel vstran. Problem nastane takrat, ko želimo izdelek zamenjati, ker nam ta ne ustreza ali se pokvari, saj lahko garancijo uveljavljamo le z računom in garancijsko listino.
V diplomski nalogi smo realizirali sistem za shranjevanje računov s pomočjo naprav za zajem slik, tako za mobilne kot tudi namizne naprave. Uporabniku je vnos izdelkov poenostavljen, tako da se podatki o izdelku vnesejo s pomočjo prepoznavanja znakov s slik, ki smo jih zajeli s pomočjo fotoaparata mobilne naprave ali optičnega bralnika, priklopljenega na namizno napravo. Ključne besede: račun, mobilna aplikacija, namizna aplikacija, Tesseract OCR, WIA Objavljeno v DKUM: 14.10.2015; Ogledov: 1235; Prenosov: 176
Celotno besedilo (3,42 MB) |
4. RAZPOZNAVANJE REGISTRSKIH TABLIC NA MOBILNEM TELEFONU Z OPERACIJSKIM SISTEMOM ANDROIDGregor Bačun, 2014, diplomsko delo Opis: V tem diplomskem delu smo se ukvarjali z razpoznavo registrskih tablic na mobilnem telefonu z operacijskim sistemom Android. Kot izhodiščno metodo smo uporabili detekcijo s konturami. Z uporabo različnih morfoloških operacij smo izboljšali natančnost razpoznave, vključili pa smo še sistem za optično razpoznavo znakov. Nastala je aplikacija, s katero med vožnjo iz video toka zajemamo slike ter na njih lociramo registrske tablice. Iz njih nato izločimo posamezne znake in jih pretvorimo v tekst. V zadnjem koraku enake registrske tablice združimo s pomočjo primerjave histogramov in na ta način še izboljšamo končne rezultate.
Uspešnost postopka smo preverjali s pomočjo predhodno zajetega video materiala. Ocenjevali smo uspešnost posameznih faz ter uspešnost celotnega postopka. Rezultati kažejo, da smo glede na metodo, iz katere smo izhajali, uspešnost razpoznave registrskih tablic bistveno izboljšali. Odstotek pravilno razpoznanih registrskih tablic namreč presega 80 %. Ključne besede: razpoznavanje registrskih tablic, obdelava digitalnih slik, segmentacija, primerjava histogramov, knjižnica OpenCV, knjižnica Tesseract, operacijski sistem Android Objavljeno v DKUM: 20.05.2014; Ogledov: 2635; Prenosov: 188
Celotno besedilo (12,51 MB) |
5. OPTIČNO RAZPOZNAVANJE ZNAKOV IZ SLIK IN VIDEAAljaž Štraser, 2012, diplomsko delo Opis: V diplomskem delu obravnavamo optično razpoznavo znakov iz slik in videa. Teoretični del obsega študijo procesa optične razpoznave znakov, kjer analiziramo vse pomembne korake predobdelave slik, detekcije besedila in razpoznave znakov.
Praktični del obsega izdelavo aplikacije v okolju .NET, kjer najprej z uporabo knjižnice Emgu CV implementiramo algoritma za detekcijo orientacije besedila in izločitev besedila iz ozadja ter ostalih nepotrebnih grafičnih elementov. Predobdelane slike z besedilom nato obdelamo s prostodostopnim sistemom za optično razpoznavo znakov Tesseract OCR, za katerega izdelamo tudi podporo razpoznavi znakov slovenskega črkopisa. Razpoznavalnik Tesseract OCR preko ovoja .NET Emgu.CV.OCR vključimo v našo aplikacijo. Ključne besede: Optično razpoznavanje znakov, Obdelava slik, Emgu CV, Tesseract OCR, ogrodje .NET Objavljeno v DKUM: 27.11.2012; Ogledov: 1846; Prenosov: 169
Celotno besedilo (1,63 MB) |