1. Navzkrižno testiranje simboličnih in konektivističnih pristopov strojnemu učenju na specializiranih bazah akutnega vnetja slepičaMilan Zorman, Sandi Pohorec, Bojan Butolen, Bojan Žlahtič, Peter Kokol, 2012, izvirni znanstveni članek Ključne besede: acute appendicitis, decision trees, artificial neural networks, machine learning, cross-testing, medica informatics Objavljeno v DKUM: 30.12.2015; Ogledov: 1230; Prenosov: 23
Povezava na celotno besedilo |
2. TEKSTOVNE ZNAČILKE IN INFOGRAFSKA PREDSTAVITEV ČASOVNIH SERIJVinko Šmid, 2015, diplomsko delo Opis: Diplomsko delo opisuje implementacijo programa, ki omogoča infografsko predstavitev časovnih serij ter pridobivanje in testiranje značilk, s katerimi zmanjšujemo dimenzionalnost časovnih vrst. Časovne vrste so ponavadi visoko dimenzionalne, eden od načinov zmanjšanja števila elementov v njih je izvedba algoritmov za pridobivanje značilk, s katerimi poizkušamo na krajši način opisati elemente časovne serije. Časovna serija predstavljena z značilkami, je namreč primeren vhod za algoritme strojnega učenja. Za boljše razumevanje smo v dokumentu najprej opisali podatkovno rudarjenje, časovne serije ter infografsko predstavitev, nato pa smo na kratko predstavili še značilke, njihovo uporabo ter njihove značilnosti. Sledi opis načrtovanja in kratka predstavitev samega razvojnega okolja v katerem smo program izdelovali. V glavnem delu naloge smo opisali sam program, njegove funkcionalnosti, čemu je namenjen ter celoten postopek izdelave, na kratko pa smo predstavili tudi grafični izgled. Na koncu smo dodali kratek primer uporabe izdelanega programa ter predstavili rezultate oziroma uspešnost, ki smo jo z aplikacijo dosegli. Ključne besede: časovne serije, tekstovne značilke, infografska predstavitev Objavljeno v DKUM: 14.10.2015; Ogledov: 1190; Prenosov: 71
Celotno besedilo (2,28 MB) |
3. Iskanje informacij po horizontalno porazdeljenih virihSandi Pohorec, Milan Zorman, 2009, izvirni znanstveni članek Opis: Uporaba spletnih iskalnikov je postala vsakodnevna stalnica. Pogosto so spletni iskalniki edini način iskanja informacij. Spletnim mestom, ki želijo svojim uporabnikom ponuditi napredne iskalne storitve, pogosto ne zadostuje uporaba storitev večjih iskalnikov (Google, Yahoo, Live Search). Razlogi za izgradnjo lastnih iskalnih storitev so predvsem v varnosti, želeni ravni poosebitve ter seveda v potrebi po prilagojenem ocenjevanju in razvrščanju rezultatov. Prispevek predstavi delovanje sodobnih iskalnikov in podrobneje opiše iskalno storitev, ki je bila razvita z vidika posameznega spletnega mesta. Iskalni zadetki se avtomatsko prilagajajo uporabniku in njegovim pravicam, ponujeno pa je tudi iskanje po sorodnih spletnih mestih ter strukturiranih in nestrukturiranih virih podatkov. Iskalna storitev ponuja prav tako poosebljanje iskalnih rezultatov glede na interesna področja uporabnika. Ključne besede: spletni iskalniki, iskanje informacij, spletna mesta, iskalna storitev, iskalni indeksi, spletni pajki, porazdeljeni viri Objavljeno v DKUM: 10.07.2015; Ogledov: 1167; Prenosov: 32
Povezava na celotno besedilo |
4. |
5. VREDNOTENJE METOD STROJNEGA UČENJA Z METODAMI OBDELAVE NARAVNEGA JEZIKASandi Pohorec, 2013, doktorska disertacija Opis: Vrednotenje metod strojnega učenja se tradicionalno izvaja z oceno delovanja na ročno označeni testni množici. Ta približek uporabljamo preprosto zato, ker nimamo na voljo boljše metode. Moramo se zavedati, da se je metoda strojnega učenja učila iz zelo sorodnih (podobnih) podatkov. Torej so posledično vsa predvidevanja o zmogljivosti na realnih podatkih, ki so ocenjena na podlagi testne množice, optimistična. Dejanska vrednost metode strojnega učenja temelji na njeni sposobnosti tvorjenja dobrih hipotez.
Ovrednotenje metod strojnega učenja z obdelavo naravnega jezika vpelje popolnoma nov vir: izsledke znanstvenih raziskav in študij, zapisanih v znanstvenih objavah. Ta vir ponuja objektivno metodo ocenitve rezultatov na podlagi podatkov iz raziskav. V veliki meri zmanjša delo domenskih strokovnjakov, ki je potrebno za ovrednotenje rezultatov strojnega učenja. Hkrati je tak pristop zmožen tvoriti enciklopedično zbirko formaliziranega znanja, ki je splošno uporabna. Ključne besede: strojno učenje, podatkovno rudarjenje, verifikacija in validacija, obdelava naravnega jezika Objavljeno v DKUM: 17.04.2013; Ogledov: 2826; Prenosov: 349
Celotno besedilo (7,86 MB) |
6. Local search engine with global content based on domain specific knowledgeSandi Pohorec, Mateja Verlič, Milan Zorman, 2009, izvirni znanstveni članek Opis: In the growing need for information we have come to rely on search engines. The use of large scale search engines, such as Google, is as common as surfingthe World Wide Web. We are impressed with the capabilities of these search engines but still there is a need for improvment. A common problem withsearching is the ambiguity of words. Their meaning often depends on the context in which they are used or varies across specific domains. To resolve this we propose a domain specific search engine that is globally oriented. We intend to provide content classification according to the target domain concepts, access to privileged information, personalization and custom rankingfunctions. Domain specific concepts have been formalized in the form ofontology. The paper describes our approach to a centralized search service for domain specific content. The approach uses automated indexing for various content sources that can be found in the form of a relational database, we! b service, web portal or page, various document formats and other structured or unstructured data. The gathered data is tagged with various approaches and classified against the domain classification. The indexed data is accessible through a highly optimized and personalized search service. Ključne besede: information search, personalization, indexes, crawling, domain specific crawling, natural language processing, content tagging, distributed data sources, ranking functions Objavljeno v DKUM: 31.05.2012; Ogledov: 1739; Prenosov: 37
Povezava na celotno besedilo |
7. |