1. Cephalometric landmark detection in lateral skull X-ray images by using improved spatialconfiguration-netMartin Šavc, Gašper Sedej, Božidar Potočnik, 2022, izvirni znanstveni članek Opis: Accurate automated localization of cephalometric landmarks in skull X-ray images is the
basis for planning orthodontic treatments, predicting skull growth, or diagnosing face discrepancies.
Such diagnoses require as many landmarks as possible to be detected on cephalograms. Today’s
best methods are adapted to detect just 19 landmarks accurately in images varying not too much.
This paper describes the development of the SCN-EXT convolutional neural network (CNN), which
is designed to localize 72 landmarks in strongly varying images. The proposed method is based
on the SpatialConfiguration-Net network, which is upgraded by adding replications of the simpler
local appearance and spatial configuration components. The CNN capacity can be increased without
increasing the number of free parameters simultaneously by such modification of an architecture.
The successfulness of our approach was confirmed experimentally on two datasets. The SCN-EXT
method was, with respect to its effectiveness, around 4% behind the state-of-the-art on the small ISBI
database with 250 testing images and 19 cephalometric landmarks. On the other hand, our method
surpassed the state-of-the-art on the demanding AUDAX database with 4695 highly variable testing
images and 72 landmarks statistically significantly by around 3%. Increasing the CNN capacity
as proposed is especially important for a small learning set and limited computer resources. Our
algorithm is already utilized in orthodontic clinical practice. Ključne besede: detection of cephalometric landmarks, skull X-ray images, convolutional neural networks, deep learning, SpatialConfiguration-Net architecture, AUDAX database Objavljeno v DKUM: 27.03.2025; Ogledov: 0; Prenosov: 5
Celotno besedilo (2,46 MB) Gradivo ima več datotek! Več... |
2. Deeply-supervised 3D convolutional neural networks for automated ovary and follicle detection from ultrasound volumesBožidar Potočnik, Martin Šavc, 2022, izvirni znanstveni članek Opis: Automated detection of ovarian follicles in ultrasound images is much appreciated when
its effectiveness is comparable with the experts’ annotations. Today’s best methods estimate follicles
notably worse than the experts. This paper describes the development of two-stage deeply-supervised
3D Convolutional Neural Networks (CNN) based on the established U-Net. Either the entire U-Net
or specific parts of the U-Net decoder were replicated in order to integrate the prior knowledge into
the detection. Methods were trained end-to-end by follicle detection, while transfer learning was
employed for ovary detection. The USOVA3D database of annotated ultrasound volumes, with its
verification protocol, was used to verify the effectiveness. In follicle detection, the proposed methods
estimate follicles up to 2.9% more accurately than the compared methods. With our two-stage CNNs
trained by transfer learning, the effectiveness of ovary detection surpasses the up-to-date automated
detection methods by about 7.6%. The obtained results demonstrated that our methods estimate
follicles only slightly worse than the experts, while the ovaries are detected almost as accurately as
by the experts. Statistical analysis of 50 repetitions of CNN model training proved that the training
is stable, and that the effectiveness improvements are not only due to random initialisation. Our
deeply-supervised 3D CNNs can be adapted easily to other problem domains.
Ključne besede: 3D deep neural networks, 3D ultrasound images of ovaries, deep supervision, detection of follicles and ovaries, U-Net based architecture Objavljeno v DKUM: 27.03.2025; Ogledov: 0; Prenosov: 5
Celotno besedilo (1,28 MB) Gradivo ima več datotek! Več... |
3. ROSUS 2025 - Računalniška obdelava slik in njena uporaba v Sloveniji 2025 : Zbornik 19. strokovne konference2025, zbornik Opis: ROSUS 2025 – Računalniška obdelava slik in njena uporaba v Sloveniji 2025 je strokovna računalniška konferenca, ki jo od leta 2006 naprej vsako leto organizira Inštitut za računalništvo iz Fakultete za elektrotehniko, računalništvo in informatiko, Univerze v Mariboru. Konferenca povezuje strokovnjake in raziskovalce s področij digitalne obdelave slik in strojnega vida z uporabniki tega znanja, pri čemer uporabniki prihajajo iz raznovrstnih industrijskih okolij, biomedicine, športa, zabavništva in sorodnih področij. Zbornik konference ROSUS 2025 združuje strokovne prispevke več avtorjev, od tega dve vabljeni predavanji ter več demonstracijskih prispevkov. Prispevki podajajo najnovejše dosežke slovenskih strokovnjakov s področij digitalne obdelave slik in strojnega vida, osvetljujejo pa tudi trende in novosti na omenjenih strokovnih področjih. Velik poudarek prispevkov je na promoviranju ekonomske koristnosti aplikacij računalniške obdelave slik in vida v slovenskem prostoru. Takšne računalniške aplikacije zaradi visoke natančnosti, robustnosti in izjemnih hitrosti pri obdelovanju informacij nudijo namreč nove priložnosti za uveljavitev na trgu visokih tehnologij. Ključne besede: računalniška obdelava slik, strojni vid, biomedicina, industrijske aplikacije, prenos znanja Objavljeno v DKUM: 07.03.2025; Ogledov: 0; Prenosov: 5
Celotno besedilo (6,89 MB) Gradivo ima več datotek! Več... |
4. Konfiguracija produktnega kataloga s pomočjo velikih jezikovnih modelov : diplomsko deloLuka Balaban, 2024, diplomsko delo Opis: Zaključno delo obravnava problem kompleksnosti konfiguracije produktnih katalogov v sistemu Monetization podjetja Tridens, kjer se uporabniki pogosto soočajo z izzivi pri razumevanju in nastavitvi zapletenih obračunskih modelov. Cilj dela je razviti umetno inteligenco, ki bo s pomočjo velikih jezikovnih modelov (LLM), kot je ChatGPT, omogočila enostavnejšo in bolj intuitivno konfiguracijo produktnih katalogov. V okviru raziskave smo analizirali obstoječo tehnično dokumentacijo in bazo znanja podjetja Tridens ter izvedli integracijo modela ChatGPT v zaledni sistem za avtomatizirano generiranje in prilagajanje produktnih katalogov. Rešitev smo preizkusili s testnim sklopom povpraševanj, pri čemer smo primerjali rezultate generiranih konfiguracij z referenčnimi primeri. Rezultati so pokazali, da umetna inteligenca uspešno izboljšuje natančnost in hitrost konfiguracije produktnih katalogov, hkrati pa zmanjšuje potrebo po ročnem delu. Zaključek naloge potrjuje, da uporaba velikih jezikovnih modelov prispeva k izboljšanju uporabniške izkušnje in poenostavitvi konfiguracijskih procesov, kar lahko podjetjem, kot je Tridens, prinese pomembne prednosti v konkurenčnem okolju. Ključne besede: veliki jezikovni modeli, umetna inteligenca, produktni katalog, chatGPT, java Objavljeno v DKUM: 06.02.2025; Ogledov: 0; Prenosov: 23
Celotno besedilo (3,25 MB) |
5. Sistem za nadzor dostopa na delovnem mestuLeo Orešnik, 2024, diplomsko delo Opis: Nadzor dostopa igra pomembno vlogo pri vidiku varnosti delovnega mesta oziroma podjetja ter v vsakodnevnem življenju. V teoretičnem delu tega diplomskega dela smo preštudirali koncepte za nadzor dostopa. V praktičnem delu smo načrtali in implementirali zanesljiv ter enostavno razširljiv sistem za nadzor dostopa. Svojo rešitev temeljimo na strojni opremi podjetja ZKTeco. Uporabili smo sodobno tehnologijo, kot sta razvojni okolji .NET in Angular, podatkovno bazo MySQL ter programska jezika C# in TypeScript. Z njimi smo razvili strežnik oziroma API, dostop do podatkovne baze, servis Windows in spletni uporabniški vmesnik. Uporabniški vmesnik smo zasnovali in prilagodili na osnovi povratnih informacij uporabnikov. Naloga združuje več področij računalništva, kot so integracija strojne opreme, spletne in omrežne tehnologije ter načrtovanje in upravljanje podatkovnih baz. Implementirano rešitev smo izčrpno ročno testirali s pomočjo vnaprej pripravljenih testnih primerov. Ključne besede: nadzor dostopa, strojna oprema ZKTeco, .NET, Angular Objavljeno v DKUM: 23.12.2024; Ogledov: 0; Prenosov: 44
Celotno besedilo (4,94 MB) |
6. Primerjava modernih konvolucijskih nevronskih mrež na problemu segmentiranja slik : diplomsko deloIvana Dukarić, 2024, diplomsko delo Opis: V diplomskem delu smo preučevali in analizirali rezultate arhitektur konvolucijskih nevronskih mrež na problemu binarne segmentacije. V teoretičnem delu smo preučili arhitekture konvolucijskih nevronskih mrež SegFormer, DeepLapV3+, Gated-SCNN, Segmenter, FastFCN in TopFormer. V praktičnem delu diplomskega dela smo mreže SegFormer, Segmenter, FastFCN in TopFormer učili segmentirati slike na podatkovnih množicah Cityscapes in ADE20K. Mreže smo učili binarne segmentacije vozil. Mrežo SegFormer smo še dodatno učili na problemu binarnega segmentiranja ljudi. Dobljene rezultate smo analizirali in jih ovrednotili z evalvacijskimi metrikami. Za ocenjevanje uspešnosti smo uporabili metrike točnost, priklic, natančnost, IoU in F1 oceno. Najboljše rezultate za problem binarnega segmentiranja vozil smo dobili s pomočjo mreže SegFormer na podatkovni zbirki Cityscapes. Na podatkovni zbirki ADE20K smo za enak problem segmentacije dobili najboljše rezultate za mrežo Segmenter. Najslabše sta se izkazali mreža TopFormer na podatkovni zbirki Cityscapes in mreža FastFCN na podatkovni zbirki ADE20K. Ključne besede: binarna segmentacija, konvolucijske nevronske mreže, primerjava mrež, evalvacijske metrike, računalniški vid Objavljeno v DKUM: 26.04.2024; Ogledov: 506; Prenosov: 90
Celotno besedilo (3,19 MB) |
7. ROSUS 2024 - Računalniška obdelava slik in njena uporaba v Sloveniji 2024 : Zbornik 18. strokovne konference2024, zbornik Opis: ROSUS 2024 – Računalniška obdelava slik in njena uporaba v Sloveniji 2024 je strokovna računalniška konferenca, ki jo od leta 2006 naprej vsako leto organizira Inštitut za računalništvo iz Fakultete za elektrotehniko, računalništvo in informatiko, Univerze v Mariboru. Konferenca povezuje strokovnjake in raziskovalce s področij digitalne obdelave slik in strojnega vida z uporabniki tega znanja, pri čemer uporabniki prihajajo iz raznovrstnih industrijskih okolij, biomedicine, športa, zabavništva in sorodnih področij. Zbornik konference ROSUS 2024 združuje strokovne prispevke več avtorjev, od tega dve vabljeni predavanji ter več demonstracijskih prispevkov. Prispevki podajajo najnovejše dosežke slovenskih strokovnjakov s področij digitalne obdelave slik in strojnega vida, osvetljujejo pa tudi trende in novosti na omenjenih strokovnih področjih. Velik poudarek prispevkov je na promoviranju ekonomske koristnosti aplikacij računalniške obdelave slik in vida v slovenskem prostoru. Takšne računalniške aplikacije zaradi visoke natančnosti, robustnosti in izjemnih hitrosti pri obdelovanju informacij nudijo namreč nove priložnosti za uveljavitev na trgu visokih tehnologij. Ključne besede: strojni vid, biomedicina, industrijske aplikacije, prenos znanja, računalniška obdelava slik Objavljeno v DKUM: 12.03.2024; Ogledov: 248; Prenosov: 35
Celotno besedilo (13,78 MB) Gradivo ima več datotek! Več... |
8. UAV Thermal Imaging for Unexploded Ordnance Detection by Using Deep LearningMilan Bajić, Jr., Božidar Potočnik, 2023, izvirni znanstveni članek Opis: A few promising solutions for thermal imaging Unexploded Ordnance (UXO) detection were proposed after the start of the military conflict in Ukraine in 2014. At the same time, most of the landmine clearance protocols and practices are based on old, 20th-century technologies. More than 60 countries worldwide are still affected by explosive remnants of war, and new areas are contaminated almost every day. To date, no automated solutions exist for surface UXO detection by using thermal imaging. One of the reasons is also that there are no publicly available data. This research bridges both gaps by introducing an automated UXO detection method, and by publishing thermal imaging data. During a project in Bosnia and Herzegovina in 2019, an organisation, Norwegian People's Aid, collected data about unexploded ordnances and made them available for this research. Thermal images with a size of 720 x 480 pixels were collected by using an Unmanned Aerial Vehicle at a height of 3 m, thus achieving a very small Ground Sampling Distance (GSD). One of the goals of our research was also to verify if the explosive war remnants' detection accuracy could be improved further by using Convolutional Neural Networks (CNN). We have experimented with various existing modern CNN architectures for object identification, whereat the YOLOv5 model was selected as the most promising for retraining. An eleven-class object detection problem was solved primarily in this study. Our data were annotated semi-manually. Five versions of the YOLOv5 model, fine-tuned with a grid-search, were trained end-to-end on randomly selected 640 training and 80 validation images from our dataset. The trained models were verified on the remaining 88 images from our dataset. Objects from each of the eleven classes were identified with more than 90% probability, whereat the Mean Average Precision (mAP) at a 0.5 threshold was 99.5%, and the mAP at thresholds from 0.5 to 0.95 was 87.0% up to 90.5%, depending on the model's complexity. Our results are comparable to the state-of-the-art, whereat these object detection methods have been tested on other similar small datasets with thermal images. Our study is one of the few in the field of Automated UXO detection by using thermal images, and the first that solves the problem of identifying more than one class of objects. On the other hand, publicly available thermal images with a relatively small GSD will enable and stimulate the development of new detection algorithms, where our method and results can serve as a baseline. Only really accurate automatic UXO detection solutions will help to solve one of the least explored worldwide life-threatening problems. Ključne besede: unmanned aerial vehicle, unexploded ordnance, thermal imaging, UXOTi_NPA dataset, convolutional neural networks, deep learning Objavljeno v DKUM: 12.02.2024; Ogledov: 389; Prenosov: 26
Celotno besedilo (16,94 MB) Gradivo ima več datotek! Več... |
9. Kombiniranje modelov razvrščanja vzorcev za razpoznavanje čustvenih izrazov iz posnetkov obraza v nekontroliranem okolju : diplomsko deloJuš Osojnik, 2023, diplomsko delo Opis: V tem delu smo se ukvarjali z razpoznavanjem čustvenih izrazov v nekontroliranem okolju.
Uporabljali smo metodo prenosnega učenja, kjer smo učili arhitekture konvolucijskih nevronskih mrež: EfficientNetB0, ResNet50, DenseNet121, InceptionV3 in Xception, na naboru podatkovnih zbirk FER-2013, AffectNet, AFEW/SFEW in Aff-Wild2. Modele smo nato kombinirali na osnovi rezultatov z metodama povprečenja in glasovanja. Modele smo kombinirali tudi na osnovi izluščenih značilnic. Uspešnost modelov smo merili po metrikah natančnosti in ocene F1. Na podatkovni zbirki FER-2013 smo dosegli najboljšo natančnost 72 %, na zbirkah AffectNet 67 %, AFEW/SFEW 47 % in Aff-Wild2 52 % natančnost. Z našimi rezultati smo se približali najuspešnejšim raziskavam, ki so na posameznih podatkovnih zbirkah dosegle natančnosti: FER-2013 77 %, AffectNet 67 %, AFEW/SFEW 54 % in Aff-Wild2 52 %. Ključne besede: prepoznavanje čustvenih izrazov, slike obrazov, globoke nevronske mreže, modelno združevanje, ekstrakcija značilnic, okolje Keras Objavljeno v DKUM: 13.10.2023; Ogledov: 512; Prenosov: 60
Celotno besedilo (4,01 MB) |
10. Kombiniranje več modelov razvrščanja vzorcev na primeru ocenjevanja starosti osebe iz digitalnih posnetkov : diplomsko deloTadej Horvat, 2023, diplomsko delo Opis: V tej diplomski nalogi se ukvarjamo s kombiniranjem različnih prosto dostopnih modelov konvolucijskih nevronskih mrež za reševanje problema ocenjevanja starosti oseb iz digitalnih posnetkov. Naš cilj je bil implementirati ansambelske metode, ki so bolj uspešne od vsakega posameznega modela v našem ansamblu. Kombinirali smo pet osnovnih modelov konvolucijskih nevronskih mrež, in sicer Xception, ResNet152V2, InceptionV3, InceptionResNetV2 in EfficientNetV2B0. Modele smo kombinirali na nivoju rezultatov in na nivoju značilnic, pri čemer smo implementirali štiri metode kombiniranja na nivoju rezultatov in pet metod kombiniranja na nivoju značilnic. Za učenje posameznih modelov in testiranje metod smo uporabili bazo podatkov UTKFace. Najboljši rezultat smo dosegli z metodo večslojnega »stackinga«, in sicer srednjo absolutno napako 4,526 let nad našo testno množico. Rezultat le malenkost zaostaja za rezultati najboljših sodobnih metod ocenjevanja starosti iz digitalnih posnetkov. Ključne besede: ocenjevanje starosti oseb, konvolucijske nevronske mreže, ansambelsko učenje Objavljeno v DKUM: 05.10.2023; Ogledov: 424; Prenosov: 33
Celotno besedilo (1,75 MB) |