1. Prednosti in slabosti dvotirnega zapisovanja govora v slovenskih govornih virihDarinka Verdonik, Mitja Trojar, Andreja Bizjak, 2024, samostojni znanstveni sestavek ali poglavje v monografski publikaciji Opis: Zapisovanje govora v govornih korpusih je nedvomno časovno
največji vložek v procesu izdelave govornega korpusa in
pomemben razlog, da so govorni korpusi neprimerno manjši od
pisnih. Zapis govora je prevod iz izvorno večmodalnega kanala
komunikacije, v katerem verbalno izraženi pomen sooblikujejo
glas in način govora, govorica telesa in situacija, v kateri poteka
komunikacija, v eno, pisno modalnost. Zaradi variabilnosti govora
na vseh jezikovnih ravneh se zapisovalec pri tem nenehno sooča
z vprašanjem, kako naj to, kar sliši, zapiše. Da bi bil zapis čim bolj
verodostojen, hkrati pa časovno vseeno izvedljiv za velik obseg
gradiv, se je tako poleg standardiziranega zapisa vzpostavil tudi
tako imenovani pogovorni zapis, ki sledi načelu zapiši, kakor je
izgovorjeno. Toda dvojni zapis zahteva dodaten trud, zato v tem
prispevku kritično prevprašujemo njegovo utemeljenost glede na
prakse drugod, zahtevan dodaten trud in njegove prednosti ter
kritično analiziramo še druga težavnejša vprašanja zapisovanja. Ključne besede: transkribiranje, standardizirani zapisi, ortografska transkripcija, pogovorni zapisi, fonetična transkripcija Objavljeno v DKUM: 14.01.2026; Ogledov: 0; Prenosov: 1
Celotno besedilo (485,45 KB) Gradivo ima več datotek! Več... |
2. Pridobivanje govornih virov : Prednosti in pomanjkljivosti različnih pristopovAndreja Bizjak, 2025, elaborat, predštudija, študija Opis: Elaborat sistematično obravnava različne pristope k pridobivanju govornih virov za slovenščino – od laboratorijskih in terenskih snemanj do sodobnejših spletnih oblik, kot so GWAPs, Collect4NLP, množičenje in občanska znanost. S primerjalno analizo, ki vključuje kriterije kakovosti zvoka, stroškov, razširljivosti in spontanosti govora, razkriva prednosti, omejitve in izvedbeno zahtevnost posameznih pristopov. Vključuje praktična priporočila za raziskovalce in razvijalce govornih tehnologij, ki se soočajo z izzivi snemanja na daljavo. Z združevanjem globalnih trendov in tujih praks z razmerami v slovenskem prostoru prispeva k razvoju digitalnih govornih virov ter krepitvi jezikovnih tehnologij za manj podprte jezike. Ključne besede: pridobivanje govornih virov, snemanje na daljavo, spontani govor, govorjena slovenščina, digitalna humanistika Objavljeno v DKUM: 12.12.2025; Ogledov: 0; Prenosov: 7
Celotno besedilo (1,85 MB) Gradivo ima več datotek! Več... |
3. |
4. |
5. Govorjeni jezik med raziskovanjem in tehnologijo : zbornik povzetkov2025 Opis: Zbornik povzetkov s konference Govorjeni jezik med raziskovanjem in tehnologijo prinaša aktualne prispevke s presečišča govorjenih jezikovnih virov, jezikoslovja in govornih tehnologij. Predstavljeni so javno dostopni hrvaški otroški korpusi v CHILDES/TalkBank ter zbirka ParlaSpeech V3. Več prispevkov obravnava gradnjo in obdelavo govornih virov za slovenščino: od strategij občanske znanosti in odprtokodnih orodij (poravnava, anonimizacija, validacija, normalizacija) do fonetičnega zapisa v Digitalni slovarski bazi ter širjenja slovarskih virov z govorjenim besediščem. Raziskave segajo od (ne)tekočnosti in detekcije zapolnjenih premorov do razmerja med prozodičnimi in stavčnimi enotami ter izzivov narečne transkripcije; napovedan je tudi novi korpus zgodnje komunikacije EPIC-SI. Zbornik je odprtodostopen pod licenco CC BY-SA in je namenjen raziskovalcem jezikoslovja, korpusistike in govorne tehnologije ter širši strokovni skupnosti. Ključne besede: govorni viri, govorne tehnologije, korpusno jezikoslovje, jezikovni korpus, raziskave govora Objavljeno v DKUM: 11.09.2025; Ogledov: 0; Prenosov: 8
Celotno besedilo (2,16 MB) Gradivo ima več datotek! Več... |
6. |
7. |
8. |
9. |
10. |