| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Show document Help

Title:Slovenska baza BNSI broadcast news za razpoznavanje tekočega govora
Authors:ID Žgank, Andrej (Author)
ID Verdonik, Darinka (Author)
ID Kačič, Zdravko (Author)
Files:URL http://www.dlib.si/details/URN:NBN:SI:DOC-WL3BOUBB
 
Language:Slovenian
Work type:Not categorized
Typology:1.01 - Original Scientific Article
Organization:FERI - Faculty of Electrical Engineering and Computer Science
Abstract:V članku bomo predstavili nov slovenski jezikovni vir, bazo BNSI Broadcast News, ki vsebuje posnetke televizijskih dnevnoinformativnih oddaj. Vir je namenjen razvoju razpoznavalnikov tekočega govora z velikim slovarjem besed za neomejeno domeno. Sestavljajo ga govorna baza z ročno tvorjenimi transkripcijami v obsegu 36 ur in tekstovni korpus, ki vsebuje I I niio besed. Govorna baza je namenjena učenju akustičnih modelov, tekstovni korpus pa bo uporabljen za izdelavo jezikovnih modelov. Novi jezikovni vir je plod sodelovanja med Univerzo v Mariboru, FERI in IZ'FV Slovenija. V članku bomo najprej predstavili postopek zajemanja gradiva in karakteristike baze. Opisali bomo potek ročnega zapisovanja govornega korpusa. Sledila bo podrobna analiza govornega in tekstovnega dela baze, ki je namenjena predstavitvi vseh lastnosti jezikovnega vira, ki vplivajo na razvoj razpoznavalnikov govora.
Keywords:slovenski jezikovni vir, avtomatsko razpoznavanje tekočega govora, govorni korpus, besedilni korpus, Broadcast news
Publisher:Elektrotehniška zveza Slovenije
Year of publishing:2008
Number of pages:str. 85-90
Numbering:Letn. 75, št. 3
PID:20.500.12556/DKUM-52632 New window
UDC:81'1:004.9
ISSN on article:0013-5852
COBISS.SI-ID:6739796 New window
NUK URN:URN:SI:UM:DK:EQTIL79X
Publication date in DKUM:10.07.2015
Views:1433
Downloads:69
Metadata:XML DC-XML DC-RDF
Categories:Misc.
:
Copy citation
  
Average score:(0 votes)
Your score:Voting is allowed only for logged in users.
Share:Bookmark and Share


Hover the mouse pointer over a document title to show the abstract or click on the title to get all document metadata.

Record is a part of a journal

Title:Elektrotehniški vestnik
Publisher:Strokovna zadruga koncesijoniranih elektrotehnikov
ISSN:0013-5852
COBISS.SI-ID:742916 New window

Secondary language

Language:English
Title:The Slovenian BNSI broadcast news database for continuous speech recognition
Keywords:Slovenian language resources, automatic continuous speech recognition, speech corpus, text corpus, Broadcast news


Comments

Leave comment

You must log in to leave a comment.

Comments (0)
0 - 0 / 0
 
There are no comments!

Back
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica