AlfaNum je inovativno preduzeće koje okuplja tim eksperata koji od 2003. godine nastoji da približi svet savremenih govornih tehnologija širokom krugu korisnika.
U dosadašnjem periodu realizovane su softverske komponente za visoko kvalitetno prepoznavanje i sintezu govora na srpskom, hrvatskom i crnogorskom jeziku. U razvoju ovih govornih tehnologija, koje su inicijalno bile namenjene slepima i slabovidima, AlfaNum je prvi u regionu. Više informacija o našim komponentama možete naći na stranama o proizvodima i uslugama, a kako one rade, možete videti kroz demonstracije.
Pored govornih tehnologija, AlfaNum se bavi razvojem i implementacijom proizvoda za osobe sa invaliditetom (OSI), kao i pozivnih centara, informacionih centara i baza podataka. Ako razmišljate o unapređenju svog sistema korišćenjem savremenih govornih tehnologija ili vam je potrebna neka druga stručna usluga, slobodno nam se obratite. Poverenje koje nam ukažete ispoštovaćemo u potpunosti.
Napredak računarske tehnologije u poslednjih desetak godina omogućio je da i obični PC računari dostignu potrebnu efikasnost za uspešno prepoznavanje i sintezu govora. Pored toga, njihova relativno niska cena učinila je prednosti govornih tehnologija dostupnim sve većem broju korisnika. Specifičnosti južnoslovenskih jezika su velike, te je razvoj govornih tehnologija za svaki od njih vrlo izazovan zadatak. Pored toga, potencijalna tržišta nisu velika, što je dodatni razlog iz kog se nijedna svetska kompanija donedavno nije odlučila da krene u razvoj prepoznavanja i sintezu govora na srpskom i njemu srodnim jezicima. AlfaNum je na vreme prepoznao ovu stratešku prednost, krenuo u sopstveni razvoj i ostvarivanje sledećih osnovnih ciljeva i aktivnosti:
- Razvoj visoko kvalitetnog fleksibilnog sintetizatora govora na osnovu teksta (TTS)
- Razvoj automatskog prepoznavanja govora (ASR) na velikim rečnicima
- Razvoj sistema za konverziju govora
- Razvoj modula za obradu prirodnog jezika uključujući i upravljanje dijalogom
- Primene razvijenih govornih tehnologija u zemljama zapadnog Balkana:
- u multimodalnim sistemima za dijalog čovek-mašina (interaktivni govorni sistemi, pametni telefoni, pametne kuće,...)
- u aplikacijama kao što su: čitanje teksta, diktiranje teksta, transkripcija govora
- kao asistivne tehnologije: pomagala za osobe sa oštećenjem vida, govora ili sluha.
Naučno-istraživačkim radom u okviru AlfaNum tima bavi se grupa nastavnika i saradnika Katedre za telekomunikacije i obradu signala Fakulteta tehničkih nauka u Novom Sadu. Više detalja o tome možete naći na stranama projekta AlfaNum.
Najvažniji inovativni rezultati:
AlfaNum je razvio ASR za male i srednje rečnike (AlfaNumASR), kao i veoma kvalitetan TTS za srpski, hrvatski i crnogorski jezik (AlfaNumTTS).
Vredni govorni i jezički resursi za srpski i srodne južnoslovenske jezike su kreirani u okviru nekoliko projekata u poslednjoj deceniji. Pored tih resursa, određeni ekspertski sistemi i sistemi za mašinsko učenje, kao i odgovarajući matematički modeli, razvijeni su i primenjeni u prvim proizvodima na bazi govornih tehnologija u Srbiji, Hrvatskoj, Bosni i Hercegovini, Crnoj Gori i Severnoj Makedoniji - to su države u kojima se dominantno govore srodni južnoslovenski jezici. Na primer, mnogi web sajtovi pomoću AlfaNum TTS sintetizatora govora na osnovu teksta omogućuju posetiocima da preko računara ili pametnog telefona preslušavaju napisane vesti (nekoliko javnih medijskih servisa RTS, RTV), eUprava RS, Vlada RS, PIO Fond RS, Ministarstvo finansija RS i td. AlfaNumov TTS sintetizator koristi i Rea digitalni asistent Raiffeisen banke a.d. Beograd kao i prvi glasovni asistent na srpskom jeziku grčke kompanije MLS Innovation Inc. Na stotine licenci TTS-a podižu funkcionalnost u mnogim kontakt centrima od kojih je najveći u Talekomu a.d.
Više od deset godina slepi i slabovidi korisnici računara mogu da čuju bilo koji tekst prikazan na ekranu pomoću softvera anReader, zasnovanog na AlfaNumTTS-u, a sada im je dostupna i aplikacija koja koristi TTS na Android OS.
AlfaNumASR i AlfaNumTTS komponente omogućile su korišćenje osnovnih funkcionalnosti sintetizovanja (generisanja) govora i prepoznavanja (razumevanja) govora na srpskom. Veoma važan je i projekat koji je obuhvatio razvoj sistema za automatsko prepoznavanje govora ASR za diktiranje medicinskih nalaza za potrebe PIO Fonda, u cilju unapređenja rada lekara veštaka koji je završen 2020. godine.
Dalji razvoj prepoznavanja kontinualnog govora iz velikih rečnika, kao i naprednijeg i fleksibilnijeg sintetizatora govora, bazira se na pomenutim govornim i jezičkim resursima. Unapređene govorne tehnologije omogućiće znatno širu primenu kao i očuvanje srpskog i srodnih jezika u novom domenu govorne komunikacije – između čoveka i mašina.