• Najbolji izbor za kompaniju!
    Najbolji izbor za kompaniju!

    Ubrzajte i olakšajte komunikaciju sa uređajima oko sebe.

  • Odaberite najbolju opciju za sebe!
    Odaberite najbolju opciju za sebe!

    Unapredite pozivne centre do neviđenog nivoa.

  • Let's get work together.
    Hajde da radimo zajedno!

    Glasom upravljajte omiljenim aplikacijama.

  • Najbolji izbor za kompaniju!
    Najbolji izbor za kompaniju!

    Obavljajte poslove i kada vam to oči i ruke ne dozvoljavaju.

  • Let's get work together.
    Hajde da radimo zajedno!

    Budućnost je počela i kod nas. Budite deo nje.

Glavni ciljevi i aktivnost

  • Razvoj visoko kvalitetnog fleksibilnog  sintetizatora govora na osnovu teksta (TTS)
  • Razvoj automatskog prepoznavanja govora (ASR) na velikim rečnicima
  • Istraživanje i razvoj prepoznavanja emocija u govoru
  • Razvoj sistema za konverziju govora
  • Primene razvijenih govornih tehnologija u zemljama zapadnog Balkana:
    • u multimodalnim sistemima za dijalog čovek-mašina (interaktivni govorni sistemi, pametni telefoni, pametne kuće,...)
    • u aplikacijama kao što su: čitanje teksta, diktiranje teksta, transkripcija govora
    • kao asistivne tehnologije: pomagala za osobe sa oštećenjem vida, govora ili sluha.

Najvažniji inovativni rezultati

AlfaNum je razvio ASR za male i srednje rečnike (AlfaNumASR), kao i veoma kvalitetan TTS za srpski, hrvatski, crnogorski i makedonski jezik (AlfaNumTTS).


Vredni govorni i jezički resursi za srpski i srodne južnoslovenske jezike su kreirani u okviru nekoliko projekata u poslednjoj deceniji. Pored tih resursa, određeni ekspertski sistemi i sistemi za mašinsko učenje, kao i odgovarajući matematički modeli, razvijeni su i primenjeni u prvim proizvodima na bazi govornih tehnologija u Srbiji, Hrvatskoj, Bosni i Hercegovini, Crnoj Gori i Makedoniji - to su države u kojima se dominantno govore srodni južnoslovenski jezici. Na primer, mnogi web sajtovi pomoću AlfaNum TTS sintetizatora govora na osnovu teksta omogućuju posetiocima da preko računara ili pametnog telefona preslušavaju napisane vesti (nekoliko javnih medijskih servisa RTS, RTV), eUprava RS, Vlada RS, PIO Fond RS, Ministarstvo za finansije RS i td. AlfaNumov TTS sintetizator koristi i Rea digitalni asistent Raiffeisen banke a.d. Beograd kao i prvi glasovni asistent na srpskom jeziku grčke kompanije MLS Innovation Inc. Na stotine licenci TTS-a podižu funkcionalnost u mnogim kontakt centrima od kojih je najveći u Talekomu a.d.


Više od deset godina slepi i slabovidi korisnici računara mogu da čuju bilo koji tekst prikazan na ekranu pomoću softvera anReader, zasnovanog na AlfaNumTTS-u, a sada im je dostupna i aplikacija koja koristi TTS na Android OS.


AlfaNumASR i AlfaNumTTS komponente omogućile su korišćenje osnovnih funkcionalnosti sintetizovanja (generisanja) govora i prepoznavanja (razumevanja) govora na srpskom. Veoma važan je i projekat koji je obuhvatio razvoj sistema za automatsko prepoznavanje govora ASR za diktiranje medicinskih nalaza za potrebe PIO Fonda, u cilju unapređenja rada lekara veštaka koji je završen 2020. godine.


Dalji razvoj prepoznavanja kontinualnog govora iz velikih rečnika, kao i naprednijeg i fleksibilnijeg sintetizatora govora, bazira se na pomenutim govornim i jezičkim resursima. Unapređene govorne tehnologije omogućiće znatno širu primenu kao i očuvanje srpskog i srodnih jezika u novom domenu govorne komunikacije – između čoveka i mašina.

Citaj mi

 Radio antena usmerena ka nebu

U svetu u kome je marketing jedan od najvažnijih elemenata plasmana nekog proizvoda i u kome postoji mnoštvo elektronskih medija na kojima je moguće reklamirati svoj proizvod, rađa se realan problem praćenja toka sopstvene reklamne kampanje. Klijent koji je platio emitovanje određenog zvučnog zapisa na nekom elektronskom mediju, do sada nije imao pouzdan i jeftin način da proveri da li je taj zvučni zapis zaista emitovan plaćeni broj puta i u dogovorenim terminima. Razume se da je ručno (ljudsko) praćenje emitovanog zvučnog zapisa praktično nemoguće, pogotovo ako se on emituje na više medija, tako da klijentu ostaje da veruje medijskom partneru da je njegov zvučni zapis emitovao saglasno ugovoru o oglašavanju. Mediji, i pored sve opreme kojom raspolažu, ipak često ne ispune dogovorenu obavezu, zbog tehničkih grešaka u emitovanju ili iz drugih razloga. Bez obzira da li je to namera ili slučajna greška, klijent biva oštećen.

Klijentima koji žele informacije o emitovanju njihovih zvučnih zapisa šalju se izveštaji bazirani na dobijenim informacijama iz prepoznavača.

Ovde se jasno ogleda mogućnost primene kod agencija kojima je od značaja nadzor emitovanih muzičkih programa, kao što su udruženja autora, koje svakako zanima kada i gde je emitovan njihov spot ili numera u cilju nadoknade autorskih prava.

 

 

Govor

Govor predstavlja osnovni način komunikacije među ljudima.

Govorom čovek prenosi svoje misli i osećanja drugim ljudima na daleko složeniji način nego što to čini ijedna druga životinjska vrsta pa je zato i njegov vokalni aparat najsloženiji...

Pročitajte više

ASR

Automatic Speech Recognition

Automatsko prepoznavanje govora (ASR) spada u najveće tehničke izazove savremenog doba i već više od pola veka zaokuplja pažnju istraživača širom sveta...

Pročitajte više

TTS

Text-to-Speech Synthesis

Sinteza govora na osnovu teksta (TTS) je najstarija govorna tehnologija, i njeni počeci sežu još u 18. vek, kada su se pojavile prve "mašine koje govore"...

Pročitajte više

TTS Demonstracija

TTS demonstracija

ASR Demonstracija

ASR demonstracija


AlfaNum d.o.o.

Bulevar Vojvode Stepe 40 / 7

21000 Novi Sad

Tel: +381 21 475 0204