• Najbolji izbor za kompaniju!
  Najbolji izbor za kompaniju!

  Ubrzajte i olakšajte komunikaciju sa uređajima oko sebe.

 • Odaberite najbolju opciju za sebe!
  Odaberite najbolju opciju za sebe!

  Unapredite pozivne centre do neviđenog nivoa.

 • Let's get work together.
  Hajde da radimo zajedno!

  Glasom upravljajte omiljenim aplikacijama.

 • Najbolji izbor za kompaniju!
  Najbolji izbor za kompaniju!

  Obavljajte poslove i kada vam to oči i ruke ne dozvoljavaju.

 • Let's get work together.
  Hajde da radimo zajedno!

  Budućnost je počela i kod nas. Budite deo nje.

Glavni ciljevi i aktivnost

 • Razvoj visoko kvalitetnog fleksibilnog  sintetizatora govora na osnovu teksta (TTS)
 • Razvoj automatskog prepoznavanja govora (ASR) na velikim rečnicima
 • Istraživanje i razvoj prepoznavanja emocija u govoru
 • Razvoj sistema za konverziju govora
 • Primene razvijenih govornih tehnologija u zemljama zapadnog Balkana:
  • u multimodalnim sistemima za dijalog čovek-mašina (interaktivni govorni sistemi, pametni telefoni, pametne kuće,...)
  • u aplikacijama kao što su: čitanje teksta, diktiranje teksta, transkripcija govora
  • kao asistivne tehnologije: pomagala za osobe sa oštećenjem vida, govora ili sluha.

Najvažniji inovativni rezultati

AlfaNum je razvio ASR za male i srednje rečnike (AlfaNumASR), kao i veoma kvalitetan TTS za srpski, hrvatski, crnogorski i makedonski jezik (AlfaNumTTS).


Vredni govorni i jezički resursi za srpski i srodne južnoslovenske jezike su kreirani u okviru nekoliko projekata u poslednjoj deceniji. Pored tih resursa, određeni ekspertski sistemi i sistemi za mašinsko učenje, kao i odgovarajući matematički modeli, razvijeni su i primenjeni u prvim proizvodima na bazi govornih tehnologija u Srbiji, Hrvatskoj, Bosni i Hercegovini, Crnoj Gori i Makedoniji - to su države u kojima se dominantno govore srodni južnoslovenski jezici. Na primer, mnogi web sajtovi pomoću AlfaNum TTS sintetizatora govora na osnovu teksta omogućuju posetiocima da preko računara ili pametnog telefona preslušavaju napisane vesti (nekoliko javnih medijskih servisa RTS, RTV), eUprava RS, Vlada RS, PIO Fond RS, Ministarstvo za finansije RS i td. AlfaNumov TTS sintetizator koristi i Rea digitalni asistent Raiffeisen banke a.d. Beograd kao i prvi glasovni asistent na srpskom jeziku grčke kompanije MLS Innovation Inc. Na stotine licenci TTS-a podižu funkcionalnost u mnogim kontakt centrima od kojih je najveći u Talekomu a.d.


Više od deset godina slepi i slabovidi korisnici računara mogu da čuju bilo koji tekst prikazan na ekranu pomoću softvera anReader, zasnovanog na AlfaNumTTS-u, a sada im je dostupna i aplikacija koja koristi TTS na Android OS.


AlfaNumASR i AlfaNumTTS komponente omogućile su korišćenje osnovnih funkcionalnosti sintetizovanja (generisanja) govora i prepoznavanja (razumevanja) govora na srpskom. Veoma važan je i projekat koji je obuhvatio razvoj sistema za automatsko prepoznavanje govora ASR za diktiranje medicinskih nalaza za potrebe PIO Fonda, u cilju unapređenja rada lekara veštaka koji je završen 2020. godine.


Dalji razvoj prepoznavanja kontinualnog govora iz velikih rečnika, kao i naprednijeg i fleksibilnijeg sintetizatora govora, bazira se na pomenutim govornim i jezičkim resursima. Unapređene govorne tehnologije omogućiće znatno širu primenu kao i očuvanje srpskog i srodnih jezika u novom domenu govorne komunikacije – između čoveka i mašina.

Citaj mi

Lupa uveličava slova ključne reči

Programski paket Word Spotter namenjen je brzoj i efikasnoj pretrazi velike količine audio-materijala u potrazi za određenim ključnim rečima. Bazira se na tehnologiji prepoznavanja govora (ASR), ali je optimizovan za traženje željenih reči ili fraza, uz zanemarivanje ostalog govora, muzike i sl.

Uz naš proizvod Word Spotter, više nije potrebno "ručno" preslušavanje svih snimaka u potrazi za ključnom reči. Unese se proizvoljna reč ili fraza za pretragu, zatim se importuju zvučni fajlovi i softver će sam pronaći sve pojave tražene reči. Korisniku ostaje samo da prođe kroz listu rezultata i izabere ono što je tražio.

Program poseduje sledeće karakteristike:

 • Traženje proizvoljnog broja reči ili fraza
 • Reči i fraze se traže u svim željenim oblicima, bez potrebe da se oni zasebno unose (na primer, ako je uneseno "stranka", sistem će tražiti i "stranku", "stranci", itd.)
 • Rad sa različitim formatima zvučnih fajlova
 • Mogućnost pretrage neograničenog broja zvučnih fajlova
 • Mogućnost pokretanja više različitih pretraga u paraleli, u offline režimu (korisnik može da radi nešto drugo do završetka pretrage)
 • Preslušavanje i verifikovanje rezultata
 • Sistem radi brzo i pouzdano, podržava moderne multicore i multiprocesorske platforme
 • Podržava distribuciju na više računara i load balancing, što omogućava primenu u veoma zahtevnim okruženjima
 • Softver je moguće nabaviti u više oblika: sa sopstvenim GUI okruženjem, kao API ili biblioteku, integrisan sa nekim od naših proizvoda (Audiomemo registrofon)
 • U toku je integrisanje sa modulom za detekciju nivoa emocija, što će dodatno povećati mogućnosti pretrage i primenljivost softvera

   

Govor

Govor predstavlja osnovni način komunikacije među ljudima.

Govorom čovek prenosi svoje misli i osećanja drugim ljudima na daleko složeniji način nego što to čini ijedna druga životinjska vrsta pa je zato i njegov vokalni aparat najsloženiji...

Pročitajte više

ASR

Automatic Speech Recognition

Automatsko prepoznavanje govora (ASR) spada u najveće tehničke izazove savremenog doba i već više od pola veka zaokuplja pažnju istraživača širom sveta...

Pročitajte više

TTS

Text-to-Speech Synthesis

Sinteza govora na osnovu teksta (TTS) je najstarija govorna tehnologija, i njeni počeci sežu još u 18. vek, kada su se pojavile prve "mašine koje govore"...

Pročitajte više

TTS Demonstracija

TTS demonstracija

ASR Demonstracija

ASR demonstracija


AlfaNum d.o.o.

Bulevar Vojvode Stepe 40 / 7

21000 Novi Sad

Tel: +381 21 475 0204