• Najbolji izbor za kompaniju!
    Najbolji izbor za kompaniju!

    Ubrzajte i olakšajte komunikaciju sa uređajima oko sebe.

  • Odaberite najbolju opciju za sebe!
    Odaberite najbolju opciju za sebe!

    Unapredite pozivne centre do neviđenog nivoa.

  • Let's get work together.
    Hajde da radimo zajedno!

    Glasom upravljajte omiljenim aplikacijama.

  • Najbolji izbor za kompaniju!
    Najbolji izbor za kompaniju!

    Obavljajte poslove i kada vam to oči i ruke ne dozvoljavaju.

  • Let's get work together.
    Hajde da radimo zajedno!

    Budućnost je počela i kod nas. Budite deo nje.

Glavni ciljevi i aktivnost

  • Razvoj visoko kvalitetnog fleksibilnog  sintetizatora govora na osnovu teksta (TTS)
  • Razvoj automatskog prepoznavanja govora (ASR) na velikim rečnicima
  • Istraživanje i razvoj prepoznavanja emocija u govoru
  • Razvoj sistema za konverziju govora
  • Primene razvijenih govornih tehnologija u zemljama zapadnog Balkana:
    • u multimodalnim sistemima za dijalog čovek-mašina (interaktivni govorni sistemi, pametni telefoni, pametne kuće,...)
    • u aplikacijama kao što su: čitanje teksta, diktiranje teksta, transkripcija govora
    • kao asistivne tehnologije: pomagala za osobe sa oštećenjem vida, govora ili sluha.

Najvažniji inovativni rezultati

AlfaNum je razvio ASR za male i srednje rečnike (AlfaNumASR), kao i veoma kvalitetan TTS za srpski, hrvatski, crnogorski i makedonski jezik (AlfaNumTTS).


Vredni govorni i jezički resursi za srpski i srodne južnoslovenske jezike su kreirani u okviru nekoliko projekata u poslednjoj deceniji. Pored tih resursa, određeni ekspertski sistemi i sistemi za mašinsko učenje, kao i odgovarajući matematički modeli, razvijeni su i primenjeni u prvim proizvodima na bazi govornih tehnologija u Srbiji, Hrvatskoj, Bosni i Hercegovini, Crnoj Gori i Makedoniji - to su države u kojima se dominantno govore srodni južnoslovenski jezici. Na primer, mnogi web sajtovi pomoću AlfaNum TTS sintetizatora govora na osnovu teksta omogućuju posetiocima da preko računara ili pametnog telefona preslušavaju napisane vesti (nekoliko javnih medijskih servisa RTS, RTV), eUprava RS, Vlada RS, PIO Fond RS, Ministarstvo za finansije RS i td. AlfaNumov TTS sintetizator koristi i Rea digitalni asistent Raiffeisen banke a.d. Beograd kao i prvi glasovni asistent na srpskom jeziku grčke kompanije MLS Innovation Inc. Na stotine licenci TTS-a podižu funkcionalnost u mnogim kontakt centrima od kojih je najveći u Talekomu a.d.


Više od deset godina slepi i slabovidi korisnici računara mogu da čuju bilo koji tekst prikazan na ekranu pomoću softvera anReader, zasnovanog na AlfaNumTTS-u, a sada im je dostupna i aplikacija koja koristi TTS na Android OS.


AlfaNumASR i AlfaNumTTS komponente omogućile su korišćenje osnovnih funkcionalnosti sintetizovanja (generisanja) govora i prepoznavanja (razumevanja) govora na srpskom. Veoma važan je i projekat koji je obuhvatio razvoj sistema za automatsko prepoznavanje govora ASR za diktiranje medicinskih nalaza za potrebe PIO Fonda, u cilju unapređenja rada lekara veštaka koji je završen 2020. godine.


Dalji razvoj prepoznavanja kontinualnog govora iz velikih rečnika, kao i naprednijeg i fleksibilnijeg sintetizatora govora, bazira se na pomenutim govornim i jezičkim resursima. Unapređene govorne tehnologije omogućiće znatno širu primenu kao i očuvanje srpskog i srodnih jezika u novom domenu govorne komunikacije – između čoveka i mašina.

Citaj mi

 Advertising monitor

Advertising Monitor je sistem namenjen automatskom praćenju reklamnog i muzičkog sadržaja na radio i TV stanicama.

Traženi zvučni zapisi se u primljenom zvučnom signalu, sa određenih stanica, prepoznaju i u bazu se beleži tačan trenutak njihovog emitovanja. Ukoliko korisnik želi informacije o emitovanju traženog sadržaja, može dobiti izveštaj sastavljen na osnovu informacija dobijenih od sistema za prepoznavanje.

Sistem se sastoji iz određenog broja FM i TV tjunera koji primaju različite radio i TV stanice preko montiranih antena. Sa svakog od ovih tjunera vodi se audio-signal (ne i video) u specijalnu zvučnu karticu koja može da snima više kanala istovremeno. Tu se vrši on-line kompresija i snimci se arhiviraju na lokalnim hard diskovima. Vreme arhiviranja, u zavisnosti od broja kanala i veličine diskova, može biti i do nekoliko meseci unazad. Ukoliko se program emituje preko Interneta, snimci se kreiraju odgovarajućim softverom, ili se arhive mogu preuzeti direktno od klijenta sa njihovih servera.

U tako arhiviranim snimcima se vrši pretraga za odgovarajućim skupom traženih zvučnih zapisa koje je administrator sistema definisao importovanjem .wav fajla i označio za praćenje na odgovarajućem kanalu. Pretragu vrše nezavisni procesi koji su aktivirani na svim računarima u sistemu (kojih može biti proizvoljno mnogo) i rezultate upisuju u zajedničku bazu podataka. Ova baza kasnije služi za formiranje izveštaja prema klijentu.

Osim praćenja reklamnog i muzičkog sadržaja, Advertising Monitor može imati i druge primene.

 


Softverski paket se sastoji od:

  • Aplikacije za snimanje audio-materijala
  • Aplikacije za automatsko prepoznavanje zadatih audio-zapisa u snimljenom materijalu i
  • Aplikacije za praćenje i administraciju celog sistema.

Osobine sistema su:

  • Višekanalno snimanje i komprimovanje audio-materijala u realnom vremenu,
  • Automatizovano prepoznavanje reklama, džinglova, muzičkih numera...
  • Mogućnost retroaktivnog praćenja
  • Neograničena proširivost sistema za ubrzanje rada i proširivanje kapaciteta,
  • Automatsko brisanje najstarijih snimaka i oslobađanje prostora za nove
  • Brza pretraga po vremenu i datumu beleženja audio-materijala, stanici i audio-materijalu
  • Vizuelni prikaz snimljenog materijala
  • Mogućnost korišćenja u kombinaciji sa Word Spotter-om



AdMonitor

Govor

Govor predstavlja osnovni način komunikacije među ljudima.

Govorom čovek prenosi svoje misli i osećanja drugim ljudima na daleko složeniji način nego što to čini ijedna druga životinjska vrsta pa je zato i njegov vokalni aparat najsloženiji...

Pročitajte više

ASR

Automatic Speech Recognition

Automatsko prepoznavanje govora (ASR) spada u najveće tehničke izazove savremenog doba i već više od pola veka zaokuplja pažnju istraživača širom sveta...

Pročitajte više

TTS

Text-to-Speech Synthesis

Sinteza govora na osnovu teksta (TTS) je najstarija govorna tehnologija, i njeni počeci sežu još u 18. vek, kada su se pojavile prve "mašine koje govore"...

Pročitajte više

TTS Demonstracija

TTS demonstracija

ASR Demonstracija

ASR demonstracija


AlfaNum d.o.o.

Krajiška 41, 21132 Petrovaradin

Prodaja: +381 64 0550184
Podrška TTS: +381 66 8095758
Podrška ASR: +381 66 8096324
Administracija: +381 66 8094467