Integracija u postojeće aplikacije

AlfaNum ASR i TTS, kao osnovne komponente za prepoznavanje i sintezu govora, namenjene su prevashodno programerskim kućama i sistem integratorima. S obzirom na to da ove kuće već imaju svoja gotova rešenja i sisteme u funkciji, ASR i TTS mogu pružiti dodatnu funkcionalnost ili atraktivnost samog servisa. Govorne tehnologije takođe otvaraju vrata razvoju sasvim novih aplikacija i servisa, koje do sada nisu ni bile moguće primenom konvencionalnih metoda komunikacije sa korisnikom.

Unapređenje pozivnih centara i govornih automata

ASR i TTS unapređuju rad call centara i govornih automata tako što omogućuju prepoznavanje cifara (PIN-ova), iznosa, datuma, imena gradova, itd. Kreiranje promptova pomoću sinteze govora umesto snimanjem spikera čini sistem jeftinijim i fleksibilnijim. Personalizovano obraćanje korisnicima (po imenu, nazivu firme) daje dodatni kvalitet servisu, koji do sada nije bilo moguće ostvariti. Takođe je moguće čitanje drugih sadržaja koji postoje u bazi u tekstualnom formatu.

Pozivanje lokala glasom

Upućivanje poziva nikada nije bilo jednostavnije. Sada svaka organizacija bez obzira na veličinu može imati svog privatnog telefonskog operatera. Pamćenje desetina različitih telefona i lutanje kroz menije postaje stvar prošlosti. Potrebno je samo podići slušalicu, okrenuti jedan broj i reći ime kontakta.
Sistem se povezuje sa postojećom telefonskom centralom i definiše se lokal (npr. 99). Korisnik samo treba da pozove lokal i kaže ime i prezime ili naziv odseka. Sistem zatim vrši transfer na odgovarajući lokal ili upućuje poziv napolje. Svaki zaposleni može sam definisati svoj personalizovani imenik putem jednostavnog web interfejsa. Ovu funkcionalnost mogu da koriste i zaposleni i pozivaoci spolja.

Informacije o redu vožnje

Koristeći govorni automat sa ugrađenim komponentama za prepoznavanje govora moguće je na veoma lak način dobiti sve informacije o redu vožnje. Potrebno je izgovoriti naziv linije i dan, nakon čega automat sintetizovanim govorom saopštava tražene podatke. Ovakav sistem može se primeniti na autobuskim i železničkim stanicama, aerodromima...

TV program

U kolima, autobusu, na plaži, u planini... Da biste saznali šta ima na TV-u nebitno je gde se nalazite.
Efikasno rešenje je da pozivalac na jednom mestu dobije sve informacije o sadržaju kanala, kao i pojedinim emisijama, pri čemu su moguće različite vrste pretraga. Moguće je, naravno, i da svaka stanica ima sopstveni govorni automat.

Bele i žute strane / telefonoteka

Potrebno je da pozivalac izgovori podatak koji ga zanima (npr. Petar Petrović, Novi Sad), a sistem mu na osnovu uvida u bazu podataka pročita tražene podatke sintetizovanim glasom. Moguće je pretraživati po imenu osobe, ulice, grada, firme, delatnosti, ključnim rečima...

Sportski rezultati

Mnogi kladioničari žele da u svakom momentu znaju rezultate, kvote, termine... Danas svako uz sebe nosi mobilni telefon. Jednostavnim pozivanjem određenog broja sve ove informacije je moguće saznati u bilo koje doba dana i noći, kroz efikasnu i intuitivnu govornu komunikaciju sa automatom.

Zabavni servisi

Korišćenjem ASR-a i TTS-a moguće je dati novi kvalitet mnogim postojećim servisima ovog tipa, kao i osmisliti nove kao što su: telefonsko glasanje, igre na sreću, servisi za upoznavanje, čitanje horoskopa...
Pozivalac više ne mora da pamti broj koji treba uneti preko tastature, već samo izgovori pojam (npr. škorpija) koji sistem prepozna, a zatim sintetizovani glas pročita aktuelnu informaciju iz baze.
Ovo omogućuje pružaocima servisa da ne moraju nakon svake promene ponovo da unajmljuju profesionalnog spikera.

Zakazivanje pregleda

Korisnik se identifikuje preko broja osiguranja, a u kasnijoj fazi može i preko broja telefona (uz dodatnu verifikaciju: "Da li je to gospodin Petar Petrović?") Zatim saopštava ime doktora kod kojeg želi pregled, ili naziv odeljenja (hirurgija, ortopedija...), kada mu se nudi lista doktora koji rade na tom odseku. Korisniku se nudi i nekoliko termina za pregled, od kojih on odabira jedan.

Ozvučavanje sajtova

U svetu globalnog umrežavanja i mnoštva informacija više nije dovoljno biti jedan od mnogih i imati isto što i ostali. Ozvučavanje sajtova nudi novinu koja vas može odvojiti od drugih. Koristeći tehnologiju za sintezu govora moguće je tekst koji se nalazi na nekoj web strani pretvoriti u govor. Na ovaj način ozvučen sajt pruža posetiocima novu dimenziju surfovanja. Opcija je naročito korisna za slepe, ali i za mnoge druge posetioce sajta.

Titlovanje tv emisija

Koristeći AlfaNum-ov prepoznavač govora moguće je titlovati emisije na srpskom jeziku. Trenutno se ova tehnologija može primenjivati kad uz emitovani materijal postoji prateći tekst. Sistem upoređuje sadržaj tekstualnog fajla sa onim što je izgovoreno i vrši on-line sinhronizaciju. Sinhronizovani tekst se preko teleteksta prikazuje gledaocima koji to žele. Korisnici mogu biti nagluve i starije osobe, ali i drugi korisnici kojima to rešenje iz nekog razloga odgovara.

Imate ideju?

Govorne tehnologije su takve da skoro da ne postoji oblast ljudskog delovanja gde nisu primenljive. Na strani projekta AlfaNum možete pogledati mnoge primere, a možete i sami da nam predložite ideju.

 

Audiomemo registrofon sistem može povećati sigurnost i efikasnost poslovanja, a svoju primenu je našao u:

AlfaNum preporučuje Audiomemo registrofon, sistem za snimanje telefonskih razgovora, kompanijama koje žele da svedu na najmanju meru rizik od mogućih neprijatnosti koje postoje kada nema čvrstog dokaza o vođenom telefonskom razgovoru. Tu se pre svega misli na rizike povezane sa lažnim pozivima, poslovnim transakcijama zasnovanim na glasovnoj komunikaciji, kao i pritužbama korisnika.

Snimanje telefonskih razgovora daje mogućnost kontrole u svakodnevnom poslovanju, jer se praćenjem komunikacije sa korisnicima može oceniti kvalitet usluge koju kompanije pružaju klijentima i izbeći problemi koji su nekada izazvani prenošenjem netačnih informacija. Na taj način značajno se poboljšava profitabilnost kompanije. Mogućnosti snimanja telefonskih razgovora mogu biti u rasponu od svega par lokala, pa do kompletne kompanijske mreže sa stotinama telefona, radio stanica, mikrofona.

 

Pozivni centri

Pozivni centri predstavljaju efikasan način komunikacije za sva preduzeća koja žele potpun multimedijalni kontakt sa klijentima. Prednosti pozivnih centara koji koriste Audiomemo registrofon sistem su višestruke. Obezbeđena je kontrola kvaliteta realizovanih razgovora, u cilju poboljšanja rada agenata. Nadzor uživo je funkcionalnost pri kojoj supervizori imaju mogućnost nadgledanja poziva, koristeći sigurnosne dozvole na više nivoa pristupa. Mogućnost snimanja na više lokacija, pri čemu se svi snimci čuvaju u jedinstvenoj centralizovanoj bazi podataka čini ovaj sistem pouzdanim. Pristup sa udaljenih lokacija centralnoj bazi snimljenog materijala omogućava lakšu pretragu. U raznim analizama postoji mogućnost kreiranja i čuvanja izveštaja u zavisnosti od potreba korisnika. Obuka korisnika za rad sa sistemom je jednostavna i može se održati u kratkom vremenskom periodu.

Pozivni centri su našli svoju primenu u telemarketingu, u kompanijama koje pružaju tehničku podršku korisnicima njihovih proizvoda i usluga, informativnim i zabavnim servisima, bankama i osiguravajućim društvima, državnim službama kao što je Nacionalna služba za zapošljavanje građana, uprava prihoda i MUP.

Finansijske institucije

Finansijske institucije koriste audiomemo registrofon sistem u cilju poboljšanja kvaliteta usluga koje nude svojim klijentima. Među njima su najzastupljenije banke i osiguravajuća društva, brokerske kuće, berze.

Specifične prednosti koje ovim institucijama pruža naš sistem su nadgledanje uživo, pri čemu supervizori imaju mogućnost praćenja poziva, koristeći sigurnosne dozvole na više nivoa pristupa. Sačuvani snimci razgovora omogućavaju lakše rešavanje eventualnih sudskih sporova kao i verifikaciju snimanja razgovora od strane nezavisnih revizora.

Vladine institucije

Bezbednost poslovanja Vladinih organizacija je razlog zbog čega Audiomemo registrofon sistem dobija značajnu primenu u njihovom radu. Usled pojačane regulative, Vladine agencije su u obavezi da imaju pouzdan sistem za beleženje telefonskih razgovora u skladu sa važećim zakonskim propisima. On omogućava lak pristup svim zabeleženim razgovorima, čija pretraga je moguća po zadatim parametrima, a jedna od važnih osobina sistema je puna redundantnost ostvarena putem RAID tehnologije. Daljinski pristup zabeleženim razgovorima je funkcionalnost koja se često koristi. Sistem zvučnih i vizuelnih alarma obezbeđuje kontinuitet u radu.

Vladine organizacije koje koriste Audiomemo registrofon sistem su državne ustanove, policija i vojska.

Hitne službe

Audiomemo registrofon sistem našao je svoju primenu u sektoru javne zaštite u kome je pouzdanost neophodna. Kao veoma stabilan sistem, on ne zahteva posebno održavanje i omogućuje kontinuirano snimanje. Otpornost na greške u radu i visoka pouzdanost obezbeđuju neprekidnu komunikaciju građana i službi. Lak i brz pristup svim zabeleženim pozivima je i u ovim službama veoma važan. Sistem takođe pomaže i dispečeru da ostvari bolju efikasnost. Pored već pomenutih osobina sistema ovde ističemo mogućnost integracije sa postojećim bazama podataka.

Sektor javne zaštite čine urgentni centri i domovi zdravlja, vatrogasne službe, agencije za bezbednost.

Ostale primene

Pored gore nabrojanih oblasti primena, Audiomemo registrofon sistem se kao sveobuhvatno rešenje za snimanje razgovora, tipa „ključ u ruke“ koristi i u  preduzećima koja pripadaju različitim privrednim delatnostima. To mogu biti kako proizvodne tako i neproizvodne delatnosti.

 

 

Pojava govornih tehnologija je od posebnog značaja za većinu osoba sa invaliditetom (OSI):

  • slepim i slabovidim osobama računar čita knjige, novine sa Interneta, e-mail i SMS poruke,
  • računar naglas čita ono što nema osoba napiše,
  • osoba koja ne može da koristi ruke govornim komandama upravlja uređajima u okruženju,
  • automatski prepoznat govor se lako prevodi u tekst i postaje dostupan osobama koje ne čuju.
Govorne tehnologije omogućuju osobama sa invaliditetom da u izvesnoj meri prevaziđu svoj hendikep, osamostale se i osposobe za mnoge nove poslove koje pre toga nisu mogle da rade. Prve primene na srpskom govornom području usmerene su na slepe i slabovide osobe i za njih je razvijeno više pomagala.

 

AnReader

Sistem za sintezu govora prevashodno namenjen slepim i slabovidim osobama.

Audio-biblioteka

Klijent-server sistem koji slepim osobama obezbeđuje pristup velikoj bazi knjiga preko lokalne mreže ili Interneta.

Ozvučavanje sajtova

U svetu globalnog umrežavanja i mnoštva informacija više nije dovoljno biti jedan od mnogih i imati isto što i ostali.

 

 

Govorne tehnologije imaju potencijal da iz korena promene način komunikacije čoveka sa okruženjem. Kada se čoveku omogući da računaru zadaje govorne komande i ako računar može usmeno da mu odgovori, onda on može da razgovara i sa uređajima u domaćinstvu, industriji, kolima, da priča sa robotima i igračkama, ili sa udaljenim  računarom preko telefona, koji mu pronalazi i usmeno saopštava tražene informacije.

ASR i TTS predstavljaju veoma složene multidisciplinarne probleme, za čije rešavanje nisu dovoljna samo odgovarajuća tehnička znanja, već je neophodno i poznavanje oblasti kao što su fonetika, lingvistika, psihoakustika i percepcija govora. Treba objediniti sva ova znanja i implementirati ih u raspoložive resurse računara da bi on mogao da razume čovekove govorne komande i da bi mogao usmeno da saopšti odgovor.

 

AlfaNum ASR

Sistem za prepoznavanje kontinualnog govora na praktično bilo kom južnoslovenskom jeziku baziran na prepoznavanju fonema.

AlfaNum TTS

Sistem za sintezu govora na osnovu teksta sa ugrađenim elementima prirodne intonacije.

 Advertising monitor

Advertising Monitor je sistem namenjen automatskom praćenju reklamnog i muzičkog sadržaja na radio i TV stanicama.

Traženi zvučni zapisi se u primljenom zvučnom signalu, sa određenih stanica, prepoznaju i u bazu se beleži tačan trenutak njihovog emitovanja. Ukoliko korisnik želi informacije o emitovanju traženog sadržaja, može dobiti izveštaj sastavljen na osnovu informacija dobijenih od sistema za prepoznavanje.

Sistem se sastoji iz određenog broja FM i TV tjunera koji primaju različite radio i TV stanice preko montiranih antena. Sa svakog od ovih tjunera vodi se audio-signal (ne i video) u specijalnu zvučnu karticu koja može da snima više kanala istovremeno. Tu se vrši on-line kompresija i snimci se arhiviraju na lokalnim hard diskovima. Vreme arhiviranja, u zavisnosti od broja kanala i veličine diskova, može biti i do nekoliko meseci unazad. Ukoliko se program emituje preko Interneta, snimci se kreiraju odgovarajućim softverom, ili se arhive mogu preuzeti direktno od klijenta sa njihovih servera.

U tako arhiviranim snimcima se vrši pretraga za odgovarajućim skupom traženih zvučnih zapisa koje je administrator sistema definisao importovanjem .wav fajla i označio za praćenje na odgovarajućem kanalu. Pretragu vrše nezavisni procesi koji su aktivirani na svim računarima u sistemu (kojih može biti proizvoljno mnogo) i rezultate upisuju u zajedničku bazu podataka. Ova baza kasnije služi za formiranje izveštaja prema klijentu.

Osim praćenja reklamnog i muzičkog sadržaja, Advertising Monitor može imati i druge primene.

 


Softverski paket se sastoji od:

  • Aplikacije za snimanje audio-materijala
  • Aplikacije za automatsko prepoznavanje zadatih audio-zapisa u snimljenom materijalu i
  • Aplikacije za praćenje i administraciju celog sistema.

Osobine sistema su:

  • Višekanalno snimanje i komprimovanje audio-materijala u realnom vremenu,
  • Automatizovano prepoznavanje reklama, džinglova, muzičkih numera...
  • Mogućnost retroaktivnog praćenja
  • Neograničena proširivost sistema za ubrzanje rada i proširivanje kapaciteta,
  • Automatsko brisanje najstarijih snimaka i oslobađanje prostora za nove
  • Brza pretraga po vremenu i datumu beleženja audio-materijala, stanici i audio-materijalu
  • Vizuelni prikaz snimljenog materijala
  • Mogućnost korišćenja u kombinaciji sa Word Spotter-om



AdMonitor

TTS Demonstracija

TTS demonstracija

ASR Demonstracija

ASR demonstracija


AlfaNum d.o.o.

Bulevar Vojvode Stepe 40 / 7

21000 Novi Sad

Tel: +381 21 475 0204