Axon - Voice Assistant


Citaj mi

Axon - Voice Assistant (AVA) je aplikacija koja omogućuje izdavanje glasovnih komandi pametnom telefonu: pozivanje po imenu kontakta ili po broju telefona, slanje poruka (čak i Viber, WhatsApp), iniciranje navigacije itd.



Osnovne funkcionalnosti:

  • Pozivanje glasom (po imenu kontakta ili navođenjem telefonskog broja)
  • Upravljanje adresarom i kontaktima
  • Upravljanje evidencijom poziva
  • Upravljanje SMS porukama (ne i diktiranje - ono je moguće preko Google-ovog servisa)
  • Pozivanje i slanje poruka preko aplikacija Viber i WhatsApp
  • Efikasna navigacija do bilo koje glasom odabrane lokacije, preko Google Maps ili Here maps.

Dodatne mogućnosti:

  • Mogućnost da se sve akcije sprovedu i dodirom, bez upotrebe glasa, na način na koji je korisnik navikao
  • Brzo pokretanje aplikacije drmanjem telefona ("shake")
  • Rad bez Internet konekcije (osim pri prvom pokretanju)
  • Filtriranje kontakata, poruka i liste poziva po delu imena, odnosno liste poziva prema tome da li korisnik želi samo odlazne/dolazne/propuštene pozive
  • Aplikacija je posebno prilagođena radu na srpskom jeziku, tako da je moguće koristiti imena u odgovarajućim oblicima ("Pozovi Lučića" umesto "Pozovi Lučić"). Aplikacija podržava ćirilicu i latinicu, kao i imena napisana bez korišćenja slova poput "č" i "ć" (može se reći "Lučić" iako je u imeniku "Lucic")

Kako radi

Dijalog menadžer

Ovaj modul je odgovoran za čitavo ponašanje sistema. On koristi izlaz prepoznavača govora kao svoj ulaz i preduzima odgovarajuću akciju.

Definiše se skup zadataka, sa jasnim specifikacijama koje su informacije potrebne za njihovo izvršavanje. Neki od primera ovih zadataka su: pozivanje kontakta, slanje SMS poruke i slično.

Ukoliko sistem ne uspe da prepozna govornu komandu korisniku se prikazuje odgovarajuća poruka. Ukoliko korisnik ne saopšti sve potrebne informacije, sistem postavlja dodatna pitanja.

Razumevanje prirodnog govora

Ovaj modul konvertuje korisničke upite u formu pogodnu za dijalog menadžer. Na primer: ukoliko je korisnički upit prepoznat kao "Pošalji poruku Vesni Petrović" dijalog menadžer će primiti: "command: SEND_SMS; contact: Vesna Petrović".

Generisanje prirodnog jezika

Funkcija ovog modula je obrnuta funkciji razumevanja prirodnog govora. Konkretno, ovaj modul konvertuje informaciju poslatu u obliku koji je pogodan dijalog menadžeru u rečenice prirodnog govora.

Implementacija govornih tehnologija na mobilnim platformama

Sve do nedavno prepoznavanje govora je bilo ograničeno na male rečnike i PC platformu. Rečnik koji ova aplikacija koristi je znatno veći i softver je optimizovan da se prilagodi ograničenim resursima mobilnih uređaja.

Što se tiče sinteze govora, naša prethodna rešenja su visoko kvalitetna ali ograničena na PC tehnologiju. Sada smo razvili manje zahtevnu verziju kompatibilnu sa operativnim sistemima pametnih telefona. Ovo je moguće uz nešto degradacije u kvalitetu sinteze koja je potpuno prihvatljiva sa stanovišta ciljnih aplikacija.

Tačnost prepoznavanja govora

Poznato je da mnogi prepoznavači renomiranih proizvođača funkcionišu sa nedovoljnom tačnošću, čak i za veće jezike, što dovodi do frustracije i nezadovoljstva korisnika.

U želji da se poveća tačnost prepoznavanja, rečnik koji se koristi za prepoznavanje je specijalno prilagođen trenutnoj aktivnosti. Na primer, korisnik ne može otvoriti određeni kontakt i sa tog mesta tražiti da se pozove neka druga osoba. Ovaj restriktivniji pristup podrazumeva određeni (mada vrlo kratak) period prilagođavanja, ali zato obezbeđuje znatno pouzdaniji rad.