Citaj mi

 

Axon Voice Assistant je aplikacija koja omogućuje izdavanje glasovnih komandi pametnom telefonu: pozivanje po imenu kontakta ili po broju telefona, slanje poruka, iniciranje navigacije, itd.



Osnovne funkcionalnosti aplikacije su:

  • Pozivanje glasom (po imenu kontakta ili navođenjem telefonskog broja)
  • Upravljanje adresarom, kontaktima i evidencijom poziva
  • Upravljanje SMS porukama
  • Diktiranje SMS poruka, uz aktivnu Internet konekciju
  • Pozivanje i iniciranje slanja poruka preko aplikacija Viber i WhatsApp
  • Efikasna navigacija do bilo koje glasom odabrane lokacije, preko aplikacija Google Maps ili Here WeGo

Dodatne mogućnosti aplikacije:

  • Mogućnost da se sve akcije sprovedu i dodirom, bez upotrebe glasa, na način na koji je korisnik navikao
  • Brzo pokretanje aplikacije drmanjem telefona ("shake")
  • Rad bez Internet konekcije (osim pri prvom pokretanju i diktiranju poruka)
  • Filtriranje kontakata, poruka i evidencije poziva po imenu ili delu imena, poruka po sadržaju, i evidencije poziva prema tipu poziva
  • Aplikacija je posebno prilagođena radu na srpskom jeziku, tako da je moguće koristiti imena u odgovarajućim oblicima ("Pozovi Lučića" umesto "Pozovi Lučić"). Aplikacija podržava ćirilicu i latinicu, kao i imena napisana bez korišćenja slova poput "č" i "ć" (može se reći "Lučić" iako je u imeniku "Lucic")
  • Automatska konverzija pisma prilikom slanja SMS poruka
  • Može se odabrati da Axon Voice Assistant bude standardna aplikacija za prijem i slanje poruka

Beta verziju aplikacije (1.3.14) možete preuzeti sa sledećeg linka: Axon - Voice Assistant


Kako radi

Dijalog menadžer

Ovaj modul je odgovoran za čitavo ponašanje sistema. On koristi izlaz prepoznavača govora kao svoj ulaz i preduzima odgovarajuću akciju.

Definiše se skup zadataka, sa jasnim specifikacijama koje su informacije potrebne za njihovo izvršavanje. Neki od primera ovih zadataka su: pozivanje kontakta, slanje SMS poruke kontaktu, i slično.

Ukoliko sistem ne uspe da prepozna govornu komandu, korisniku se prikazuje odgovarajuća poruka. Ukoliko korisnik ne saopšti sve potrebne informacije, sistem postavlja dodatna pitanja.

Razumevanje prirodnog govora

Ovaj modul konvertuje korisničke upite u formu pogodnu za dijalog menadžer. Na primer: ukoliko je korisnički upit prepoznat kao "Pošalji poruku Vesni Petrović" dijalog menadžer će primiti: "command: SEND_SMS; contact: Vesna Petrović".

Generisanje prirodnog jezika

Funkcija ovog modula je obrnuta funkciji razumevanja prirodnog govora. Konkretno, ovaj modul konvertuje informaciju poslatu u obliku koji je pogodan dijalog menadžeru u rečenice prirodnog govora.

Implementacija govornih tehnologija na mobilnim platformama

Sve do nedavno prepoznavanje govora je bilo ograničeno na male rečnike i PC platformu. Rečnik koji ova aplikacija koristi je znatno veći i softver je optimizovan da se prilagodi ograničenim resursima mobilnih uređaja.

Što se tiče sinteze govora, naša prethodna rešenja su visoko kvalitetna ali ograničena na PC tehnologiju. Sada smo razvili manje zahtevnu verziju kompatibilnu sa operativnim sistemima pametnih telefona. Ovo je moguće uz nešto degradacije u kvalitetu sinteze koja je potpuno prihvatljiva sa stanovišta ciljnih aplikacija.

Tačnost prepoznavanja govora

Poznato je da mnogi prepoznavači renomiranih proizvođača funkcionišu sa nedovoljnom tačnošću, čak i za veće jezike, što dovodi do frustracije i nezadovoljstva korisnika.

U želji da se poveća tačnost prepoznavanja, rečnik koji se koristi za prepoznavanje je specijalno prilagođen trenutnoj aktivnosti. Na primer, korisnik ne može otvoriti određeni kontakt i sa tog mesta tražiti da se pozove neka druga osoba. Ovaj restriktivniji pristup podrazumeva određeni (mada vrlo kratak) period prilagođavanja, ali zato obezbeđuje znatno pouzdaniji rad.

 

TTS Demonstracija

TTS demonstracija

ASR Demonstracija

ASR demonstracija


AlfaNum d.o.o.

Bulevar Vojvode Stepe 40 / 7

21000 Novi Sad

Tel: +381 21 475 0204