Citaj mi

TRANSCRIPTA je sistem za automatsku transkripciju govora, odnosno, automatsko sastavljanje tekstualnih dokumenata na osnovu govora snimljenog mikrofonom. Može se koristiti za sastavljanje bilo kakvih transkripata – od televizijskih emisija, sastanaka, konferencija do sudskih ročišta.

Mogućnosti

TRANSCRIPTA sistem za transkripciju snimljenog audio materijala:

  • prepoznaje prirodan govor više govornika na neograničenom rečniku sa tačnošću od preko 90% na nivou reči, a preko 95% na nivou karaktera (primera radi, ako je umesto "komunikacija sa korisnicima" prepoznato "komunikacija sa korisnicama", to predstavlja tačnost od 67% na nivou reči ali 96% na nivou karaktera);
  • automatski postavlja znakove interpunkcije u prepoznati tekst (primera radi, rezultat prepoznavanja može biti "Stao je. Čuo je nešto, ali nije bio siguran šta." umesto "stao je čuo je nešto ali nije bio siguran šta");
  • podržava srpski jezik (ekavski i ijekavski izgovor), hrvatski i srodne jezike, kao i engleski, ruski i mnoge druge (poslati upit);
  • namenjena je za rad u offline režimu, odnosno za transkripciju ranije snimljenog audio materijala;
  • u pripremi je i razdvajanje govornika, nakon čega će TRANSCRIPTA biti u mogućnosti da ponudi tekstualni izlaz u kom se tačno zna koji govornik je izgovorio koji niz reči.

Demonstraciju transkripcije govora možete pogledati u sledećem videu:

 

Glavne razlike u odnosu na domenska rešenja za diktiranje (MEDICTA i IURISDICTA):

  • MEDICTA i IURISDICTA su optimizovane za specijalizovane rečnike (medicinski ili pravni) i tačnija su u okviru tih domena (npr. latinski izrazi, specifični akronimi). TRANSCRIPTA je tačnija u svim ostalim slučajevima, čak i kad je neko vrlo specifično narečje u pitanju.
  • MEDICTA i IURISDICTA očekuju da se interpunkcija diktira ("tačka", "navodnik"), ali zato obezbeđuju visok nivo kontrole izgleda diktiranog teksta. TRANSCRIPTA ne zahteva diktiranje interpunkcije, ali zato automatski ubacuje samo tačku, zarez i upitnik.
  • MEDICTA i IURISDICTA rade u realnom vremenu sa minimalnim kašnjenjem (odmah se ispisuje šta je rečeno). TRANSCRIPTA takođe može veoma brzo da transkribuje veliku količinu materijala, ali ne ispisuje tekst u realnom vremenu.
  • MEDICA i IURISDICTA koriste se pomoću sofisticiranog grafičkog interfejsa koji omogućava promenu rečnika, formatiranje ispisa, korišćenje šablona i slično. TRANSCRIPTA se koristi iz relativno jednostavne aplikacije ili preko obezbeđenih API-ja.

TRANSCRIPTA se zasniva na klijent-server arhitekturi, što znači da prepoznavanje vrši centralizovani server, koji se može nalaziti ili u cloud-u (što je rešenje koje se preporučuje pojedinačnim korisnicima) ili biti fizički lociran u prostorijama institucije. Ovaj server prima snimke govora od klijentskih računara krajnjih korisnika i vraća im prepoznat tekst. Ovaj pristup ima dve važne prednosti:

  • snimci ne izlaze na javnu mrežu, čime je njihova privatnost apsolutno garantovana;
  • nije potrebna nabavka novih i jačih računara za krajnje korisnike, što značajno snižava cenu sistema u odnosu na slučaj kada se prepoznavanje vrši na njihovim računarima.

Potrebne hardverske karakteristike servera najviše zavise od broja maksimalnih istovremenih pristupa, odnosno željene brzine transkripcije (koliko puta je ona kraća u odnosu na trajanje samog materijala).

TTS Demonstracija

TTS demonstracija

ASR Demonstracija

ASR demonstracija


AlfaNum d.o.o.

Bulevar Vojvode Stepe 40 / 7

21000 Novi Sad

Tel: +381 21 475 0204