Citaj mi

Razvijen sintetizator za srpski i engleski jezik na bazi neuronskih mreža

 

Postoje dve osnovne grupe metoda za sintezu govora na osnovu teksta – metode zasnovane na direktnom povezivanju govornih segmenata i parametarske metode. Parametarske metode, među kojima su i one koje se zasnivaju na neuralnim mrežama, u poslednje vreme postaju sve popularnije, pre svega zahvaljujući svojoj fleksibilnosti. Naime, one pružaju mogućnost promene karakteristika glasa, odnosno identiteta govornika i stila govora, i kao takve su dovele i do pojave novih, atraktivnih aplikacija. AlfaNumov tim, koristeći vlastite govorno-jezičke resurse, softverske module kao i određene open-source alate namenjene radu s neuralnim mrežama, uspeo je da razvije kvalitetnu parametarsku sintezu govora na srpskom i engleskom jeziku. U visoku razumljivost i izuzetnu prirodnost sinteze moguće je uveriti se na osnovu sledećih primera:

 • Spiker čita tekst:

  1.

  2.

  3.

  4.

  5.

  6.

 • Sintetizovani glas izgovara tekst:

  1.

  2.

  3.

  4.

  5.

  6.

Objavljeno 10.03.2017.

TTS Demonstracija

TTS demonstracija

ASR Demonstracija

ASR demonstracija


AlfaNum d.o.o.

Bulevar Vojvode Stepe 40 / 7

21000 Novi Sad

Tel: +381 21 475 0204