Razvijen sintetizator za srpski i engleski jezik na bazi neuronskih mreža
Postoje dve osnovne grupe metoda za sintezu govora na osnovu teksta – metode zasnovane na direktnom povezivanju govornih segmenata i parametarske metode. Parametarske metode, među kojima su i one koje se zasnivaju na neuralnim mrežama, u poslednje vreme postaju sve popularnije, pre svega zahvaljujući svojoj fleksibilnosti. Naime, one pružaju mogućnost promene karakteristika glasa, odnosno identiteta govornika i stila govora, i kao takve su dovele i do pojave novih, atraktivnih aplikacija. AlfaNumov tim, koristeći vlastite govorno-jezičke resurse, softverske module kao i određene open-source alate namenjene radu s neuralnim mrežama, uspeo je da razvije kvalitetnu parametarsku sintezu govora na srpskom i engleskom jeziku. U visoku razumljivost i izuzetnu prirodnost sinteze moguće je uveriti se na osnovu sledećih primera:
-
Spiker čita tekst:
1.
2.
3.
4.
5.
6.
-
Sintetizovani glas izgovara tekst:
1.
2.
3.
4.
5.
6.
Objavljeno 10.03.2017.