Sinteza govora na osnovu teksta (TTS) je najstarija govorna tehnologija, i njeni počeci sežu još u 18. vek, kada su se pojavile prve "mašine koje govore". U međuvremenu je u toj oblasti došlo do dramatičnog razvoja, u najvećoj meri zahvaljujući razvoju računarske tehnologije u poslednjih nekoliko decenija. Reč je, kao i kod ostalih govornih tehnologija, o multidisciplinarnom problemu, za čije su rešavanje potrebna znanja iz brojnih oblasti, počev od akustike, fonetike i lingvistike, pa do matematike, telekomunikacija, obrade signala i programiranja.
Ovo je govorna tehnologija kod koje u najvećoj meri dolazi do izražaja zavisnost od jezika, tako da je sintetizator govora za svaki novi jezik potrebno realizovati praktično od početka.
Zadatak sinteze govora je da na osnovu ulazne informacije u tekstualnom obliku generiše govorni signal razumljiv čoveku. To podrazumeva i da bi sintetizovan govor morao da zvuči prirodno, odnosno, da bi trebalo da poseduje intonaciju karakterističnu za prirodan ljudski govor. Prirodnost sintetizovanog govora nije samo stvar estetike, već je bitan element za razumevanje poruke, pošto pomaže slušaocu da rastavi govorni tok na reči.
Primene sintetizatora govora su mnogobrojne. Ovakvi sistemi su u aplikacijama računarske telefonije nezamenljivo sredstvo za pružanje informacija velikom broju pozivalaca, pogotovo kada se radi o informacijama koje se često menjaju i nepraktično je svaki put angažovati govornika koji bi trebalo da ih pročita (npr. upravo pristigli e-mail).
Sintetizatori govora su od izuzetne pomoći i osobama sa invaliditetom - pogotovo onima sa oštećenjem govora, koje zahvaljujući ovakvim sistemima mogu gotovo normalno da komuniciraju - čak i telefonom, kao i slepim osobama, kojima je omogućeno da se samostalno služe računarom i na taj način se lakše uključe u svakodnevni život.
Pročitajte više o AlfaNum softverskoj komponenti za sintezu govora.