Current Problems of Prosodic Modelling for Speech Synthesis

Elena Karnevskaya




Abstract

W artykule przedstawiono uwagi dotyczące modelu prozodycznego, który jest częścią multilingwalnego programu syntezy i ma spełniać kryterium stosowalności w językach objętych tymże programem. Wyniki badań testów oceniania jakości syntezy mowy wskazują na bliski związek między ogólną oceną sztucznej mowy a ewaluacją jej cech prozodycznych. Blok prozodyczny obejmuje trzy parametry: tonalny, dynamiczny i temporalny, z których każdy ma identyczną strukturę; aktualizowane jednocześnie tworzą całościową strukturę prozodyczną, która może być rozkładana na grupy akcentowe. Na podstawie komunikatywnie relewantnych kontrastów prozodycznych ustala się inwentarz konturów dla poszczególnych języków. Strukturalny opis konturu zasadniczo przypomina deskrypcję głównego allofonu fonemu. W programie uwzględniono nie tylko właściwe danemu językowi fonetyczne cechy konturów, ale również konotacje semantyczne, dystrybucję oraz częstotliwość występowania. Przyjęcie szerokiej koncepcji struktury konturu umożliwia przedstawienie różnych stopni kohezji między sekwencjami sylab w obrębie konturu. Dzięki programowi opracowywana jest strategia doskonalenia modelu prozodycznego. Modyfikacja struktury linearnej ma na celu bardziej szczegółowe przedstawienie grupy akcentowej. Zaletą proponowanego modelu jest jego elastyczność, uwarunkowana zmiennym charakterem konturu prozodycznego, zarówno wewnętrznego, jak i zewnętrznego.


Published
2005-12-30


Karnevskaya, E. (2005) “Current Problems of Prosodic Modelling for Speech Synthesis”, Białostockie Archiwum Językowe, (5), pp. 21–25. doi: 10.15290/baj.2005.05.02.

Elena Karnevskaya