Aktualne problemy modelowania prozodycznego w badaniach nad syntezą mowy
Abstrakt
W artykule przedstawiono uwagi dotyczące modelu prozodycznego, który jest częścią multilingwalnego programu syntezy i ma spełniać kryterium stosowalności w językach objętych tymże programem. Wyniki badań testów oceniania jakości syntezy mowy wskazują na bliski związek między ogólną oceną sztucznej mowy a ewaluacją jej cech prozodycznych. Blok prozodyczny obejmuje trzy parametry: tonalny, dynamiczny i temporalny, z których każdy ma identyczną strukturę; aktualizowane jednocześnie tworzą całościową strukturę prozodyczną, która może być rozkładana na grupy akcentowe. Na podstawie komunikatywnie relewantnych kontrastów prozodycznych ustala się inwentarz konturów dla poszczególnych języków. Strukturalny opis konturu zasadniczo przypomina deskrypcję głównego allofonu fonemu. W programie uwzględniono nie tylko właściwe danemu językowi fonetyczne cechy konturów, ale również konotacje semantyczne, dystrybucję oraz częstotliwość występowania. Przyjęcie szerokiej koncepcji struktury konturu umożliwia przedstawienie różnych stopni kohezji między sekwencjami sylab w obrębie konturu. Dzięki programowi opracowywana jest strategia doskonalenia modelu prozodycznego. Modyfikacja struktury linearnej ma na celu bardziej szczegółowe przedstawienie grupy akcentowej. Zaletą proponowanego modelu jest jego elastyczność, uwarunkowana zmiennym charakterem konturu prozodycznego, zarówno wewnętrznego, jak i zewnętrznego.