student w słuchawkach przed laptopem

Magda i Natan – polskie głosy dla syntezatora mowy RHVoice

czas czytania: 2,5 minuty

Magda i Natan to dwa nowe polskie głosy dla syntezatora RHVoice udostępnione na licencji Creative Commons, co oznacza, że można z nich korzystać za na użytek własny, niekomercyjny.

Zrzut ekranu – strona projektu RHVoice
Zrzut ekranu – strona projektu RHVoice

RHVoice jest darmowym silnikiem dla syntetycznych głosów o otwartym kodzie, napisanym przez niewidomą programistkę Olgę Yakovleve. Więcej o tym można przeczytać na oficjalnej stronie projektu, dostępnej pod adresem https://rhvoice.org.

Dla RHVoice i różnych języków zostało stworzonych już kilkanaście głosów. Ich aktualną listę można znaleźć na stronie w zakładce Languages https://rhvoice.org/languages/

Osoby zainteresowane RHVoice znajdą informacje na platformie Github https://github.com/RHVoice.

Więcej informacji o tym, jak stworzyć nowy głos dla tego silnika można znaleźć na stronie  https://github.com/RHVoice/RHVoice/wiki. Warto przy okazji podziękować  polskiemu programiście – Grzegorzowi Złotowiczowi za stworzenie dokumentacji.

RHVoice może być instalowany na trzech systemach Android, Linux i Windows. Syntezator w postaci dodatku wspiera również darmowy czytnik NVDA.

W systemie Linux RHVoice może współpracować z czytnikiem Orca a w Windows obsługuje interfejs Microsoft SAPI5.

Zrzut ekranu – strona projektu Magdy i Natana
Zrzut ekranu – strona projektu Magdy i Natana

Na początku 2022 r.  powstały dwa głosy dla języka polskiego dla syntezatora RHVoice, o nazwie Magda i Natan. Ich brzmienie jest dość naturalne, ale jakością odbiegają od obecnych standardów syntetycznej mowy. Można je jednak bez problemu zrozumieć i używać w codziennej pracy. Zaletą tych głosów jest to, że są darmowe, nie wymagają dużych zasobów sprzętowych, działają bez opóźnień i nie posiadają własnej interpretacji skrótów, co w przypadku syntezatorów mowy produkowanych przez firmy komercyjne, jest częstą praktyką. Zaletą Magdy i Natana jest także umiejętność mówienia gwarą śląską i językiem kaszubskim – to obecnie jedyne głosy, które to potrafią.

Głosy Magda i Natan były dostępne dla systemu Windows i Android. W przypadku Linuxa uruchomienie ich jest trudniejsze, ponieważ trzeba samemu sobie je skompilować. O tym, jak to zrobić można przeczytać tutaj https://github.com/RHVoice/RHVoice/blob/master/doc/en/Compiling-on-Linux.md.

W systemie Android głosy współpracują z czytnikami ekranu oraz z programami używającymi interfejsu TTS. W Windowsach wspierany jest interfejs SAPI5, co pozwala na współpracę z nimi, zarówno czytnikom ekranu, jak i programom używającym tego interfejsu. Przykładem takich programów są opisywane w naszym serwisie Balabolka i Bookworm.

Głosy Magda i Natan działają także w instalowanym dla NVDA dodatku RHVoice.

Magdę i Natana w wersji dla Windows i w postaci dodatku dla NVDA można pobrać z polskiej strony projektu dostępnej pod adresem https://www.zlotowicz.pl/synteza

W systemie Android trzeba najpierw zainstalować silnik RHVoice, który można pobrać tutaj, a następnie bezpośrednio z niego instalujemy wybrane głosy.

Parametry pracy RHVoice można zmieniać z poziomu czytnika ekranu i dodatkowo poprzez stworzenie dla niego specjalnego pliku konfiguracyjnego. Opis tworzenia takiego pliku i wartości parametrów, których możemy w nim użyć jest dostępny w serwisie Github na tej podstronie https://github.com/RHVoice/RHVoice/blob/master/doc/en/Configuration-file.md.

Zarówno RHVoice, jak i polskie głosy, zostały przyjęte przez polską społeczność osób niewidomych z dużym entuzjazmem.  Niektórzy członkowie listy dyskusyjnej Typhlos  pisali nawet, że głosy te są lepsze niż dedykowane czytnikom ekranu głosy Vocalizer. Wygląda więc na to, że osoby niewidome czekały na taki produkt.

Niewątpliwą wadą jest to, że RHVoice automatycznie odczytuje emotikonki i niestety funkcji tej na razie nie można wyłączyć. Nie wszystkim użytkownikom RHVoice takie rozwiązanie odpowiada.

Informacje na temat syntezatora RHVoice i pomoc dotyczącą tworzonych dla niego głosów można uzyskać na liście dyskusyjnej Typhlos oraz na powstałej specjalnie dla projektu liście dyskusyjnej RHVoice. Na listę poświęconą RHVoice zapiszemy się, wysyłając maila na adres rhvoice-pl+subscribe@groups.io. Natomiast wiadomości wysyłamy, pisząc na adres rhvoice-pl@groups.io. Pierwsza wiadomość wysłana na listę wymaga potwierdzenia jej przez administratora grupy.