student w słuchawkach przed laptopem

Balabolka – program nie tylko dla osób z dysleksją

czas czytania: 16,5 minuty

Balabolka to prosty i mało „zasobożerny” program o dużych możliwościach, który został stworzony po to, aby pomagać osobom z problemami dysleksji. Funkcjonalność programu jest jednak znacznie szersza i jego funkcje mogą wykorzystać także i ci, którzy chcą przy pomocy mowy syntetycznej odsłuchiwać teksty skopiowane do systemowego schowka, albo bezpośrednio do programu. Kolejna grupa osób, której program ten może się przydać, to ci wszyscy, którzy mają potrzebę przekształcenia elektronicznego dokumentu zawierającego tekst z bardziej zaawansowanych formatów do pliku tekstowego, albo do pliku audio. W tym artykule omówione zostaną te trzy powyżej wymienione funkcje programu i wspomnimy o innych mniej znaczących możliwościach. Wszystkie opisywane poniżej funkcje były testowane w programie Balabolka w wersji 2.07.

Pobieranie i instalacja programu

Program możemy pobrać bezpośrednio ze strony jego twórcy, dostępnej pod adresem http://www.cross-plus-a.com/balabolka.htm

Balabolka dostępna jest w trzech wersjach, jako typowy program instalacyjny, w wersji portablowej, której nie musimy instalować i możemy ją przenosić pomiędzy komputerami na wymiennym nośniku pamięci flash, oraz wersji konsolowej bez graficznego interfejsu użytkownika. Program może być uruchamiany wyłącznie na komputerach pracujących pod kontrolą systemu operacyjnego Windows w jego różnych wersjach. W trakcie instalacji mamy możliwość wybrania języka interfejsu, wśród których jest także język polski.

Balabolka i syntezatory mowy

Syntezator mowy to program, który przy pomocy karty muzycznej i głośników odczytuje wysłany do niego tekst. Prawie wszystkie opisywane tu funkcje Balabolki wykorzystują syntezator mowy, to też instalując program, musimy pamiętać, że wraz z nim nie otrzymujemy żadnych programów tego typu. W tej sytuacji, chcąc wykorzystać funkcjonalność Balabolki związaną z odczytywaniem tekstu i przetwarzaniem plików tekstowych do formatu audio, sami musimy w taki syntezator się zaopatrzyć. Niestety w polskiej wersji systemu Windows dostępny jest tylko angielskojęzyczny syntezator mowy. W pomocy Balabolki znajdziemy wprawdzie odnośniki do przygotowanych przez firmę Microsoft syntezatorów mowy dla innych języków, ale wśród nich nie ma języka polskiego. Jest wprawdzie dostępny darmowy wielojęzyczny syntezator mowy posiadający także język polski, ale generowany przez niego głos nie należy do najprzyjemniejszych w odbiorze i osoby, które go zainstalują na początku, będą miały trudności ze zrozumieniem odczytywanych przez niego treści. Jeżeli ktoś, chciałby się jednak z nim zapoznać, to może pobrać go ze strony http://espeak.sourceforge.net/

Gdyby się jednak okazało, że Espik nam zupełnie nie odpowiada, to w przypadku języka polskiego, musimy sięgnąć po płatne wersje syntezatorów mowy. Spośród kilku dostępnych na rynku polskim syntezatorów mowy proponujemy zapoznać się z produktami firmy Iwona, gdyż według naszej oceny są to najbardziej zrozumiałe i przyjazne dla ucha syntetyczne głosy. Syntezator Iwona to wielojęzyczny pakiet posiadający bardzo dużo głosów dla języka polskiego, z którym można się zapoznać na stronie http://www.ivona.com/pl/

Uwaga! Osoby niewidome od pewnego czasu wraz z programami odczytu ekranu otrzymują syntezatory mowy typu „realspeak direct”, albo „vocalizer”, ale programy te nie wykorzystują w komunikacji interfejsu SAPI, tak, więc z Balabolką współpracować nie będą.

Balabolka wspiera syntezatory mowy zgodne z interfejsem „Microsoft Speech API” w skrócie SAPI w wersji 4 i 5. SAPi-4 to interfejs już przestarzały i w obecnej chwili nie zakupimy syntezatora mowy wykorzystującego ten typ komunikacji, ale jeżeli ktoś taki syntezator już posiada i jest z niego zadowolony, to Balabolka będzie w stanie go obsłużyć. W komunikacji z syntezatorami mowy, program także może wykorzystać interfejs „Microsoft Speech Platform”, ale dla tego rozwiązania firma Microsoft również nie przygotowała polskiego syntezatora mowy. Nie ma też dla niego syntezatorów z językiem polskim innych producentów.

Jeżeli przy pomocy Balabolki chcemy tylko konwertować dokumenty tekstowe do formatu audio i nie zależy nam na ich bieżącym odczytywaniu to, do tej czynności możemy wykorzystać zewnętrzny syntezator mowy udostępniany przez firmę Google. Wprawdzie przy takim rozwiązaniu konwersja dokumentu trwa znacznie dłużej, niż przy zastosowaniu zainstalowanego na naszym komputerze syntezatora, ale jest to jakiejś wyjście, gdy ktoś nie chce wydawać pieniędzy na kolejny program, a jednocześnie chce otrzymać tekst czytany przyjaznym dla ucha syntetycznym głosem.

Najważniejsze skróty klawiszowe związane z syntezą mowy:

  • Menu „opcje”
  • „wyjście audio” – (otwiera okno dialogowe, w którym możemy wskazać kartę muzyczną, z której będzie korzystał program przy odczytywaniu syntezatorem mowy dokumentu) – SHIFT + CTRL + F5
  • „pliki audio” – (tu możemy ustawić różne parametry kodeków audio biorących udział w procesie konwersji dokumentów tekstowych do formatu audio) – SHIFT + F5
  • Menu „narzędzia”
  • „zapisz plik audio – Google tts” – (wywołanie funkcji konwersji dokumentów na format audio z wykorzystaniem syntezatorów mowy Google) – SHIFT + CTRL + D

Interfejs programu

Program posiada tradycyjny oparty na pasku z rozwijanym menu czytelny i prosty interfejs. Do tego dochodzi bogaty zestaw skrótów klawiszowych, które możemy wykorzystać, zamiast klikania poszczególnych opcji myszką. W pomocy nie znajdziemy wprawdzie wykazu skrótów klawiszowych, ale są one widoczne przy tych pozycjach menu, dla których zostały zdefiniowane.

W tym artykule, po każdej części omawiającej poszczególne funkcje Balabolki znajdują się wykazy najważniejszych skrótów klawiszowych dedykowanych opisywanym czynnościom. W ustawieniach programu – menu „opcje”, pozycja „ustawienia”, zakładka „skróty klawiszowe” – możemy zmienić standardowo przypisane do poszczególnych funkcji skróty klawiszowe i w ten sposób dopasować je do własnych potrzeb.

Oprócz skrótów klawiszowych okno programu wyświetla paski narzędziowe, które grupują przyciski najczęściej używanych funkcji we wskazanej kategorii zadań. Paski narzędziowe możemy włączać i wyłączać w menu „widok”, pozycja „paski narzędziowe”.

Do dyspozycji mamy również bogate w funkcje menu kontekstowe wywoływane prawym przyciskiem myszki, lub bezpośrednio z klawiatury klawiszem menu kontekstowego, albo skrótem klawiszowym SHIFT + F10.

Poza tym osoby bardziej zaawansowane mogą uruchamiać polecenia Balabolki bezpośrednio z systemowego „wiersza poleceń”. W pomocy programu, która niestety jest dostępna wyłącznie w języku angielskim, znajdziemy dobrze opisany zestaw przełączników wykorzystywanych w pracy z programem w „wierszu poleceń” wraz z przykładami ich zastosowania.

Niektóre funkcje Balabolki są także dostępne z dowolnego miejsca w komputerze z menu kontekstowego. W menu tym znajdziemy pozycję „balabolka” i po jej rozwinięciu będą dostępne takie czynności jak: otwarcie dokumentu w programie, odczytanie dokumentu syntezatorem mowy i konwersja dokumentu do plików audio w formacie „.wav” i „.mp3”.

Większość parametrów związanych z pracą i wyglądem programu możemy zmieniać w menu „opcje”, pozycja „ustawienia”. Znajdziemy tam zestaw zakładek grupujących poszczególne ustawienia Balabolki.

Najważniejsze skróty klawiszowe związane z ustawieniami Balabolki:

  • Menu „opcje”
  • „ustawienia” – (otwiera okno zawierające zakładki grupujące opcje związane z wyglądem i pracą programu) – SHIFT + F6
  • Zmiana wyglądu programu

Jeżeli ktoś dodatkowo ma problemy ze wzrokiem, albo takich problemów nie ma, ale chce dostosować wygląd programu do własnych upodobań, to Balabolka udostępnia zestaw skórek zmieniających wygląd jej interfejsu. Poza tym można sobie dopasować do własnych potrzeb parametry czcionki i kolor. Dodatkowa funkcjonalność to możliwość powiększania i zmniejszania tekstu tzw. Skalowanie czcionek. Jeżeli w trakcie odsłuchu i śledzenia wzrokiem odtwarzanego tekstu przeszkadzają nam paski narzędziowe, to możemy je wyłączyć, albo włączyć funkcję „pełny ekran”, co sprawi, że po za tekstem nic na ekranie nie będzie wyświetlane. Wszystkie te funkcje związane z wyglądem znajdziemy w menu „widok”.

Najważniejsze skróty klawiszowe związane z wyglądem programu:

  • Menu „widok”
  • „czcionka i kolory” – (zmiana czcionki i kolorów – dotyczy tylko interfejsu) – CTRL + B
  • „skórki” – (wybór skórki – pozwala na zmianę wyglądu programu) – CTRL + K
  • „przyciski” – (okienko umożliwiające dostosowanie wyglądu przycisków) – SHIFT + CTRL + B
  • „increase font size” – (zwiększenie czcionki – skalowanie) – CTRL + SHIFT + . (kropka)
  • „decrease font size” – (zmniejszenie czcionki – skalowanie) – SHIFT + CTRL + , (przecinek)
  • „pełny ekran” – (wyświetlenie tekstu na pełnym ekranie) – F12, ponowne wciśnięcie tego klawisza przywraca poprzedni wygląd.

Edycja tekstu i otwieranie dokumentów z dysku

Po uruchomieniu programu Balabolka jest gotowa do edycji tekstu. Tekst piszemy tak samo jak w każdym innym edytorze tekstów. Zamiast pisać własny tekst, możemy otworzyć już istniejący dokument z dysku, lub innego nośnika danych. Funkcje otwierania dokumentów znajdziemy w menu „plik”. Balabolka potrafi otwierać dokumenty w wielu formatach, między innymi w takich jak: doc, rtf, pdf, epub, html i innych. W programie możemy otworzyć kilka różnych dokumentów, a następnie wykorzystując w oknie system zakładek przełączać się pomiędzy nimi. Nie potrzebny dokument z tego samego menu możemy zamknąć, wybierając polecenie „zamknij”.

Jeżeli w otwartym dokumencie pdf zobaczymy nieprawidłowo kodowane polskie znaki, to ich kodowanie możemy zmienić. Funkcja ta dostępna jest w menu „tekst” i nazywa się „kodowanie pdf”. Do dyspozycji mamy dwa formaty kodowania „ansi” i „utF8”.

Po otwartych dokumentach poruszamy się podobnie jak po dokumencie edytowanym w innym edytorze. Do przemieszczania się w dokumencie można używać zarówno myszki, jak i klawiszy kursora.

W edytowanym dokumencie możemy zaznaczać tekst i korzystając z funkcji znajdujących się w menu „edycja” kopiować go lub przenosić w inne miejsce. To samo menu udostępnia także opcje usuwania zaznaczonych fragmentów tekstu, funkcje wyszukiwania i zamiany tekstu, oraz konwersję liter z dużych na małe i odwrotnie.

Menu „tekst” zawiera funkcję sprawdzania pisowni, opcje prostego formatowania, oraz narzędzie umożliwiające zamianę liczb pisanych cyframi na słowa, ale niestety wśród dostępnych języków brakuje polskich reguł, tak więc dla polskich liczb go nie wykorzystamy.

Podczas sprawdzania pisowni Balabolka korzysta ze słowników dostępnych w pakiecie MS-Office, to też, chcąc wykorzystać tę funkcję, musimy mieć zainstalowane w systemie to oprogramowanie. Na naszym komputerze, na którym testowaliśmy program, pomimo zainstalowania pakietu Office w wersji 2007, niestety funkcja sprawdzania pisowni nie działała.

W trakcie edycji tekstu do zaznaczania jego ważniejszych miejsc możemy użyć zakładek. Wykorzystanie zakładek zostało opisane w dalszej części artykułu.

Najważniejsze skróty klawiszowe związane z edycją dokumentów:

  • Poruszanie się po dokumencie
  • Strzałki (prawo / lewo) – przemieszczają kursor edycji po znakach tekstu w prawo, lub w lewo
  • Strzałki (góra / dół) – przemieszczają kursor edycji po liniach tekstu w górę, lub w dół
  • Klawisze „PGUP”, „pgdn” – przewijają tekst na ekranie w górę i w dół
  • Klawisze „HOME” i „end” – przesuwają kursor edycji w dokumencie na początek i koniec wiersza, w którym kursor się znajduje
  • Klawisze „CTRL + UP i CTRL + DOWN” – przemieszczają kursor edycji do poprzedniego i następnego akapitu tekstu
  • Klawisze „CTRL + HOME” i „CTRL + END” – przemieszczają kursor edycji na początek i koniec edytowanego dokumentu
  • Klawisze „CTRL + TAB” i „CTRL + SHIFT + TAB” – przełączają pomiędzy otwartymi dokumentami.

Zaznaczanie edytowanego tekstu:

  • Klawisze „SHIFT + strzałka w lewo, lub w prawo” – zaznaczanie tekstu po znakach
  • Klawisze „CTRL + SHIFT + strzałka w lewo, lub w prawo” – zaznaczanie tekstu po słowach
  • „SHIFT + END” – zaznaczanie tekstu od miejsca położenia edycyjnego kursora do końca wiersza
  • „SHIFT + HOME” – zaznaczanie tekstu od miejsca położenia edycyjnego kursora do początku wiersza
  • „CTRL + SHIFT+strzałka w górę, lub dół” – zaznaczanie akapitów tekstu
  • „CTRL + SHIFT + HOME” – zaznaczanie tekstu od miejsca położenia edycyjnego kursora do początku dokumentu
  • „CTRL + SHIFT + END” – zaznaczanie tekstu od miejsca położenia edycyjnego kursora do końca dokumentu
  • „CTRL + A” – zaznaczanie całego dokumentu
  • Menu „plik”:
  • „nowy” – (otwiera gotowe do edycji okno nowego czystego dokumentu) – CTRL + N
  • „otwórz” – (otwiera okno umożliwiające wczytanie dokumentu z dysku i innych nośników) – CTRL + O
  • „zapisz” – (zapisuje zmiany w edytowanym dokumencie) – CTRL + S
  • „zapisz jako” – (otwiera okienko zapisywania pozwalające na wybranie położenia pliku, wpisanie nowej nazwy i wybranie formatu, w jakim ma być zapisany plik) – CTRL + ALT + S
  • „zamknij” – (zamyka okno aktualnie edytowanego dokumentu) – CTRL + F4
  • „zamknij wszystko” – (zamyka wszystkie okna z otwartymi dokumentami) – CTRL + SHIFT + F4
  • Menu „edycja”:
  • „cofnij” – (cofa dokonane zmiany w edytowanym dokumencie) – CTRL + Z
  • „wytnij” – (wycina zaznaczony tekst do systemowego schowka) – CTRL + X
  • „kopiuj” – (kopiuje zaznaczony tekst do systemowego schowka) – CTRL + C
  • „wklej” – (wkleja tekst z systemowego schowka do aktywnego okna edycji w miejscu położenia edycyjnego kursora) – CTRL + V
  • „znajdź” – (otwiera okienko do wpisania poszukiwanego w edytowanym dokumencie tekstu” – CTRL + F
  • „znajdź następny” – (wykonuje polecenie ponownego szukania wystąpienia w edytowanym dokumencie uprzednio szukanego tekstu) – F3
  • „zamień” – (otwiera okienko umożliwiające wpisanie poszukiwanego tekstu i zamianę go na inny) – CTRL + R
  • „wybierz wszystko” – (zaznacza cały tekst w edytowanym dokumencie) – CTRL + A
  • Menu „tekst”:
  • „sprawdzanie pisowni” – (uruchamia moduł sprawdzania pisowni) – F4
  • „formatuj tekst” – (funkcje prostego formatowania) – CTRL + L
  • „zamień liczby na słowa” – (otwiera okno z parametrami tej funkcji) – CTRL + G

Zapisywanie dokumentów na dysk – konwersja formatów

Dokument na dysk zapisać możemy wyłącznie w formacie txt. Funkcje zapisywania znajdują się w menu „plik” i nazywają się „zapisz” i „zapisz jako”. W trakcie zapisywania dokumentu możemy wskazać format kodowania polskich znaków. Do dyspozycji mamy kilka formatów między innymi format „ansi”, „unicode” i „utF8”. Funkcja „zapisz jako” pełni jednocześnie rolę konwersji dokumentów do formatu txt. Wykorzystując możliwości Balabolki możemy na przykład otworzyć dokument w formacie epub i zapisać go w formacie txt.

Najważniejsze skróty klawiszowe zapisywania i konwersji dokumentów:

  • Menu „plik”
  • „zapisz” – (zapisuje plik na dysku i nie zezwala na zmianę takich parametrów jak miejsce położenia pliku, jego nazwy i formatu) – CTRL + S
  • „zapisz jako” – (otwiera okienko zapisywania pozwalające na wybranie położenia pliku, wpisanie nowej nazwy i wybranie formatu, w jakim ma być on zapisany) – CTRL + ALT + S

Wsparcie osób z dysleksją

Balabolka, podczas odczytywania tekstu syntetycznym głosem jednocześnie podświetla aktualnie odczytywany jego fragment. Dzięki takiemu rozwiązaniu osoba z dysleksją może jednocześnie słuchać i śledzić tekst, co ułatwia jej, znalezienie w nim błędów.

Dokument tekstowy w wielu formatach możemy otworzyć bezpośrednio w programie albo skopiować go do programu poprzez schowek systemowy. Program umożliwia także edycję tekstu, a więc możemy również taki dokument sami sobie napisać. Proces edycji i otwierania dokumentu szczegółowo został omówiony w poprzednich podrozdziałach tego artykułu – patrz wyżej.

Przygotowując tekst do odsłuchu, musimy pamiętać, że język, w którym został on napisany, musi być zgodny z językiem posiadanego przez nas syntezatora mowy. Uwaga, Balabolka nie potrafi w locie zmieniać języków syntezatora mowy, tak więc odczytując dokument wielojęzyczny, sami ręcznie musimy je przełączać. Zmiany syntezatora mowy można dokonać bezpośrednio z paska narzędziowego „konfiguracja głosu”, albo w menu „opcje”, pozycja „głos”. W tym miejscu wyświetlane są wszystkie zainstalowane w systemie syntezatory mowy.

Aby uruchomić odczyt dokumentu, otwieramy menu „mowa” i tam wybieramy pozycję „czytaj”. Podczas odczytywania program automatycznie podświetla odczytywaną frazę tekstu, co pozwala nam odsłuchiwać tekst i wzrokiem śledzić to, co aktualnie jest czytane. W trakcie czytania możemy określać obszar podświetlanej frazy i tak możemy ustawić, aby podświetlany był wyraz, linia, lub zdanie. Możemy także odpowiednimi suwakami zmieniać głośność dźwięku, barwę Głosu i szybkość czytania. Odczytywanie w każdej chwili możemy na chwilę zatrzymać, a następnie z tego samego miejsca wznowić, albo całkowicie zatrzymać. Balabolka podczas odtwarzania tekstu umożliwia również szybkie przejście do następnej linii i akapitu. Funkcja ta jest przydatna wówczas, gdy chcemy pobieżnie zapoznać się z tekstem. Funkcje odpowiedzialne za kontrolę czytania dostępne są w menu „mowa” i „opcje” a także na pasku narzędziowym „konfiguracja głosu”.

W trakcie odczytywania dokumentu ważniejsze jego miejsca możemy oznaczyć zakładkami. Do dyspozycji mamy dwa rodzaje zakładek – szybką zakładkę i zakładkę nazwaną. Pierwszy typ zakładki wykorzystujemy wówczas, gdy chcemy zaznaczyć miejsce, w którym skończyliśmy czytanie, zaś drugi typ zakładki możemy wykorzystać do oznaczeń ważniejszych akapitów tekstu. Wszystkie funkcje związane z zakładkami znajdują się w menu „zakładka”.

Najważniejsze skróty klawiszowe odczytywania dokumentu:

  • Menu „mowa”
  • „czytaj” – (uruchamia odczytywanie tekstu za pomocą syntezatora mowy) – F5
  • „przerwa” – (funkcja pauzy, która zatrzymuje odczytywanie tekstu, tym samym skrótem można je wznowić) – F6
  • „stop” – (zatrzymuje odczytywanie tekstu) – F7
  • „czytaj wybrany tekst” – (odtwarza zaznaczony fragment tekstu) – F8
  • „czytaj ze schowka” – (odczytuje tekst znajdujący się w systemowym schowku, w tym przypadku tekst nie jest podświetlany) – F9
  • „przejdź do następnego akapitu” – (przemieszcza kursor edycji i odczytuje następny akapit tekstu) – CTRL + DOWN, (CTRL + strzałka w dół)
  • „przejdź do poprzedniego akapitu” – (przemieszcza kursor edycji i odczytuje poprzedni akapit tekstu_) – CTRL + UP, (CTRL + strzałka w górę)
  • Menu „opcje”
  • „szybkość – zwiększ” – (zwiększa szybkość mowy odczytywanego dokumentu) – CTRL + RIGHT, (CTRL + strzałka w prawo)
  • „szybkość – zmniejsz” – (zmniejsza szybkość mowy odczytywanego dokumentu) – CTRL + LEFT, (CTRL + strzałka w lewo)
  • „tonacja – podnieś” – (podnosi w trakcie czytania ton głosu) – CTRL + ALT + UP, (CTRL + ALT + strzałka w górę)
  • „tonacja – zmniejsz” – (obniża w trakcie czytania ton głosu) – CTRL + ALT + DOWN, (CTRL + ALT + strzałka w dół)
  • „głośność – zwiększ” – (zwiększa głośność głosu syntezatora mowy) – CTRL + ALT + PGUP
  • „głośność – zmniejsz” – (zmniejsza głośność głosu syntezatora mowy) – CTRL + ALT + PGDN
  • „resetuj szybkość i tonację” – (resetuje ustawienia tych parametrów) – CTRL + D
  • Menu „zakładka”
  • „wstaw szybką zakładkę” – (wstawia do tekstu szybką zakładkę, którą możemy zaznaczyć miejsce, w którym skończyliśmy czytanie. Zakładka jest wstawiana w miejscu, w którym znajduje się kursor edycji. Do tekstu można wstawić tylko jedną zakładkę tego typu) – CTRL + ALT + Q
  • „idź do szybkiej zakładki” – (przenosi kursor edycji do zakładki tego typu” – CTRL + Q
  • „wstaw nazwaną zakładkę” – (wyświetla okienko umożliwiające wstawienie do edytowanego dokumentu zakładki opisowej. Do dokumentu można wstawić wiele takich zakładek. Opis zakładce nadaje sam użytkownik programu. Zakładka jest wstawiana w miejscu położenia w tekście kursora edycji.) – CTRL + F3
  • „idź do nazwanej zakładki” – (przenosi kursor edycji do wskazanej zakładki tego typu. Dodatkowo to okienko umożliwia zmianę treści zakładki, usunięcie wskazanej zakładki, oraz usunięcie wszystkich zakładek tego typu z dokumentu.) – SHIFT + F3

Rafał Gorgolik

BON UW

Konwersja dokumentów tekstowych do formatu audio

Balabolka posiada doskonały mechanizm do tworzenia plików audio. Dzięki konwerterowi zawartemu w programie możemy stworzyć plik w jednym z wielu dostępnych formatów muzycznych, i w zależności od posiadanego syntezatora mowy stworzyć własnego audiobooka czytanego głosem wirtualnego lektora.

Aplikacja daje nam następujące formaty dźwiękowe do dyspozycji: MP3, OGG, wMA, MP4, czyli jak widać najpopularniejsze obecnie formaty, z którymi z powodzeniem poradzi sobie nawet najprostszy odtwarzacz muzyki. Aplikacja sama w sobie zawiera kodeki potrzebne do utworzenia powyższych formatów i użytkownik nie musi się o to martwić. Program posiada bardzo wygodne rozwiązanie do dzielenia plików, które w trakcie konwersji pozwoli na utworzenie plików audio o konkretnym rozmiarze lub czasie, a także w zależności od przygotowanego tekstu podział na rozdziały, strony czy wstawione zakładki. Cały proces trwa stosunkowo niedługo, bo o ile algorytm Balabolki zamieniający tekst na głos jest bardzo wydajny, to kompresja audio w dużej mierze zależy od wydajności posiadanego komputera i może potrwać…

Przystępujemy do stworzenia naszego audiobooka. Uruchamiamy Balabolkę, otwieramy w niej dokument zawierający tekst i na wstępie ustawiamy parametry głosu, takie jak:

  • Sam głos, czyli wybór syntezatora mowy. w zależności od zainstalowanego ich rodzaju mamy dostępne SAPI 4 i SAPI 5 widoczne na zakładkach.
  • Szybkość odczytywanego tekstu
  • Barwę głosu – ustawienie bardzo rzadko wspierane przez syntezatory.
  • Głośność.

Do tych ustawień mamy dostęp z poziomu samego interfejsu programu, poruszając się tabulatorem. W każdej chwili możemy posłuchać jak brzmi tekst po naszych modyfikacjach wciskając klawisz F5 i by zatrzymać odczyt F7. Inne polecenia dotyczące odczytu tekstu znajdziemy w menu głównym pod pozycją „Mowa”. Następnym krokiem jest wybór i ustawienie parametrów kodera audio. Do tych ustawień docieramy, wybierając z menu głównego Opcje, a następnie pliki audio lub skrótem klawiszowym SHIFT+ F5. W otwartym okienku dialogowym wybieramy częstotliwość i próbkowanie dźwięku oraz ilość kanałów 2 stereo / 1 mono. Ustawienie to ma bezpośredni wpływ na jakość uzyskanego nagrania. Sugerowanym ustawieniem jest wartość: 22KHZ, 16 bit, mono i jest ono optymalne dla głosów syntetycznych zgodnych z SAPI 5. Następnie na liście zakładek dokonujemy wyboru formatu i dalej ustawiamy jego parametry, czyli bitrate. Zalecam wybór stałego bitrate, co pozwoli nam na wybranie jego wartości z listy, a nie z nic niemówiącego suwaka. Im większa wartość kbp/s, tym lepsza jakość nagrania, ale mniejsza kompresja i pliki wyjściowe większe. Jak pisałem wcześniej, głos syntetyczny jest stosunkowo niskiej jakości i na moje potrzeby wartość 64 kbp/s jest wystarczająca. Jest to moje odczucie subiektywne i każdy w zależności od swojej wrażliwości może dobrać stosowny poziom kompresji. Po wybraniu parametrów kodeka przechodzimy do właściwego okna „Podział i kompresja plików audio” – polecenie dostępne z menu Plik lub skrót klawiszowy CTRL + F8. W tym miejscu podzielimy plik i przejdziemy do właściwej konwersji. W pierwszym polu wybieramy katalog wyjściowy, w którym będą umieszczone pliki audio, wybierając przycisk wybierz. Następnie wybieramy format kompresji audio. W kolejnym okienku nazwę pliku – tu domyślnie jest zaproponowana nazwa pliku wejściowego. Dalej ustalamy numerację, od jakiej wartości ma się rozpocząć numeracja poszczególnych nazw plików – domyślnie jest to 01, a dalej decydujemy, czy liczba ta ma się pojawić na początku, czy na końcu nazwy pliku. W kolejnej sekcji decydujemy, według jakich kryteriów chcemy podzielić nasz plik. Program ma następujące opcje:

  • Według określonej ilości tekstu – wartość podajemy w kilobajtach i w zależności od tego, jaką szybkość ustaliliśmy syntezatorowi mowy, możemy sterować tym parametrem, by uzyskać żądaną długość w minutach nagrania audio. Przy prędkości głosu 50 1 kilobajt tekstu równy jest mniej/więcej jednej minucie.
  • Według określonych wierszy w tekście wyjściowym – pozwala na podział według słowa kluczowego występującego w wersie. (UWAGA opcja źle przetłumaczona i brzmiąca nie intuicyjnie)
  • Z dwóch pustych, następujących po sobie linii.
  • Z linii pisanych dużymi literami.
  • Wykorzystać zakładki – podział zostanie dokonany na podstawie zakładek wstawionych w edytorze Balabolki.
  • Podziel tekst na słowa kluczowe i usuń je z tekstu – funkcja ma znaczenie, gdy sami do tekstu wprowadzimy słowa kluczowe, jednak by nie miały wpływu na treść, chcemy je usunąć.
  • Przycisk wypowiadanie numeru bloku. Opcja ta pozwala na wprowadzenie tekstu wraz z numerem wypowiadanego na początku lub końcu pliku, na przykład: rozdział 1, koniec odcinka. Wartość liczbową określa zmienna %D. Możemy też ustalić, by tekst był wypowiadany na początku lub na końcu nagrania i wybrać, od jakiej wartości ma się rozpocząć numeracja. Następnie przyciskiem test możemy sprawdzić, ile plików zostanie utworzonych przy uwzględnieniu naszych kryteriów, a następnie rozpocząć konwersję wraz z podziałem lub tylko podział na pliki tekstowe. Wybierając „podział i konwersja” otrzymamy listę plików, na której możemy zdecydować, które z nich chcemy przetworzyć na audio, domyślnie zaznaczone są wszystkie. Przyciskiem podziel rozpoczynamy proces konwersji. Przycisk podziel, również wyświetli nam okno z listą plików do wyboru, gdzie będziemy mogli wybrać interesujące nas pliki, a następnie wybierając podziel, rozpoczniemy cały proces.

W przypadku, gdy mamy niewielką ilość treści do konwersji na audio lub zależy nam na jednym pliku wynikowym, możemy wybrać z menu Plik polecenie „Zapisz plik audio…” skrót klawiszowy CTRL + W. Ukaże się nam klasyczne okno dialogowe do zapisu plików, gdzie wystarczy wprowadzić nazwę i wybrać format pliku.

Na koniec jeszcze jedna ciekawa funkcja Balabolki. W menu Narzędzia jest polecenie „Zapisz plik audio za pomocą Google TTS”, skrót klawiszowy CTRL + SHIFT+ D. W okienku dialogowym możemy wprowadzić tekst, wybrać język głosu, oraz nazwę i ścieżkę do pliku wyjściowego w formacie WAV. Cały proces dokonuje się online i gdy wprowadzona porcja tekstu będzie zbyt wielka, czas na jej przetworzenie znacznie się wydłuży.

Inne użyteczne funkcje Balabolki

Funkcje zawarte w menu „opcje”:

  • „Śledź schowek” – to funkcja po włączeniu, której i skopiowaniu tekstu do systemowego schowka, jest on automatycznie przez Balabolkę odczytywany. Zastosowań tej funkcji może być wiele, choć by sprawdzanie wymowy słowa napisanego w obcym języku. Oczywiście, żeby funkcji tej w tym zadaniu można było użyć, musimy mieć zainstalowany w systemie syntezator mowy zgodny z językiem, którego słowo skopiowaliśmy do schowka. Uwaga Balabolka nie jest w stanie samodzielnie na podstawie tekstu określić języka i przełączyć syntezatora mowy, tak więc najpierw ręcznie musimy w programie wybrać syntezator dla języka, którego będziemy używać
  • „minutnik” – ta funkcja umożliwia wykonanie przez Balabolkę po upływie wybranego czasu, lub zakończeniu czytania dokumentu, wskazanego polecenia. Poleceniem takim może być zamknięcie komputera, odtworzenie dźwięku, lub wyświetlenie ostrzeżenia.
  • Funkcje menu „narzędzia”:
  • „podziel plik” – umożliwia podzielenie dużego otwartego w programie pliku na kilka mniejszych. Plik możemy dzielić według wielu kryteriów np. według występujących w tekście słów kluczowych, lub według wielkości plików wynikowych. Nazwa każdego pliku wynikowego może zaczynać się numerem porządkowym. W trakcie dzielenia pliku Balabolka może przekonwertować polskie znaki i zapisać pliki wynikowe w innym wskazanym formacie kodowania polskich znaków. Ta funkcja sprawia, że program możemy wykorzystać także do konwersji polskich znaków. Możemy na przykład stworzyć jeden plik docelowy, ale z innym kodowaniem polskich znaków niż plik źródłowy. Przed wykonaniem podziału możemy kliknąć przycisk „test” i sprawdzić ile w efekcie podziału otrzymamy plików wynikowych.
  • „konwersja wsadowa plików” – funkcją tą możemy się posłużyć wówczas, gdy chcemy przekonwertować dużą grupę plików tekstowych do postaci plików audio. Do dyspozycji mamy kilka najpopularniejszych formatów audio, tak więc każdy powinien znaleźć taki, który jego odtwarzacz muzyczny jest w stanie odtworzyć. W pierwszym kroku wskazujemy pliki tekstowe, które mają zostać poddane procesowi konwersji, następnie wybieramy format docelowych plików audio. Możemy także włączyć opcję, która sprawi, że w każdym pliku audio Balabolka na jego początku, albo końcu odczyta jego kolejny numer porządkowy wynikający z kolejności realizowania zadania. Konwersji dokumentów tekstowych na format audio poświęciliśmy poprzedni podrozdział i wszystkich zainteresowanych tą funkcją zapraszamy do zapoznania się z nim.
  • „wyciągnij tekst z plików” – to kolejna wsadowa funkcja balabolki polegająca na konwersji grupy dokumentów tekstowych. Chcąc z niej skorzystać, najpierw wybieramy dokumenty tekstowe w formatach zaawansowanych np. pdf html, lub innych. Następnie dokonujemy ich przekonwertowania na prosty format tekstowy tj. plik txt. W wyniku konwersji możemy otrzymać pojedyncze pliki – konwersja typu jeden do jeden, lub jeden plik zawierający treść z wszystkich konwertowanych dokumentów. W okienku funkcji znajdują się dwie zakładki. Zakładka „pliki” pozwala na wskazanie plików przeznaczonych do konwersji. Na zakładce „tekst” ustawiamy parametry konwersji. Możemy tu dokonać w plikach wynikowych zmiany formatu polskich znaków, włączyć przeformatowanie plików i zapisać tekst z wielu plików do jednego. Jeżeli chodzi o formatowanie, to jego opcje ustawiamy w menu „opcje” pozycja „ustawienia” na zakładce „tekst”. Znajdziemy tam wiele przełączników odpowiedzialnych za wygląd tekstu w docelowych plikach, lub pliku. Uwaga, Balabolka nie posiada funkcji OCR, tak więc nie będzie w stanie przekonwertować dokumentów pdf, które zamiast warstwy tekstowej zawierają nierozpoznane graficzne obrazy z tekstem.
  • „porównaj dwa pliki” – funkcja pozwala porównać zawartość dwóch plików zawierających tekst. Aby tego dokonać, najpierw musimy wskazać obydwa porównywane pliki, a następnie wybrać metodę prezentowania wyników porównywania. Do dyspozycji mamy m.in. takie metody jak: wykaz identycznych linii występujących w obydwóch plikach, wykaz linii, które występują w pierwszym pliku, a nie ma ich w drugim, lub odwrotnie.
  • „powtórz tekst” – funkcja umożliwia powtórzenie określoną ilość razy wybranej frazy tekstowej. Aby z niej skorzystać, najpierw w edytorze balabolki musimy napisać jakiś tekst, może to być pojedyncze słowo, zdanie, lub akapit. Następnie wywołujemy funkcję, określamy długość frazy tekstowej – do dyspozycji mamy: słowa, zdanie i akapit. Ustalamy liczbę powtórzeń i zatwierdzamy przycisk „ok”. Funkcję możemy wykorzystać np. do przygotowania długiego dokumentu.
  • „tłumacz Google – translate” – dzięki tej funkcji w szybki i prosty sposób możemy przetłumaczyć tekst z jednego języka na drugi. Do wykonania tłumaczenia Balabolka wykorzystuje Google. W okienku funkcji znajduje się pole tekstowe, w które możemy wpisać tekst, zaimportować go z otwartego w programie dokumentu, lub wkleić go ze schowka. Następnie na dwóch rozwijanych listach ustawiamy odpowiednie języki tj. oryginalny język przeznaczonego do przetłumaczenia tekstu i język docelowy, na który chcemy tekst ten przetłumaczyć. Po kliknięciu przycisku „tłumacz” w kolejnym polu edycyjnym wyświetlany jest wynik tłumaczenia. Wynik tłumaczenia możemy skopiować do schowka i wkleić do innego programu albo otworzyć go w oknie Balabolki jako kolejny dokument. Powyżej wymienione polecenia kopiowania, wklejania itp. Dostępne w polach edycyjnych wywołujemy przy pomocy menu kontekstowego lub po kliknięciu w obszar odpowiedniego pola prawym przyciskiem myszki.
  • „lupa” – to proste narzędzie powiększające, taka typowa lupka, którą możemy użyć do powiększenia wskazanego nią tekstu. Lupkę możemy po tekście przesuwać wyłącznie za pomocą myszki, nie jest ona w stanie podążać za kursorem edycji ani za wskaźnikiem myszki. Trzeba ręcznie przesunąć ją nad obszar, który chcemy powiększyć. Stopień powiększenia można wybrać po kliknięciu prawego przycisku myszki. Narzędzie to jest bardzo proste, dlatego też trudno stwierdzić, na ile może być ono użyteczne. Osoby słabo widzące mające problemy ze wzrokiem raczej będą wykorzystywały do pracy z programem lupę udostępnianą przez system Windows.

Wykaz skrótów klawiszowych dających szybki dostęp do omawianych w tym podrozdziale narzędzi:

  • Menu „opcje
  • „śledź schowek” – (uruchamia funkcję śledzenia i czytania tekstu ze schowka – SHIFT+CTRL+W
  • „minutnik” – (otwiera okienko z ustawieniami minutnika) – SHIFT + F8
  • Menu „narzędzia”
  • „podziel plik” – CTRL+U
  • „konwersja wsadowa plików” – CTRL+Y
  • „wyciągnij tekst z plików” – SHIFT+CTRL + F
  • „porównaj dwa pliki” – CTRL+E
  • „powtórz tekst” – SHIFT+CTRL+R
  • „tłumacz Google – translate” – SHIFT+CTRL+G
  • „lupa” – (uruchamia lupkę) – F2

Praca w programie z wykorzystaniem wiersza poleceń

Podrozdział ten poświęcamy tym wszystkim, którzy chcą pracować z Balabolką, wykorzystując wiersz poleceń. Wszystkie niezbędne informacje do tego typu pracy znajdują się wprawdzie w pomocy programu, ale, jako że jest ona w języku angielskim i nie każdy go zna na tyle dobrze, aby poradzić sobie z techniczną dokumentacją, postanowiliśmy przetłumaczyć to, co jest tam na ten temat napisane. Jeżeli ktoś spośród czytelników chciałby wykorzystywać Balabolkę wyłącznie z wiersza poleceń, to proponujemy zainstalować wersję programu bez interfejsu graficznego – patrz podrozdział „pobieranie i instalacja programu” na początku tego artykułu.

Składnia wywołania programu w linii poleceń jest następująca:

balabolka.exe [-options] [filename] [audio_file] [voice]

gdzie:

balabolka.exe – nazwa programu,

[-options] – opcje programu,

[filename] – nazwa pliku (dokumentu tekstowego),

[audio-file] – nazwa pliku audio powstającego w procesie konwersji dokumentu tekstowego,

[voice] – nazwa syntezatora mowy i parametrów jego pracy

Jeżeli nazwa pliku jest wielowyrazowa, albo wraz z nazwą podajemy całą ścieżkę dostępu, to musimy taki wpis ująć w znaki cudzysłowu. Np. „czytanka dla janka.rtf”, „d:\moje dokumenty\czytanka.pdf”. Powyższa zasada dotyczy zarówno dokumentów tekstowych, jak i plików audio. W przypadku konwersji dokumentu tekstowego na audio, przy nazwie pliku wynikowego musimy podać dodatkowo trzy litery rozszerzenia tj. format, w jakim ma być on zapisany. Np. „audio book.mp3” – zapisze tekst do pliku o formacie „mp3” a ta sama nazwa, ale z rozszerzeniem „.wav” stworzy plik w formacie wave.

Syntezator mowy musi być zdefiniowany w następujący sposób:

voice_name [r Rate] [p Pitch]

gdzie:

voice_name – nazwa syntezatora – syntezator musi być nazywany jednym słowem ,tak jak jest widoczny w systemie np. „scansoft”,

[r – rate] – szybkość mowy,

[p – pitch] – wysokość mowy

Każdy z powyższych parametrów oddzielony jest od pozostałego znakiem spacji np. „scansoft p10 r14”.

Opcje programu:

-c – czytaj tekst ze schowka

-d – podziel plik tekstowy (składnia –d nazwa-pliku nazwa-folderu),

-m – uruchom program w zminimalizowanym oknie – nie dotyczy wersji programu bez interfejsu graficznego,

-n – odczytywanie tekstu podanego w linii poleceń (trzeba go łączyć z parametrem „r”),

-r – odczytywanie pliku od początku,

-s zapisywanie dokumentu tekstowego do pliku audio,

-t – konwersja plików zawierających tekst do pliku „.txt” (składnia polecenia –t „plik1” „plik2”)

-q – wyjście z programu po całkowitym odczytaniu dokumentu

Pojedynczy parametr opcji musi być poprzedzony znakiem („-” – minusa) np. „balabolka -c”. Podając więcej niż jeden parametr opcji, tylko przed pierwszym stawiamy znak („-” – minus), następny piszemy zaraz za nim bez tego znaku np. „balabolka -cq”. Wysyłając do Balabolki tekst napisany w linii poleceń musimy ująć go w znaki cudzysłowu. Poza tym stosując ten przełącznik, musimy połączyć go z przełącznikiem „-r” np. (balabolka -rn „taki tekst do odczytania”).

Kilka przykładów wywołania programu z wiersza poleceń:

Balabolka –c scansoft – odczytanie tekstu z systemowego schowka przez syntezator mowy o nazwie scansoft

Balabolka –rm „d:\moje dokumenty\czytanka dla janka.pdf” – odczytanie od początku pliku o nazwie „czytanka dla janka” znajdującego się na dysku „d” w folderze „moje dokumenty”. Program będzie pracował w zminimalizowanym oknie.

Balabolka -rmq „d:\wypracowanie.txt” scansoft r10 – odczytanie od początku pliku o nazwie „wypracowanie” przez syntezator scansoft. Syntezator odczytuje tekst z szybkością 10. Program pracuje w zminimalizowanym oknie. Po zakończeniu czytania program zostanie zamknięty.

Balabolka -rnq „słucham to, co napisałem” scansoft – program odczyta tekst znajdujący się w cudzysłowie przy pomocy syntezatora scansoft. Po zakończeniu czytania program zostanie zamknięty.

Balabolka –d „c:\moja notatka.txt” „c:\moje dokumenty” – otwiera plik o nazwie „moja notatka.txt” dzieli go na fragmenty i zapisuje do folderu „moje dokumenty”. Program pracuje w zminimalizowanym oknie, po zakończeniu zadania kończy pracę.

Balabolka –t „c:\kotwice.epub” „c:\moje dokumenty\kotwice.txt” – konwertuje plik z formatu „.epub” na format „.txt” i zapisuje go w folderze „moje dokumenty”. Program pracuje w zminimalizowanym okienku, po zakończeniu konwersji kończy pracę.

Na zakończenie tego artykułu wszystkich, którzy mieliby problemy z Balabolką zapraszam do kontaktu. Z autorem artykułu można skontaktować się wysyłając maila na adres s.piekarski@uw.edu.pl