Data: 30.05.2019 22:30

Autor: rebeliant

Chciałem się pochwalić swoim małym projektem, ale zanim – krótkie tło historyczne ( ͡° ͜ʖ ͡°)

Wszystko zaczęło się, kiedy w celach zarobkowych pisałem program, w którym używałem syntezy mowy. Z przyczyn nie tylko ideowych gustuję w programach napisanych na wolnej licencji i tym sposobem trafiłem na program espeak. Do swoich celów się nadaje, ale od razu rzuciła mi się w oczy jakość odbiegająca od syntezy mowy od google. Tym sposobem trafiłem na kolejny projekt common voice od mozilli, który obiecuje jakość nie gorszą od tej z google.

Czas mijał, a postęp tłumaczeń oraz proces dodawania tekstu, do nauki sieci neuronowej w języku polskim nie zadowalał… pomyślałem, że narzekaniem nic nie zdziałam i zajrzałem do platformy do współpracy. Po przeczytaniu krótkiej instrukcji dodawania tekstu dowiedziałem się, że materiał musi znajdować się w domenie publicznej i prawdopodobnie stąd był problem w znalezieniu dobrej jakości zdań. Tutaj moja historia zmienia bieg, ponieważ w poszukiwaniach ciekawego tekstu trafiłem do archiwum cyfrowego Biblioteki Narodowej, a tam moją uwagę przykuła krótka książka (będąca w domenie publicznej) polskiego pisarza Feliksa Konecznego, o tytule "Kościół jako polityczny wychowawca narodów". Temat na tyle ciekawy i bieżący, że nie minął jeszcze wieczór, a książkę przeczytałem i przełożyłem ze skanów stron – na teksty przerobione przez xelatex (a wcześniej tesseract ) w formatach A4 i A6 (ten drugi jest przyjemniejszy na wąskich ekranach).

Nie powiem, dzieła Feliksa Konecznego są na tyle porywające, że już jestem w trakcie przekładania jego kolejnej książki na tekst i w głowie lęgną mi się coraz to nowe pomysły, jak ten proces dalej automatyzować i ulepszać. Pytanie tylko, czy ktoś to w ogóle będzie czytał. Jeśli są chętni – będę bardzo szczęśliwy mogąc wam udostępniać kolejne książki, a kiedyś, kto wie, może ten projekt poszerzy się o chętnych ludzi :)

Do pobrania:

#opensource #ksiazki #projekt #mozilla

PS

Zapraszam do projektu common voice!