Jak Ivona została Alexą. Asystent Amazona z polskimi korzeniami

Data: 19.05.2020 15:35

Autor: ziemianin

cyfrowa.rp.pl

#100innowacjestulecia #Alexa #amazon #Echo #Ivona #Software #LukaszOsowsk #MichalKaszczuk #aktualnosci #codziennaprasowka #informacje #wiadomosci #syntezatormowy

Amazon stworzył najpopularniejszego na świecie asystenta głosowego. Ale technologia, która ma być kołem zamachowym cyfrowej rewolucji, to zasługa polskich innowatorów.

Jak Ivona została Alexą. Asystent Amazona z polskimi korzeniami

Ten głos znają chyba wszyscy. Kiedyś instalowany jako lektor w pirackich filmach czy spiker w dowcipnych youtubowych produkcjach internautów, wyszedł daleko poza niszę. Stał się głosem wielkiego biznesu. Zaawansowany syntezator mowy, który powstał w gdyńskim startupie Ivona Software, to przykład wielkiego sukcesu rodzimych innowatorów.

Polską technologię siedem lat temu przejął Amazon. Gigant na bazie Ivony stworzył asystenta głosowego – Alexę. Jej głos słychać dziś w domach, telefonach i windach. To ona instruuje nas, jak jechać w samochodowych nawigacjach. Czyta też choćby nazwy przystanków i stacji w autobusach i pociągach. Jest praktycznie wszędzie.

Trudna nauka języków

„Życie” Ivonie dali Michał Kaszczuk i Łukasz Osowski. 20 lat temu założyli technologiczną firmę, dziś powiedzielibyśmy startup, by rozwijać innowacyjne projekty związane z syntezą mowy. O tym, jak bardzo zaawansowane rozwiązania tworzyli, mogą świadczyć liczne nagrody, które ich produkty zbierały praktycznie co roku w prestiżowych konkursach Blizzard Challenge. Gdyńska firma szybko znalazła się więc pod obserwacją potentatów. I finalnie w 2013 r. kupił ją koncern stworzony przez najbogatszego dziś człowieka na Ziemi – Jeffa Bezosa. Amazon na bazie spółki Ivona Software w Pomorskim Parku Naukowo-Technologicznym (później w gdańskim Olivia Business Center) zbudował prawdziwą potęgę w stosunkowo młodym segmencie smart asystentów głosowych. Tort musi dzielić właściwie tylko z jednym liczącym się konkurentem – Google Assistant.

dy w 2001 r. gdyńscy studenci zakładali biznes, pewnie tylko w marzeniach myśleli o takim globalnym sukcesie. A początkowo w ogóle nie było tego w planach. Ich syntezator powstał jako naukowe wyzwanie, część pracy magisterskiej. Projekt okazał się na tyle pasjonujący i perspektywiczny, że przerodził się w działalność gospodarczą. Choć i wówczas trudno było sądzić, że to rozwiązanie podbije świat. Ivona mówiła po polsku, a jej nauka mówienia okazała się niezwykle mozolna. Dzięki pieniądzom i inżynierom z Amazona udało się przyspieszyć prace i poszerzyć możliwości tej technologii. Ivona mówi dziś wieloma językami, na liście jest ich ok. 30 i wciąż przybywają kolejne.

O skali sukcesu świadczą nie tylko rynkowe osiągnięcia Alexy, ale choćby fakt, że Michał Kaszczuk, który opracował syntezator konwersji tekstu pisanego na mowę, znalazł się kilka lat temu na liście liderów innowacji w regionie Europy Środkowo-Wschodniej New Europe 100, tworzonej przy udziale m.in. Google’a, czyli kluczowego rywala Amazona w segmencie asystentów głosowych.

Kaszczuk jeszcze przez parę lat po akwizycji Amazona kierował w koncernie inżynierami pracującymi nad produktami z rodziny Echo (to właśnie w nich Amazon „zaszywa” głos Alexy). Chodzi o tzw. inteligentne głośniki, które na naszą prośbę mogą odpowiedzieć na zadane pytanie, sprawdzić wynik meczu ulubionej drużyny piłkarskiej, przedstawić prognozę pogody na kolejny dzień, zatelefonować do znajomego, zamówić taksówkę, włączyć telewizor, wyłączyć światła w domu czy nawet zrobić zakupy.

Ivona powstawała w akademiku za pieniądze z oszczędności. Pierwszy gotowy produkt na początku trafił do osób niewidomych

Łukasz Osowski, który ukończył Wydział Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej, również po sprzedaży biznesu Amazonowi kierował w koncernie działem rozwoju w Polsce. Od roku prowadzi kolejny własny, innowacyjny biznes w Gdyni – startup Lab4Life (zespół inżynierów i naukowców z obszaru medycyny, sztucznej inteligencji i matematyki tworzy aplikację, która ma gwarantować użytkownikom zdrowsze życie).

Ruszył rynkowy boom

Ivona powstawała w akademiku za pieniądze z oszczędności. Pierwszy gotowy produkt na początku trafił do osób niewidomych, dla których system odczytywania tekstu i konwersji na mowę był szczególnie potrzebny. Dziś z silnika opracowanego przez Kaszczuka i Osowskiego korzysta ponad 100 mln osób na całym świecie. Dostępnych jest w sumie kilkanaście wersji głosu, zarówno męskich, jak i kobiecych. A popyt na tę technologię wciąż rośnie.

Syntezatory mowy to kluczowa składowa smart asystentów. Rynek takich rozwiązań przeżywa boom. Do 2025 r. średnie tempo wzrostu ma wynieść ok. 37 proc. rocznie. Z danych MR Invasion wynika, że sprzedaż takich urządzeń w 2017 r. wyniosła 2,1 mld dol. Za sześć lat, jak prognozują analitycy firmy, będzie to już 12,8 mld dol. A optymistyczne szacunki Verified Market Research wskazują poziom nawet ponad 20 mld dol.

Po jednej trzeciej tego rynku – w ujęciu globalnym – należy do Amazona i Google’a. Reszta udziałów jest mocno rozdrobniona, m.in. wśród chińskich graczy, jak Alibaba czy Xiaomi. Jeśli jednak przyjrzeć się tylko największemu rynkowi takich asystentów głosowych, czyli Stanom Zjednoczonym, to widać dominację Amazona (61 proc. w 2019 r. i prognozowane 53 proc. w 2020 r.).