Audioteka wypuściła pierwszy audiobook czytany przez AI

„Gaming na giełdzie” to pierwszy wyprodukowany przez Audiotekę audiobook przeczytany przez sztuczną inteligencję. Producenci Audioteki wybrali książkę autorstwa Pawła Sugalskiego, ponieważ zawiera wiele danych i technicznych pojęć, których czytanie stanowi obecnie wyzwanie dla AI. Produkcja jest już dostępna dla użytkowników Audioteka Klub.

Od roku w studiu nagraniowym Audioteki trwały testy weryfikujące, w jaki sposób algorytmy mogą usprawnić proces produkcji audiobooków, jednak twórcy zaznaczają, że AI będzie wykorzystywana jedynie w tych obszarach, w których jej specyficzne funkcje mogą podnieść jakość doświadczenia odbiorców, ułatwiając przyswojenie treści.

Idea wygenerowania audiobooka przy użyciu AI wzięła się z chęci eksploracji nowych rozwiązań i dostosowania się do zachodzących zmian. Chcieliśmy przekonać się, jak w praktyce przebiega praca z algorytmem sztucznej inteligencji i jakie wyzwania stawia – komentuje Arkadiusz Seidler, CEO Audioteki.

Realizacja projektu „Gaming na giełdzie” zajęła dwukrotnie więcej czasu niż tradycyjne nagranie. Wynikało to z konieczności bardziej szczegółowego opracowania i przygotowania tekstu, niż przy standardowej produkcji. W celu dostosowania akapitu do wymagań AI, najpierw generuje się go w wersji testowej. Jest to podstawą do zidentyfikowania błędów interpretacyjnych i intonacyjnych. Następnie, stosując znaki specjalne, interpunkcyjne oraz rozróżniając wielkość liter, wprowadza się korekty do tekstu i ponownie go generuje. Proces ten powtarza się aż do uzyskania oczekiwanego efektu, zatem jeśli dany tekst jest poprawny, łączy się go z wygenerowanymi wcześniej fragmentami, a jeśli zawiera błędy, należy generować fragment aż do otrzymania idealnego rezultatu.

Mimo że AI skutecznie rozpoznaje język i poprawnie akcentuje większość słów, to miewa trudności z czytaniem liczebników i krótkich wyrazów, które często interpretuje jako skróty. W związku z tym, zadaniem realizatora jest opracowanie tekstu w taki sposób, aby był on prawidłowo interpretowany przez AI – proces ten można porównać do programowania. I tak na przykład specjalnej transkrypcji wymagał zwrot „gry online” – dopiero zapis „-GRy on’lajn” pozwalał sztucznej inteligencji na odpowiednie przeczytanie tego określenia – komentuje Bartosz Sroczyński, Kierownik studia nagrań i postprodukcji w Audiotece.

W aplikacji Audioteki “Gaming na giełdzie” jest dostępny bezpłatnie dla użytkowników Audioteka Klub lub do kupienia na stronie www dla pozostałych odbiorców.

Spółka zamierza kontynuować prace nad wykorzystaniem AI w procesie tworzenia audiobooków. Audioteka deklaruje, że prace testowe w zakresie sztucznej inteligencji wypadły pozytywnie, więc jeszcze w tym roku zamierza stworzyć z użyciem AI kolejne produkcje. Firma podkreśla, że działa ze szczególną dbałością o ochronę własności intelektualnej w przestrzeni cyfrowej. Nadal priorytetem Audioteki jest nagrywanie treści we współpracy z najlepszymi polskimi lektorami i aktorami, jednak w przypadku audiobooków, których treść i fabuła mogą być wsparte przez sztuczną inteligencję, zamierza wykorzystywać technologię AI.