24.01.2023

Новости

Технологии ИИ на службе книг

Российские издательства и книжные сервисы все активнее внедряют технологии искусственного интеллекта для озвучивания аудиокниг. Планируется, что алгоритмы позволят значительно удешевить и ускорить производство и увеличить продажи. Однако, конечно, можно с уверенностью сказать, что на данном этапе ИИ еще не способен полноценно заменить профессионального диктора. Например, алгоритмы еще не умеют правильно интонировать книги. Кроме того, автоматическая озвучка подходит не для всех жанров литературы.

Принадлежащий МТС книжный сервис «Строки» в текущем году планирует озвучить более 10 тыс. произведений с помощью платформы Audiogram. В ее основе используют нейронные сети, машинное обучение технологии обработки языка. Программа позволяет синтезировать речь, расставлять ударения и паузы. Проект разработан подразделением MTS AI. На начальном этапе ведется работа над 600 произведениями. Сейчас на подготовку первоначальной версии аудиокниг с помощью ИИ уходит около 30–60 минут, а студийная запись, сделанная живым диктором, занимает до нескольких дней.

Озвучку с помощью ИИ развивает и ГК «ЛитРес». «Такую озвучку мы запустили еще осенью 2020 года, но активно использовать начали осенью 2022 года. Она основана на технологии распознавания и синтеза речи SpeechKit, на которой работает голосовой помощник «Алиса», — говорит Евгений Селиванов, директор департамента по развитию «ЛитРес». С помощью технологии SpeechKit в прошлом году было озвучено более 100 тыс. часов аудиокниг. В 2022 году «ЛитРес» создал 6 тыс. книг, записанных профессиональными дикторами и 3 тыс. книг с помощь. ИИ. По оценкам Евгения Селиванова, себестоимость записи книг при помощи новых технологий составляет примерно 400-700 рублей.

ИИ активно использует холдинг «Эксмо-АСТ» для прогнозирования тиража допечаток, анализа потенциала рукописи на основе данных о прошлых продажах, а в компании Alpina Digital, входящей в ИГ «Альпина, озвучили 86 книг из своего портфеля с помощью искусственного интеллекта. Конечно, пока это нельзя назвать регулярной практикой: ИИ уступает живым чтецам, голос программы несовершенен, и на продажах это может сказаться негативно. «Пользователи очень благожелательно относятся к озвучке роботами, если не сталкиваются с проблемами неправильных ударений или интонаций, поэтому активное развитие книжной отрасли в этом направлении очевидно», — считает Николай Боронин, руководитель аудиопроектов Alpina Digial.



Еще новости / Назад к новостям