Озвучка текстів через технологію text-to-speech: Vector презентує ШІ-фічу
23 Травня 2025, 16:35
3 хв читання
Юлія ТкачШеф-редакторка, авторка і ведуча подкасту «Хто ці люди».
Режим читання збільшує текст, прибирає всю зайву інформацію зі сторінки і дозволяє зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Режим читання
Режим читання збільшує текст, прибирає всю зайву інформацію зі сторінки і дозволяє зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Завершити
Vector Media у партнерстві з Respeecher запускає функцію озвучування матеріалів з допомогою технологій ШІ. Це перший кейс на світовому медіаринку, коли аудіо доступне з будь-якого рядка, а не тільки з початку. Розповідаємо деталі.
Що сталося
Vector — ненудне медіа про креативну економіку, запускає функцію озвучування матеріалів з допомогою ШІ. Це перший кейс на світовому медіаринку, коли аудіо доступне з будь-якого рядка, а не тільки з початку. Цією розробкою Vector прибрав бар’єр візуального контакту: функція розширить доступ до матеріалів будь-кому, зокрема людям із порушеннями зору.
Ісмаїл Осбанов, СЕО Vector, пояснює: «Ми прагнули змінити парадигму споживання контенту не тільки в Україні, а й у світі. Усе прискорюється, тож текстові матеріали не завжди зручні для читача.
Уявіть: ви читаєте статтю вдома, і розумієте, що вам вже пора виходити у справах. Ви не вимкнете телефон і забудете про неї, а дослухаєте в машині».
Як це працює
Технічним партнером розробки став Respeecher — київський стартап, що працює з голосовими моделями. Для цього компанія створила голосові моделі з повною імітацією. Одні з відомих їхні проєктів — омолодження голосу Люка Скайвокера у серіалі «Мандалорець», повернення легендарного голосу Дарта Вейдера, розробка голосу Вінса Ломбарді для голограми Super Bowl та інші. Фіча базується на технології text-to-speech.
Чиї голоси вже є на сайті
Positiff — український саунд-продюсер, артист.
Артем Бородатюк — підприємець, засновник холдингу Netpeak Group.
Ігор Фінашкін — засновник креативної агенції I AM IDEA.
Гарік Корогодський — бізнесмен, меценат, письменник і блогер.
Сабіна Мусіна — українська підприємиця, співзасновниця мережі барів G.Bar та блогерка.
Роман Бахарєв — музикант, розвиває сольний проєкт ВAH.ROMA.
«Для роботи в кіно ми зазвичай використовуємо speech-to-speech, тобто коли один живий актор грає голосом іншого. Але у випадках, коли необхідна повна автоматизація процесу, ось як, наприклад, озвучення статей, необхідно використовувати text-to-speech, коли машина сама генерує природний голос із тексту», — розповідає Дмитро Бєлєвцов, СТО Respeecher.
Новинку представили вчора, на закритому заході. Функція буде доступна на сайті vector.media з понеділка, 26 травня. Перший місяць функція буде в бета-тесті. Ознайомитися з оновленням можна буде, відкривши будь-який матеріал.