НОВИНИ

Озвучка текстів через технологію text-to-speech: Vector презентує ШІ-фічу

23 Травня 2025, 16:35
3 хв читання
Юлія Ткач Шеф-редакторка, авторка і ведуча подкасту «Хто ці люди».
Режим читання збільшує текст, прибирає всю зайву інформацію зі сторінки і дозволяє зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Режим читання

Режим читання збільшує текст, прибирає всю зайву інформацію зі сторінки і дозволяє зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.

Vector Media у партнерстві з Respeecher запускає функцію озвучування матеріалів з допомогою технологій ШІ. Це перший кейс на світовому медіаринку, коли аудіо доступне з будь-якого рядка, а не тільки з початку. Розповідаємо деталі.

Що сталося

Vector — ненудне медіа про креативну економіку, запускає функцію озвучування матеріалів з допомогою ШІ. Це перший кейс на світовому медіаринку, коли аудіо доступне з будь-якого рядка, а не тільки з початку. Цією розробкою Vector прибрав бар’єр візуального контакту: функція розширить доступ до матеріалів будь-кому, зокрема людям із порушеннями зору.

Ісмаїл Осбанов, СЕО Vector, пояснює: «Ми прагнули змінити парадигму споживання контенту не тільки в Україні, а й у світі. Усе прискорюється, тож текстові матеріали не завжди зручні для читача.

Уявіть: ви читаєте статтю вдома, і розумієте, що вам вже пора виходити у справах. Ви не вимкнете телефон і забудете про неї, а дослухаєте в машині».

Як це працює

Технічним партнером розробки став Respeecher — київський стартап, що працює з голосовими моделями. Для цього компанія створила голосові моделі з повною імітацією. Одні з відомих їхні проєктів — омолодження голосу Люка Скайвокера у серіалі «Мандалорець», повернення легендарного голосу Дарта Вейдера, розробка голосу Вінса Ломбарді для голограми Super Bowl та інші. Фіча базується на технології text-to-speech. 

Чиї голоси вже є на сайті

  • Positiff — український саунд-продюсер, артист. 
  • Артем Бородатюк — підприємець, засновник холдингу Netpeak Group.
  • Ігор Фінашкін — засновник креативної агенції I AM IDEA.
  • Гарік Корогодський — бізнесмен, меценат, письменник і блогер.
  • Сабіна Мусіна — українська підприємиця, співзасновниця мережі барів G.Bar та блогерка.
  • Роман Бахарєв — музикант, розвиває сольний проєкт ВAH.ROMA.

«Для роботи в кіно ми зазвичай використовуємо speech-to-speech, тобто коли один живий актор грає голосом іншого. Але у випадках, коли необхідна повна автоматизація процесу, ось як, наприклад, озвучення статей, необхідно використовувати text-to-speech, коли машина сама генерує природний голос із тексту», розповідає Дмитро Бєлєвцов, СТО Respeecher.

Новинку представили вчора, на закритому заході. Функція буде доступна на сайті vector.media з понеділка, 26 травня. Перший місяць функція буде в бета-тесті. Ознайомитися з оновленням можна буде, відкривши будь-який матеріал.

Знайшли помилку? Виділіть її і натисніть Ctrl+Enter

Партнерські матеріали

Мільйон на дрони й мистецький маніфест: як синергія креативників, бізнесу та громади долає глобальні виклики
01 БІЗНЕС
Мільйон на дрони й мистецький маніфест: як синергія креативників, бізнесу та громади долає глобальні виклики
Як змінюється ринок праці для молоді: аналітика robota.ua й День кар’єри в КАІ
02 БІЗНЕС
Як змінюється ринок праці для молоді: аналітика robota.ua й День кар’єри в КАІ
12 українок, які змінюють світ: стартує голосування за національну премію «Жінка України 2025»
03 БІЗНЕС
12 українок, які змінюють світ: стартує голосування за національну премію «Жінка України 2025»
«9 чи 10 запитань» на YouTube: Plarium відповідає на питання аудиторії в серії геймдев-інтерв’ю
04 ТЕХНОЛОГІЇ
«9 чи 10 запитань» на YouTube: Plarium відповідає на питання аудиторії в серії геймдев-інтерв’ю 
Завантаження...