Озвучка текстів через технологію text-to-speech: Vector презентує ШІ-фічу
Vector Media у партнерстві з Respeecher запускає функцію озвучування матеріалів з допомогою технологій ШІ. Це перший кейс на світовому медіаринку, коли аудіо доступне з будь-якого рядка, а не тільки з початку. Розповідаємо деталі.
Що сталося
Vector — ненудне медіа про креативну економіку, запускає функцію озвучування матеріалів з допомогою ШІ. Це перший кейс на світовому медіаринку, коли аудіо доступне з будь-якого рядка, а не тільки з початку. Цією розробкою Vector прибрав бар’єр візуального контакту: функція розширить доступ до матеріалів будь-кому, зокрема людям із порушеннями зору.
Ісмаїл Осбанов, СЕО Vector, пояснює: «Ми прагнули змінити парадигму споживання контенту не тільки в Україні, а й у світі. Усе прискорюється, тож текстові матеріали не завжди зручні для читача.
Уявіть: ви читаєте статтю вдома, і розумієте, що вам вже пора виходити у справах. Ви не вимкнете телефон і забудете про неї, а дослухаєте в машині».
Як це працює
Технічним партнером розробки став Respeecher — київський стартап, що працює з голосовими моделями. Для цього компанія створила голосові моделі з повною імітацією. Одні з відомих їхні проєктів — омолодження голосу Люка Скайвокера у серіалі «Мандалорець», повернення легендарного голосу Дарта Вейдера, розробка голосу Вінса Ломбарді для голограми Super Bowl та інші. Фіча базується на технології text-to-speech.
Чиї голоси вже є на сайті
- Positiff — український саунд-продюсер, артист.
- Артем Бородатюк — підприємець, засновник холдингу Netpeak Group.
- Ігор Фінашкін — засновник креативної агенції I AM IDEA.
- Гарік Корогодський — бізнесмен, меценат, письменник і блогер.
- Сабіна Мусіна — українська підприємиця, співзасновниця мережі барів G.Bar та блогерка.
- Роман Бахарєв — музикант, розвиває сольний проєкт ВAH.ROMA.
«Для роботи в кіно ми зазвичай використовуємо speech-to-speech, тобто коли один живий актор грає голосом іншого. Але у випадках, коли необхідна повна автоматизація процесу, ось як, наприклад, озвучення статей, необхідно використовувати text-to-speech, коли машина сама генерує природний голос із тексту», — розповідає Дмитро Бєлєвцов, СТО Respeecher.
Новинку представили вчора, на закритому заході. Функція буде доступна на сайті vector.media з понеділка, 26 травня. Перший місяць функція буде в бета-тесті. Ознайомитися з оновленням можна буде, відкривши будь-який матеріал.
Больше об этом
«Нам довіряють найбільші студії в Голлівуді». Як зробити продукт для рівня «Оскара» — інтерв’ю із CEO Respeecher Олександром Сердюком
Любую статью можно сохранить в закладки на сайте, чтобы прочесть ее позже.