Respeecher запустив україномовний сервіс Text-to-Speech для ШІ-агентів і брендових асистентів. Про це команда повідомила Vector. Розповідаємо деталі.
Що сталося
Український стартап Respeecher, відомий співпрацею з Netflix, HBO та Paramount, запустив україномовний сервіс Text-to-Speech, який дає змогу ШІ-агентам, чат-ботам і брендовим асистентам розмовляти природною українською мовою без іноземного акценту.
Платформа дозволяє користувачам конвертувати текст в аудіо українською після реєстрації. Доступна бібліотека голосів різного віку, гендеру та тембру, які можна використовувати для реклами, анонсів, аудіокниг, подкастів або ШІ-асистентів. Компанії можуть інтегрувати сервіс через API.
Respeecher заявляє, що відтворення відбувається в режимі реального часу — із затримкою 100–200 мс. Модель також можна натренувати на голосі працівника компанії або публічної особи за їхньої згоди.
Нагадуємо, що Vector у партнерстві з Respeecher запустив функцію озвучування матеріалів за допомогою технологій ШІ. Це перший кейс на світовому медіаринку, коли аудіо доступне з будь-якого рядка, а не тільки з початку. Детальніше про фічу та як вона працює, можете прочитати тут.
Чому це цікаво
Respeecher заявляє, що модель тренували на сотнях годин записів носіїв мови, завдяки чому вдалося уникнути синтетичного звучання, характерного для іноземних TTS-рішень. Засновники наголошують, що їхня мета, щоб українські сервіси заговорили автентичною українською, включно з діалектами й суржиком.
Також стартап зазначив, що не клонує голоси без згоди їхніх власників. Голосові актори, які надали свої голоси каталогу, отримують 25% роялті. Усі згенеровані аудіо проходять модерацію з міркувань безпеки — на тлі зростання кількості випадків голосових шахрайств у світі. Зокрема, випадок у Гонконгу, де за допомогою діпфейку голосу фінансового директора шахраї заволоділи $25 млн, або випадок у США з аудіодіпфейком Джо Байдена під час дзвінків виборцям. Цю ж платформу використали в антиукраїнський інфокампанії на початку повномасштабної війни.