Нова функція: тепер користувачі ChatGPT можуть генерувати зображення
OpenAI оголосили, що Sora та ChatGPT об’єднують зусилля для генерації зображень, про це пише Tech Crunch. Розповідаємо, що відомо про нову функцію.
Що сталося
CEO OpenAI Сем Альтман оголосив про перше велике оновлення можливостей генерації зображень ChatGPT. Тепер чат-бот може використовувати модель GPT-4o для створення та редагування зображень і фотографій. GPT-4o вже давно імплементований до платформи чат-ботів, але досі ця модель могла створювати та редагувати лише текст, а не зображення. Альтман сказав, що власне створення зображень GPT-4o вже доступне для деяких користувачів в ChatGPT і Sora.
Sora — це також продукт OpenAI для створення відео зі штучним інтелектом для передплатників компанії у версії Pro за $200 на місяць. Можливість створювати відео та зображення незабаром стане доступною для користувачів Plus і безплатних користувачів ChatGPT, а також розробників, які використовують службу API компанії.
GPT-4o, хоча й трохи повільніший за DALL-E 3 (ще один помічник компанії для генерації зображень), але він забезпечує створення більш точних та деталізованих зображень. Також нова функція дозволяє:
- редагувати зображення;
- змінювати та доповнювати деталі.
Ця функція стала можливою завдяки навчанню моделі на великому обсязі загальнодоступних та приватних даних, отриманих від партнерів, таких як Shutterstock.
Чому це цікаво
Постачальники генеративного штучного інтелекту, такі як OpenAI, стикаються з дилемою: з одного боку, навчальні дані є їхньою конкурентною перевагою, тому вони намагаються зберігати їх у таємниці, а з іншого — ці ж дані можуть стати причиною судових позовів щодо інтелектуальної власності. Такі компанії, як OpenAI, намагаються знайти баланс, пропонуючи форми відмови для творців, чиї роботи використовуються в навчальних моделях, та заявляють про повагу до прав художників, забороняючи пряму імітацію їхніх робіт.
Оновлена функція генерації зображень ChatGPT, що є аналогом експериментальної функції Google Gemini 2.0 Flash, швидко стала популярною в соцмережах, але не без проблем. Користувачі виявили, що система Gemini 2.0 Flash має вразливості, які дозволяють видаляти водяні знаки та створювати зображення персонажів, захищених авторським правом.
Нагадуємо, раніше ми розповідали, що Сем Альтман повертається до технічного напряму компанії. Фактично OpenAI розширює обов’язки СОО Бреда Лайткепа, який є «правою рукою» Сема Альтмана. Лайткеп тепер «наглядатиме за повсякденними операціями», міжнародною експансією та керуватиме ключовими партнерствами з такими технологічними гігантами, як Microsoft і Apple. Альтман зосередиться на «дослідженнях і продуктах».
Больше об этом
Adobe випустила конкурента Sora від OpenAI
Любую статью можно сохранить в закладки на сайте, чтобы прочесть ее позже.