Режим читання збільшує текст, прибирає всю зайву інформацію зі сторінки і дозволяє зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Режим читання
Режим читання збільшує текст, прибирає всю зайву інформацію зі сторінки і дозволяє зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Завершити
OpenAI оголосили, що Sora та ChatGPT об’єднують зусилля для генерації зображень, про це пише Tech Crunch. Розповідаємо, що відомо про нову функцію.
Що сталося
CEO OpenAI Сем Альтман оголосив про перше велике оновлення можливостей генерації зображень ChatGPT. Тепер чат-бот може використовувати модель GPT-4o для створення та редагування зображень і фотографій. GPT-4o вже давно імплементований до платформи чат-ботів, але досі ця модель могла створювати та редагувати лише текст, а не зображення. Альтман сказав, що власне створення зображень GPT-4o вже доступне для деяких користувачів в ChatGPT і Sora.
Sora — це також продукт OpenAI для створення відео зі штучним інтелектом для передплатників компанії у версії Pro за $200 на місяць. Можливість створювати відео та зображення незабаром стане доступною для користувачів Plus і безплатних користувачів ChatGPT, а також розробників, які використовують службу API компанії.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
GPT-4o, хоча й трохи повільніший за DALL-E 3 (ще один помічник компанії для генерації зображень), але він забезпечує створення більш точних та деталізованих зображень. Також нова функція дозволяє:
редагувати зображення;
змінювати та доповнювати деталі.
Ця функція стала можливою завдяки навчанню моделі на великому обсязі загальнодоступних та приватних даних, отриманих від партнерів, таких як Shutterstock.
Чому це цікаво
Постачальники генеративного штучного інтелекту, такі як OpenAI, стикаються з дилемою: з одного боку, навчальні дані є їхньою конкурентною перевагою, тому вони намагаються зберігати їх у таємниці, а з іншого — ці ж дані можуть стати причиною судових позовів щодо інтелектуальної власності. Такі компанії, як OpenAI, намагаються знайти баланс, пропонуючи форми відмови для творців, чиї роботи використовуються в навчальних моделях, та заявляють про повагу до прав художників, забороняючи пряму імітацію їхніх робіт.
Оновлена функція генерації зображень ChatGPT, що є аналогом експериментальної функції Google Gemini 2.0 Flash, швидко стала популярною в соцмережах, але не без проблем. Користувачі виявили, що система Gemini 2.0 Flash має вразливості, які дозволяють видаляти водяні знаки та створювати зображення персонажів, захищених авторським правом.
Нагадуємо, раніше ми розповідали, що Сем Альтман повертається до технічного напряму компанії. Фактично OpenAI розширює обов’язки СОО Бреда Лайткепа, який є «правою рукою» Сема Альтмана. Лайткеп тепер «наглядатиме за повсякденними операціями», міжнародною експансією та керуватиме ключовими партнерствами з такими технологічними гігантами, як Microsoft і Apple. Альтман зосередиться на «дослідженнях і продуктах».