Apple випустила ШІ-модель, яка може редагувати зображення на основі текстових команд
08 Лютого 2024, 12:30
2 хв читання
Додати в закладки
Будь-яку статтю можна зберегти в закладки на сайті, щоб прочитати її пізніше.
Далі
Завершити
Юлія ТкачШеф-редакторка, авторка і ведуча подкасту «Хто ці люди».
Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Режим читання
Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Завершити
Apple випустила MGIE, модель штучного інтелекту, яка може редагувати зображення на основі текстових команд, пише Engadget. Розповідаємо деталі.
Що сталося
Apple спільно з дослідниками з Каліфорнійського університету в Санта-Барбарі розробила MLLM-Guided Image Editing (MGIE). Модель штучного інтелекту з відкритим вихідним кодом призначена для редагування зображень на основі тексту користувача. Вона використовує мультимодальні великі мовні моделі (MLLM).
MLLM здатні перетворювати прості або неоднозначні текстові підказки на детальніші та зрозуміліші інструкції, яким може слідувати сам фоторедактор. Наприклад, якщо користувач хоче відредагувати фотографію піци з пепероні, щоб зробити її «більш здоровою», MLLM може інтерпретувати це як «додати овочеву начинку» і відповідним чином відредагувати фото.
Також MGIE може також обрізати, змінювати розмір і обертати фотографії, покращувати їхню яскравість, контрастність і колірний баланс. А ще редагувати певні ділянки фотографії і, наприклад, змінювати волосся, очі та одяг людини на ній, або видаляти елементи на задньому плані.
Apple випустила модель через GitHub, але зацікавлені також можуть спробувати демо-версію на Hugging Face Spaces. Не відомо, чи буде Apple використовувати її у своїх продуктах.
Знайшли помилку? Виділіть її і натисніть Ctrl+Enter