Досвід і думки

Як створити та натренувати власну ШІ-модель без технічного досвіду — 4 кроки

09 Вересня 2023, 13:00
7 хв читання
Матеріал успішно додано в закладки Досягнуто максимальної кількості закладок
Додати в закладки

Будь-яку статтю можна зберегти в закладки на сайті, щоб прочитати її пізніше.

Romana Muran
Романа Муран Пишу, потім редагую, а потім знову пишу
Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Режим читання

Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.

Створення власної ШІ-моделі — уже абсолютно досяжне завдання, навіть якщо у вас немає технічних навичок. Ольга Мучник, Innovation and Strategy Lead ISD Group, поділилася власним досвідом користування ШІ-інструментом Runway. 

Усього за 20 хвилин і з 20 референсами вона створила модель, що генерує тату-ескізи за побажаннями. Ще один експеримент авторки — ШІ, який генеруватиме її портрети в різних образах — від лікарки до астронавтки. Цей матеріал — нагода задуматися, для яких поточних завдань вам варто натренувати свою мережу.

Звідки ідея

У вересні 2021-го пройшов хакатон компанії Reface з машинного навчання та штучного інтелекту. Він об’єднав технічних спеціалістів з представниками креативних індустрій.

Мене цікавило два питання: 

  • як людина без серйозного технічного бекграунду може почати використовувати ШІ для професійних або творчих завдань; 
  • як бізнес може застосовувати власні моделі не тільки для великих проєктів, а й для поточної роботи. 

Після знайомства з багатьма ML-інженерами на хакатоні я задумалася, як натренувати модель для генерації ескізів татуювань в потрібному стилі. 

Перші спроби

У мене було відчуття, що всі алгоритми Pinterest чи Google не в змозі надати ескіз «це точно воно». Ніби близько, але багато хочеться змінити й відкоригувати. 

Ми скооперувалися з ML-інженером, оскільки тоді всю роботу з генерації та навчання міг зробити тільки він. Я ж могла лише давати референси. Спробували кілька моделей. Більш-менш зрозумілі результати отримали від використання моделі CLIP та донавчання її на власних зображеннях. 

Але їх немає сенсу зараз наводити, оскільки вони були дуже далекими від бажаного. Про те, щоб зі згенерованим ескізом можна було йти до тату-майстра, навіть мова не йшла.

Моя власна модель

Тепер, два роки потому, я — та сама нетехнічна людина (що не програмує, не користується графічними редакторами та не вміє малювати) — можу отримувати зображення, які тільки собі уявляла. 

Крім того, можна вже не просто генерувати словами, а будувати під себе модель. Наприклад, ці результати отримані за 20 хвилин. Модель навчена всього на 20 зображеннях посередньої якості.

Як вчити свою модель

Я користувалася сервісом Runway. У ньому зрозумілий інтерфейс та послідовність дій. Потрібно: 

  1. Зареєструватися на сайті Runway та перейти в розділ AI Training. 
  2. Натиснути Train A New Model.
  3. Обрати режим (Portrait Generator, Animal Generator, Custom Generator).
  4. Завантажити 15-30 зображень для навчання. 

Далі все проходить автоматично. Жодних додаткових бібліотек, файлів для запуску і тим паче взаємодії з Github не потрібно. Генерація виконується на сервері, тому вимог до потужності комп’ютера немає.

Коли модель готова, в запиті описується, що вам потрібно (як в будь-якому генераторі), і обирається не дефолтна модель, а ваша. 

Місячна підписка Runway коштує $15 і передбачає безоплатне навчання однієї моделі. За кожну додаткову модель потрібно заплатити $10. Вартість генерації одного зображення у власній моделі залежить від кількості зображень, розміру та кількості придбаних кредитів і коливається від одного до п’яти центів.

Експеримент 1. Розробка ескізів тату

Фото для навчання я обирала хаотично. Зберігала в теці те, що сподобалося з пошуковика. Цікаво, що модель підказала мені «мій» паттерн, який я не зауважувала. 

Тільки коли я побачила, що генерує модель, зрозуміла, що мені найбільше подобаються структурні, ніби вітражні, крила. 

Після завантаження навчального матеріалу вже можна додавати до запиту критерії на кшталт «довгий хвіст» чи «довгі крила», змінювати кольори та кількість фігур, робити крила прозорими чи заповненими кольором, обирати стиль. 

Для порівняння, я спробувала згенерувати тату з однаковим промптом у Midjourney, Clipdrop (працює на Stable Diffusion) та у власній моделі Runway: «Small dragon elegant minimalistic tattoo». 

Зверху — згенеровані зображення у Midjourney та Clipdrop (на базі Stability.ai).
Знизу — згенеровані зображення у власній моделі Runway.
Запит: «Small dragon elegant minimalistic tattoo».

Цікаво, що перші дві моделі, хоча і працюють на різних базах, за замовчуванням генерують вусатих та волохатих китайських драконів. Натомість моя без додаткових уточнень генерує саме те, що мені потрібно, — з геометричною структурою і в більш стриманому стилі. З цим уже можна спокійно приходити до тату-салона.

Експеримент 2. Власні фото

Для навчання моделі я завантажила низку власних фото. В інструкції рекомендують додавати фото в різному контексті: з різною зачіскою, мейкапом та освітленням.

Навчену на цих фото модель попросила згенерувати свій бізнес-портрет, художній студійний портрет, фото у кав’ярні, в образі шеф-кухаря, лікаря та астронавта, полігональне зображення, психоделічне, у вишиванці та костюмі і багато-багато інших варіантів. 

Ще 20 хвилин та $10 — і можна погратися з власними образами. 

Згенеровані фото я перевіряла на своїх близьких. На більшості вони мене точно впізнають. Неадекватні генерації на кшталт зображень з двома головами, скаженими очима та дивними пальцями трапляються вже рідко. Частіше проблемою є не дуже схоже зображення. Та в будь-якому разі маємо, з чого вибирати.

Якщо, наприклад, для колонки про маркетинг фільму «Барбі» мені потрібне фото на рожевому фоні, але, скажімо, в блакитному одязі для контрасту — це реально зробити за пару хвилин і кілька ітерацій. 

Висновки

Звичайні користувачі без технічних знань уже зараз можуть повноцінно застосовувати моделі для своїх рутинних завдань. Створювати ескізи прикрас, одягу, аксесуарів, генерувати візерунки і паттерни для будь-якого дизайну, розробляти конструкції меблів чи іграшок — і все це в простому інтерфейсі з високою швидкістю. 

Власні моделі ШІ — це вже історія не про FAANG-компанії FAANG — абревіатура п'яти найбільш популярних технологічних компаній: Facebook, Amazon, Apple, Netflix і Google. та величезні бюджети, а про нас з вами. 

Знайшли помилку? Виділіть її і натисніть Ctrl+Enter

Завантаження...