Як це працює

Інновації, меми та залаштункові інтриги. Навіщо OpenAI презентувала ШІ-асистента саме зараз

17 Травня 2024, 09:00
10 хв читання
dmitriy-koshelnik
Дмитро Кошельник Ексшеф-редактор Vector, COO венчур-білдера Mission Possible
Режим читання збільшує текст, прибирає всю зайву інформацію зі сторінки і дозволяє зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Режим читання

Режим читання збільшує текст, прибирає всю зайву інформацію зі сторінки і дозволяє зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.

13 травня в OpenAI провела презентацію нової моделі — GPT-4o. CEO OpenAI Сем Альтман вже встиг назвати її кращою — «розумною та швидкою». Інтернет-користувачі відреагували на презентацію OpenAI захватом та мемами. А ще — пригадали фільм «Вона» з Хоакіном Феніксом, де головний герой закохується в ШІ-асистентку. У своїй колонці шеф-редактор Vector Дмитро Кошельник розмірковує, що саме та навіщо нам показали.

Коротко про GPT-4o

OpenAI вміло підхопила звання «головного презентатора» в Apple. Її продукти виглядають цікавішими за черговий iPhone чи iPad. Я ледь не заснув на останній презентації Apple. Не врятував навіть дуже тонкий iPad Pro. Мабуть, після певного етапу зменшення товщини вже не виглядає цікавою перевагою чи здобутком, принаймні мені. Як виглядають подібні презентації у Google — не говоритиму. У більшості я читаю їх уже текстом. Не виходить у Сундара Пічаї та топменеджменту компанії зацікавити мене новинками.

З OpenAI цікавіше, бо є постійне відчуття — тобі покажуть щось визначне. Десь так відчувались презентації Apple в кінці 2000-х та першій половині 2010-х. Цього разу виступив не сам Альтман, а CTO OpenAI Міра Мураті разом з лід-дослідниками. Головною фішкою було не просто оголошення про запуск GPT-4o та її можливості, а те, як наочно це показали — буквально низку реальних кейсів, які змушують думати: «О, я б міг застосувати це так…». 

Але звернемося до конкретики. GPT-4o — мультимодальна модель. Це означає, що вона вміє працювати не лише з текстом, але й з аудіо та зображеннями. Словом, модель пропонує широкий спектр можливостей. Наприклад, вміє писати код, визначати емоції, розпізнавати вирази обличчя, розв’язувати математичні задачі, аналізувати фото та навіть жартувати. 

Інший важливий момент — швидкість моделі. Вона відгукується на аудіозапити всього за 232 мілісекунди. У середньому — 320 мілісекунд. В OpenAI акцентують, що це аналогічно часу реакції людини під час розмови. Також модель вміє значно краще працювати з не англійськими мовами. 

А ще — на відміну від тієї ж GPT-4 Turbo, GPT-4o буде доступна й користувачам безоплатної версії. Проте є нюанси — кількість запитів обмежать залежно від попиту на користування моделлю. 

А тепер перейдемо до того, на чому справді фокусувались на презентації OpenAI — аудіо та потенційних можливостях GPT-4o, як голосового асистента. До речі, незрозуміло, коли вони стануть доступними всім. Альтман пише, що доведеться почекати. У пресрелізі ж OpenAI обіцяли випустити нову версію голосового режиму з GPT-4o в альфа-версії вже найближчими тижнями. Правда, лише в межах ChatGPT Plus.

«Вона» чи ні

Значна частина презентації — демонстрація аудіоможливостей GPT-4o. Вона доповнювалась відео, де показували різні кейси використання моделі в ролі голосового помічника, який вміє:

  • бути перекладачем для людей, які не розмовляють однією мовою;
  • давати поради щодо зовнішнього вигляду на співбесіді;
  • виконувати математичні завдання;
  • вітати з днем народження;
  • допомагати вчити інші мови;
  • саркастично жартувати.

Цей список, схоже, можна доповнювати, але головне інше. Те, що показали OpenAI (поки не зрозуміло чи не «прикрасили» вони десь презентацію) дозволяє говорити, що ми нарешті отримаємо просунутого ШІ-асистента. Інтернет-користувачі провели просту паралель — фільм «Вона» з Хоакіном Феніксом. Його головний герой закохується у розвинуту операційну систему зі штучним інтелектом на ім’я Саманта. 

Частково цю тему допоміг «розгойдати» сам Альтман. Днями перед презентацією він лайкнув допис в X користувача Спенсера Шиффа. Той написав: «Дивлюсь “Вона”, щоб підготуватися до понеділка». Чому лайк Альтмана взагалі когось зацікавив? Бо до цього моменту підприємець в останнє ставив «вподобання» допису ще за 16 лютого. 13 травня Альтман вже і сам твітнув (ікснув?) «Вона».

Звичайно, до рівня фільму GPT-4o ще далеко. Проте модель справді видається ефективною в презентованих задачах, а ще звучить спонтанно та живо, наче розмовляєш не з ChatGPT, а асистентом AGI-рівня чи іншою людиною. Цьому звичайно ж допомагає правильно підібраний жіночий голос. 

Варто зазначити, що на паралелях з «Вона» Альтман не зупинився. У подкасті The Logan Bartlett Show CEО OpenAI розповідав про використання GPT-4o як ще одного «каналу», коли працює. Залишу фрагмент цього епізоду, який знайшов у X.

Так, доволі обережно і різними способами нам крок за кроком доносили, що OpenAI пропонує щось дуже інноваційне, розробка, якої немає більше ні у кого. А саме на цьому зараз стоїть і бренд самої компанії, і Альтмана як «Оппенгеймера у світі ШІ».

Навіщо OpenAI ця презентація

Тут ми переходимо до досить спекулятивного фрагмента тексту, в якому спробуємо розібратися, а чому нам показали все це саме зараз.

Передати привіт Google

Презентація OpenAI відбулась в понеділок напередодні конференції I/O від Google. Було точно зрозуміло, що Google знову багато говоритиме про ШІ. Альтман і команда пішли на випередження і досить успішно здивували аудіоасистентом і безоплатним GPT-4o. 

Схоже, OpenAI вдалося зробити так, що презентоване Google не стало якоюсь прямо топтемою. Навіть більше — у мережі сотні мемів про GPT-4o, «Вона», компаній, які вб’є нова модель тощо. От такий мемний шум у відповідальний момент для головного конкурента. 

Угода з Apple

Інформація про потенційну угоду OpenAI та Apple. Згідно з Bloomberg, сторони узгоджують умови договору про використання функцій ChatGPT в наступній операційній системі iPhone — iOS 18. Apple нібито має офіційно оголосити про це на конференції для розробників WWDC, яка відбудеться 10-14 червня. Поки ніяких анонсів не було, що не дивно для Apple. Тому я б не поспішав з оголошеннями. 

Проте свою презентацію OpenAI також могла одночасно використати і для демонстрації того, що може отримати Apple. Трохи хайпу точно не завадить. Вдала презентація вже принесла численні коментарі про «смерть Siri», зокрема про це пише The Atlantic

Позов Маска

Судові розбирання з Ілоном Маском. Останній, нагадаю, подав позов проти OpenAI та Альтмана. Маск вважає, що вони зрадили закладену при заснуванні угоду щодо розробки технології на благо людства, а не на прибуток. «OpenAI перетворили на закриту де-факто дочірню компанію найбільшої технологічної компанії у світі — Microsoft. Під її новим керівництвом вона не просто розробляє, але й удосконалює AGI, щоб більше максимізувати прибуток для Microsoft, а не благо людства», — вважає Маск.

На фоні позову Маска та його дописів в тому ж X Альтман та OpenAI отримали хвилю критики та мемів щодо своєї закритості. Тепер їм є чим відповісти — найпросунутіша модель доступна всім, хоч і з обмеженнями.

Звільнення Суцкевера

OpenAI спеціально чи ні прив’язали до презентації GPT-4o ще одну важливу новину — Chief Scientist OpenAI Ілля Суцкевер йде з компанії. Ілля — один із провідних фахівців у сфері ШІ та співзасновник OpenAI. Про його бачення та вклад можна прочитати у цьому матеріалі

Причиною відходу Іллі стала участь у спробі ради директорів звільнити Альтмана минулого листопада. Після повернення Сема про подальшу долю Суцкевера нічого не розповідали. Він взагалі зник з радарів та породив тонни мемів про «зниклого Іллю». І от тепер очевидне стало правдою.

Разом із Суцкевером OpenAI залишає і Ян Лейке. Він разом з Іллею очолював так звану команду «суперузгодження» (Superalignemt). Фактично вони займались створенням систем штучного інтелекту так, щоб вони узгоджувалися з людськими цінностями та цілями. Чому це важливо — читайте тут.

Варто зазначити, що Superalignemt-підрозділ втратив не лише керівників, але й дослідників. У квітні стало відомо, що OpenAI звільнила Павла Ізмайлова та Леопольда Ашенбреннера, які були людьми Cуцкевера. Причиною називали витік інформації. Також компанію покинув ще один член Superalignemt-відділу — Вільям Сондерс.

Тепер незрозуміло, що чекає на команду суперузгодження і наскільки це взагалі пріоритет для OpenAI. Проте вважається, що бажання Альтмана швидко розвивати та випускати нові моделі стало однією з причин його звільнення у листопаді. Схоже, тепер у Сема немає опозиції.

На що вплине ця презентація

Якщо коротко — майже ні на що. Так, у мережі ви можете знайти списки професій, які нібито зруйнує GPT-4o — від перекладачів до рекрутерів та репетиторів. Проте все це поки суто теоретично. І так, мені теж подобаються меми про Duolingo, але навряд всім відомій «сові» щось справді загрожує.

До речі, на фоні презентації ринкова капіталізація Duolingo впала на $340 млн. Виглядає серйозно, але це нормальна реакція ринку на анонс таких продуктів. Наприклад, акції Alphabet, материнської компанії Google, впали на 2,8% — мінус понад $50 млрд до капіталізації. Проте це все незначні коливання, які можна швидко «відіграти».

З іншого боку, презентація, імовірно, «вбила» (або наблизила до закриття) низку стартапів, які намагались використати GPT для створення власних асистентів. Офіційно це станеться, коли OpenAI викотить цей продукт, або він таки з’явиться в iOS 18. Такий результат не дивує. Вищезазначені стартапи фактично ставили проти OpenAI й мали розуміти, що кожний новий продукт від Альтмана і команди може стати смертю для їхнього починання. 

Більше про це

01 ТЕХНОЛОГІЇ

Microsoft кинула виклик OpenAI та Google. Дайджест техноновин від Roosh Ventures

Додати в закладки

Будь-яку статтю можна зберегти в закладки на сайті, щоб прочитати її пізніше.

Знайшли помилку? Виділіть її і натисніть Ctrl+Enter

Партнерські матеріали

Допомогти дітям з інвалідністю комунікувати. Що відомо про переможця акселератора WinWin Deep Tech
01 ТЕХНОЛОГІЇ
Допомогти дітям із порушенням мовлення комунікувати. Що відомо про переможця акселератора WinWin Deep Tech
Освіта без кордонів: івент Study.ua відкрив нові горизонти для українських абітурієнтів
02 Суспільство
Освіта без кордонів: івент Study.ua відкрив нові горизонти для українських абітурієнтів
Навіщо бізнесу GPS-навігатор: як працює принцип мапування за Саймоном Вордлі
03 БІЗНЕС
Навіщо бізнесу GPS-навігатор: як працює принцип мапування за Саймоном Вордлі  
Кібербезпека 2025: як український бізнес захищає себе від кібератак через ПЗ за допомогою аудитів PCI SLC
04 ТЕХНОЛОГІЇ
Кібербезпека 2025: як український бізнес захищає себе від кібератак через ПЗ за допомогою аудитів PCI SLC 
Завантаження...