FOMO OFF

Людина, яка звільнила Альтмана. Хто такий Ілля Суцкевер та яким він бачить ШІ

21 Листопада 2023, 09:00
22 хв читання
Матеріал успішно додано в закладки Досягнуто максимальної кількості закладок
Додати в закладки

Будь-яку статтю можна зберегти в закладки на сайті, щоб прочитати її пізніше.

dmitriy-koshelnik
Дмитро Кошельник Придумую теми, редагую тексти, пишу про компанії і підприємців, чіпляюся до фактів.
Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Режим читання

Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.

Головною технологічною новиною минулого тижня стало несподіване звільнення Сема Альтмана з посади CEO OpenAI. Докладніше про те, що сталося та чим закінчилася ця історія, читайте за посиланнями — один та два. Суперечливе рішення ухвалила рада директорів OpenAI, до якої, зокрема, входить Ілля Суцкевер — один із провідних фахівців у сфері ШІ, співзасновник та головний науковець компанії. 

У кінці жовтня видання MIT Technology Review опублікувало великий матеріал про Суцкевера, його погляди на штучний інтелект та амбіції. Бюро перекладів для бізнесу MK:translations підготувало переклад цієї статті українською. Ми публікуємо в себе його адаптовану версію.

Це переверне світ

Ілля Суцкевер глибоко задумався, опустивши голову. Його руки широко розведені, а пальці лежать на стільниці, немов у піаніста, який готується зіграти перші ноти. Ми сидимо в тиші.

Я зустрівся із Суцкевером, співзасновником і головним науковцем (Chief Scientist) OpenAI, в офісі його компанії без розпізнавальних знаків на непримітній вулиці в районі Мішн у Сан-Франциско. Хотів дізнатися, яким буде майбутнє технології, що змінила світ і до створення якої він доклав стільки зусиль. Я також прагнув розпитати й про його власне майбутнє. Зокрема, чому створення нового покоління генеративних моделей, які стали флагманським продуктом його компанії, більше не є основним напрямом його роботи. 

Суцкевер розповів, що новим пріоритетом для нього є не розробка наступного GPT або системи для генерації зображень DALL-E, а пошук способів зупинити штучний суперінтелект (гіпотетичної технології майбутнього, появу якої він передбачає, оскільки по-справжньому вірить у розвиток індустрії), щоб він не вийшов з-під контролю.

Суцкевер розповів ще багато цікавого. На його думку, цілком можливо, що ChatGPT має свідомість (якщо придивитися). Він вважає, що світ має прокинутися та зрозуміти справжні можливості та силу технологій, які наввипередки створюють його компанія та її конкуренти. А ще він впевнений, що деякі люди одного разу вирішать об’єднатися з машинами.

Багато з того, що говорить Суцкевер, здається божевільним. Але не настільки, як це звучало б рік або два тому.

Як він зізнається, ChatGPT уже докорінно змінив очікування багатьох людей щодо майбутнього, перетворивши тезу «Цього ніколи не станеться» на «Це станеться швидше, ніж ви думаєте». 

«Важливо говорити про те, куди це все рухається», — каже він і прогнозує розвиток AGI (тобто машин, які розумом не поступатимуться людині) з такою ж впевненістю, як він прогнозував би вихід нового iPhone: «Колись у нас буде справжній AGI. Можливо, його створить OpenAI. А може, якась інша компанія».

З моменту запуску минулого листопада ChatGPT ажіотаж навколо OpenAI, перевищив усі очікування навіть в індустрії, яка відома своїм хайпом. Світові лідери прагнуть потрапити (і їм це вдається) на приватні аудієнції. У випадкових розмовах спливають назви його незграбних продуктів.

CEO OpenAI Сем Альтман значну частину літа провів у тривалому турі з метою просування компанії, де спілкувався з політиками та виступав перед великими аудиторіями по всьому світу. Але Суцкевер значно менше з’являється на публіці та рідко дає інтерв’ю. 

Він говорить виважено й неспішно. Робить довгі паузи, під час яких обдумує свої наступні слова, та прокручує питання в голові, як головоломки, що необхідно зібрати. Складається враження, що йому нецікаво говорити про себе. «Моє життя дуже просте». «Я йду на роботу, а потім додому. І не роблю більше майже нічого. Є багато соціальних занять, якими можна було б займатися, багато заходів, на які можна було б ходити. А я цього не роблю».

Але коли розмова торкається ШІ та епохальних ризиків й винагород, які він бачить в майбутньому, відкриваються перспективи: «Це буде монументально, це переверне світ. Буде “до” та “після”».

Усе краще й краще

У світі без OpenAI Суцкевер усе одно увійшов би до історії ШІ. Канадець ізраїльського походження, який народився у росії в часи радянського союзу, але з 5-річного віку виховувався в Єрусалимі (крім англійської, знає російську та іврит). Потім переїхав до Канади, щоб навчатися в Університеті Торонто у Джефрі Гінтона, піонера ШІ. Останній оприлюднив свої страхи щодо технологій, які він допомагав винаходити, раніше цього року. (Суцкевер не став коментувати заяви Гінтона, але з того, що він переорієнтувався на попередження бунту суперінтелекту, можна зробити припущення, що вони думають однаково).

Пізніше Гінтон отримав Премію Тюрінга за свою роботу над нейромережами разом із Яном ЛеКуном і Йошуа Бенжіо. Але коли Суцкевер приєднався до нього на початку 2000-х, більшість дослідників ШІ вважали нейромережі глухим кутом. За винятком Гінтона. Він уже тренував крихітні моделі, які могли продукувати короткі рядки тексту від імені лише одного персонажа, і як каже Суцкевер: «Це був початок генеративного ШІ. Було дійсно здорово — просто не дуже якісно».

Суцкевер захопився дослідженнями головного мозку, процесів його навчання і можливих способів відтворення або хоча б імітації цих процесів в машинах. Як і Гінтон, він побачив потенціал нейронних мереж і методу спроб та помилок, який той використовував для їхнього навчання (цей метод назвали глибоким навчанням). «Він ставав усе кращим та кращим», — каже Суцкевер.

У 2012 році Суцкевер, Гінтон і Алекс Крижевський (ще один аспірант Гінтона), побудували нейромережу AlexNet. Вони навчили її визначати об’єкти на фотографіях значно краще, ніж будь-яке інше програмне забезпечення, наявне в той час. Цей момент став «Великим вибухом» глибокого навчання.

Після багатьох років фальстартів вони нарешті продемонстрували неймовірну ефективність нейронних мереж з точки зору впізнавання патернів. Просто потрібно було завантажити більше даних, ніж до того використовували дослідники (цього разу — мільйон зображень з набору даних ImageNet, який з 2006 року збирала Фей-Фей Лі, дослідниця з Принстонського університету), та додати захмарні комп’ютерні потужності. 

Якісні зміни в комп’ютерній індустрії відбулися після винаходу компанією Nvidia чипа нового типу, який назвали графічним процесором (GPU).

Його розробляли спеціально для блискавичного виводу на екран візуальних елементів відеоігор, що швидко змінюються. Але обчислення, які дозволяв ефективно здійснювати GPU, тобто множення масивних сіток чисел, виявилися дуже схожими на ті, що необхідні для навчання нейронних мереж.

Наразі капіталізація Nvidia складає понад $1 трлн. Тоді вона відчайдушно намагалася знайти варіанти застосування свого нового нішевого обладнання. «Працюючи над новою технологією, ви маєте бути відкритими для будь-яких божевільних ідей. Я завжди шукаю неортодоксальні ідеї, і думка, що нейронні мережі трансформують комп’ютерні технології, була обурливо шаленою», — каже Дженсен Хуанг, CEO Nvidia. 

За словами Хуанга, коли команда в Торонто працювала над AlexNet, Nvidia надіслала їм декілька GPU на пробу. Але вони хотіли отримати найновішу версію — чип GTX 580, який дуже швидко розкуповували в магазинах. Хуанг розповів, що Суцкевер поїхав автівкою через кордон, з Торонто до Нью-Йорку, щоб купити кілька таких чипів. «Черга тягнулася на весь квартал», — каже Хуанг. «Я не знаю, як він це зробив (я майже впевнений, що їх продавали по одному в руки; у нас було дуже суворе правило про один GPU на одного геймера), але він, судячи з усього, завантажив ними весь багажник. Цей багажник, повний чипів GTX 580, змінив світ». 

Прекрасна історія, яка може виявитися вигадкою. Суцкевер стверджує, що придбав свої перші GPU онлайн. Проте у цій бурхливій індустрії міфи народжуються постійно. Сам Суцкевер поводиться скромніше: «Я подумав, що якби зміг досягти реального прогресу хоч на міліметр, вважав би це успіхом», — розповів він. «Здавалося, що до впливу на реальний світ дуже далеко, оскільки комп’ютери тоді були такими слабкими».

Після успіху AlexNet на них звернули увагу в Google. Корпорація придбала DNNresearch, дочірню компанію Гінтона, і запросила до неї Суцкевера. У Google Суцкевер довів, що можливості впізнавання патернів із застосуванням глибокого навчання можна використовувати на послідовностях даних, як-от на словах і реченнях, а також на зображеннях. «Ілля завжди цікавився мовою, — розповів колишній колега Суцкевера Джефф Дін, який наразі обіймає посаду головного науковця Google. — Протягом багатьох років ми вели чудові дискусії. Інтуїція Іллі щодо можливого розвитку подій була надзвичайно сильною».

Але Суцкевер недовго пропрацював у Google. У 2014-му йому запропонували стати співзасновником OpenAI. Нова компанія, озброєна $1 млрд (від Альтмана, Ілона Маска, Пітера Тіля, компаній Microsoft і Y Combinator) і дивовижною дозою притаманної Кремнієвій долині самовпевненості, одразу націлилася на розробку AGI. Перспективу створення останнього у той час мало хто сприймав серйозно. 

Ця самовпевненість була обґрунтованою, адже вони мали мозок Суцкевера, а не тільки гроші. До того часу він був на хвилі успіху, а можливості нейронних мереж постійно розширювалися. За словами Далтона Колдуелла, директора з інвестицій у Υ Combinator, репутація йшла попереду Іллі, і всі хотіли його залучити.

«Я пам’ятаю, як Сем [Альтман] назвав Іллю одним з найповажніших дослідників у світі», — каже Колдуелл.

«Він вважав, що Ілля зможе залучити багато найталановитіших спеціалістів у сфері ШІ. Він навіть сказав, що на думку Йошуа Бенжіо, одного з провідних експертів світу зі ШІ, навряд чи можна було знайти кращого кандидата на роль головного науковця OpenAI, ніж Ілля».

І все ж на початку OpenAI зіштовхнулася з серйозними труднощами. «Протягом певного періоду після заснування OpenAI я не дуже розумів, як ми продовжимо прогресувати», — каже Суцкевер. «Але в одному я був впевнений: не можна робити ставку проти глибокого навчання. Через пів року або рік після виникнення будь-якої перешкоди дослідники знаходили можливість обійти її тим чи іншим чином».

Його віра принесла плоди. Перша велика мовна модель GPT (generative pretrained transformer — генеративний переднавчений трансформер) від OpenAI була розроблена у 2016 році. Потім з’явилися GPT-2 і GPT-3. Слідом DALL-E, дивовижна модель перетворення тексту на зображення. Ніхто не створював нічого подібного. З кожним випуском OpenAI піднімав планку можливого.

Керування очікуваннями

Минулого листопада OpenAI випустила безплатний чатбот, у якому застосовувалися деякі чинні технології компанії. Він повністю змінив індустрію.

Тоді в OpenAI ще не розуміли, що саме створили. За словами Суцкевера, очікування співробітників компанії були дуже низькими: «Зізнаюся, хоча мені трохи ніяково — не впевнений, що варто, але якого дідька, це ж правда, — коли ми створювали ChatGPT, я не був впевнений, що він взагалі буде ефективним». Він давав неправильні відповіді на запитання замість фактів. Я думав, що він буде настільки посереднім, що люди казатимуть: «Навіщо ви це робите? Це так нудно!»

Суцкевер вважає, що головна привабливість чату полягає у його зручності. Велика мовна модель, на якій заснований ChatGPT, існувала вже кілька місяців. Але якщо вдягнути її в доступний інтерфейс і роздавати безплатно, то мільярди людей уперше дізнаються про те, що створює OpenAI та інші.

«Людей зачепив цей перший досвід користування ШІ», — каже Суцкевер. «Я думаю, що перша взаємодія з ним — це майже духовний досвід. Ти думаєш: “О боже, здається, цей комп’ютер розуміє мене”».

OpenAI отримала 100 млн користувачів менше ніж за два місяці. Більшість з них були зачаровані цією неймовірною новою іграшкою. Аарон Леві, CEO компанії Box, підсумував загальну атмосферу першого тижня після запуску у твіті: «Поява ChatGPT — один з рідкісних моментів в індустрії технологій, коли можна побачити проблиск того, як усе буде по-іншому в майбутньому». 

Це диво втрачає свою чарівність, як тільки ChatGPT говорить якусь дурницю. Але це вже не має значення. Суцкевер вважає, що людям достатньо лише зазирнути до можливого майбутнього. ChatGPT уже змінив наші горизонти.

«AGI перестав бути лайливим словом у світі машинного навчання», — каже він. «Відбулася масштабна зміна. Раніше всі вважали, що ШІ не працює, кожен крок дається дуже важко, доводиться боротися за кожен міліметр прогресу. І коли хтось приходив із гучними заявами про AGI, дослідники казали: “Про що ви? Це не працює, і це теж. Забагато проблем”. Але з ChatGPT це стало відчуватися по-іншому». 

І все змінилося лише рік тому? «Зміни почалися через ChatGPT», — каже він. «ChatGPT дав змогу мріяти дослідникам машинного навчання».

Науковці з OpenAI, які проповідували свою віру від самого початку, підживлювали ці мрії публікаціями у блогах і турами, під час яких спілкувалися з публікою. Ця стратегія спрацювала: «Тепер люди говорять про те, як далеко зайде ШІ, про AGI, про суперінтелект. Уряди обговорюють це», — каже Суцкевер. «Божевілля».

Неймовірні речі

Суцкевер впевнений, що усі розмови про технології, яких поки не існує (і, можливо, ніколи не існуватиме), — це чудово, оскільки люди більше дізнаються про майбутнє, яке він вважає неминучим. 

«AGI дозволяє робити купу дивовижних, неймовірних речей: автоматизувати надання медичної допомоги, знизити її вартість у тисячу разів і у ту ж тисячу разів підвищити якість, вилікувати безліч хвороб і насправді розв’язати проблему глобального потепління», — розповів він. «Але є й ті, хто занепокоєний: “Боже мій, чи вдасться компаніям, що займаються ШІ, керувати цією грандіозною технологією?”».

У такій обгортці AGI більше схожий на джина, який виконує бажання, а не на реальне майбутнє світу. Мало хто відмовиться від можливості рятувати життя або розв’язати проблеми зміни клімату. Але проблема уявної технології полягає в тому, що про неї можна казати що завгодно.

Про що насправді говорить Суцкевер, коли згадує AGI? «AGI — це не науковий термін. Це корисний поріг, точка відліку».

«Ідея полягає в тому… — він починає думку, потім зупиняється. — Це точка, у якій ШІ стає настільки розумним, що може виконати будь-яке завдання, яке здатна виконати людина. У цей момент можна сказати, що у вас є AGI».

Хоча про це багато говорять, лише невелика частка людей вважає його розробку неминучою. Численні дослідники впевнені, що перш ніж отримати щось подібне, нам потрібно досягти масштабних концептуальних змін, а дехто взагалі вважає, що такі зміни неможливі.

Однак саме це бачення стало рушієм діяльності Суцкевера від самого початку. «Мене завжди надихала й мотивувала ця ідея. Тоді не було назви AGI, але були розмови про нейромережу, яка б могла все. Я не завжди вірив, що це можливо. Але це була вершина, яку я намагався підкорити».

Він проводить паралель між роботою нейромереж і головного мозку. Обидві структури приймають дані, агрегують сигнали, які надходять від них, а потім вирішують, розповсюджувати їх чи ні, за допомогою простого процесу (математичного у нейромережах, хімічного та біоелектричного у мозку). Це, звісно, дуже спрощене сприйняття, але принцип такий.

«Якщо ви вірите в це, якщо ви дозволили собі повірити в це, наслідки будуть цікавими», — каже Суцкевер. «Головний з них — якщо у вас дуже велика штучна нейронна мережа, вона має бути здатна робити багато усього. Зокрема, якщо щось може зробити мозок людини, на щось подібне має бути спроможна й велика штучна нейронна мережа». 

«Якщо поставитися до цього розуміння достатньо серйозно, все можливо. І це може пояснити величезну частину моєї роботи», — каже він. 

Поки ми розмовляємо про головний мозок, мені хочеться поставити Суцкеверу питання про одну з його публікацій на сайті Х, колишньому Twitter. Сторінка Суцкевера нагадує сувій з афоризмами: «Якщо ви вважаєте інтелект найважливішою з людських якостей, вам буде складно»; «Емпатія в житті та бізнесі недооцінена»; «Ідеальне зруйнувало багато ідеально гарних речей». 

У лютому 2022 року він написав: «Теперішні великі нейромережі можуть мати зачатки свідомості», — на що Мюррей Шанахан, головний науковець Google DeepMind і професор Імперського коледжу в Лондоні, а також науковий консультант фільму «Ex Machina», відповів: «…так само, як і велике поле пшениці, — це трохи паста».

Суцкевер сміється, коли я згадую це. Чи це було тролінгом? Ні. «Вам знайома концепція Больцманівського мозку? Уявний експеримент про гіпотетичний об'єкт, що виникає в результаті флуктуації в будь-якій системі і здатний на усвідомлення свого існування. Наприклад, те, що за певних обставин окремий мозок спонтанно сформується в порожнечі космосу, із пам’яттю про те, що він існував у нашому Всесвіті, є більш ймовірно, ні ж, що весь Всесвіт еволюціонував у такий спосіб, аби уможливити існування такого мозку. », — питає він.

Він говорить (досить іронічно) про уявний експеримент з квантової механіки, названий на честь Людвіга Больцмана, фізика з 19 сторіччя. В ньому уявили, що випадкові термодинамічні флуктуації Випадкове відхилення якоїсь величини від середнього значення в певній ділянці простору чи в певний момент часу. у Всесвіті є причиною появи та зникнення мозку. 

«Наразі мені здається, що ці мовні моделі нагадують Больцманівський мозок», — каже Суцкевер. «Ви починаєте розмову з ним, говорите деякий час; потім припиняєте, і мозок ніби…» — він робить жест, ніби щось зникає. Пуфф — до побачення, мозок.

Я питаю: «Ви кажете, що поки нейромережа активна, поки вона працює, там, так би мовити, щось існує?». «Думаю, що так», — відповідає він. «Я не знаю точно, але це можливість, проти якої дуже важко заперечити. Але хто знає, що відбувається, вірно?»

ШІ, але не той, який ми знаємо

Поки інші сушать голову над ідеєю машин, які можуть досягти людського рівня інтелекту, Суцкевер готується до появи спроможних перевершити нас. Він називає їх штучним суперінтелектом: «Вони бачитимуть усе глибше. Побачать те, що ми не можемо».

Знову ж таки, мені важко зрозуміти, що це насправді означає. Людський інтелект — це наш еталон того, що таке інтелект. Що Суцкевер має на увазі під інтелектом розумнішим за людський?

«Ми бачили приклад дуже вузького суперінтелекту у вигляді AlphaGo», — каже він. 2016 року ШІ від DeepMind, навчений грати в настільні ігри, переміг Лі Седоля, одного з кращих гравців го у світі, у матчі з 5 партій із рахунком 4:1. «Він зрозумів, як грати в го способами, відмінними від тих, які людство виробляло тисячоліттями», — каже Суцкевер. «У нього з’явилися нові ідеї».

Суцкевер має на увазі славнозвісний «хід 37» AlphaGo. Під час другої партії проти Седоля один із ходів ШІ збентежив коментаторів. Вони подумали, що AlphaGo помилився. Насправді це був виграшний хід, якого ніхто ще не бачив за всю історію гри. «Уявіть собі такий рівень проникливості, але в усьому», — каже Суцкевер. 

Саме такі думки призвели Суцкевера до найбільшої зміни в кар’єрі. Разом з Яном Лейке, колегою з OpenAI, він створив команду, яка працюватиме над так званим «суперконтролем» (superalignment). «Контроль» або «узгодження» (alignment) — це сленговий термін, який означає розробку моделей ШІ, які робитимуть тільки те, що ви хочете, і більше нічого. «Суперконтроль» — це термін, який OpenAI використовує для позначення контролю суперінтелекту.

Їхня мета — розробити набір відмовостійких процедур для створення та контролю цієї майбутньої технології. За словами представників OpenAI, компанія виділить п’яту частину своїх величезних обчислювальних потужностей на роботу з проблемою та розв’яже її за чотири роки. 

«Наявні методи контролю неефективні для моделей, що розумніші за людей, оскільки базуються на припущенні, що люди можуть надійно оцінити дії систем ШІ», — каже Лейке. «В міру зростання можливостей систем ШІ вони виконуватимуть усе складніші завдання». І це, згідно з ідеєю, ускладнить оцінку їхніх дій людиною. «Ми з Іллею створили команду з суперконтролю, щоб розв’язати ці майбутні труднощі», — каже він.

«Дуже важливо пам’ятати не тільки про потенційні можливості великих мовних моделей, але й про відповідні ризики та недоліки», — стверджує Джефф Дін, головний науковець Google. 

Компанія оголосила про цей проєкт у липні з типовими для неї фанфарами. Але для деяких людей це лише фантазії. З публікації OpenAI на Twitter глузували відомі критики компаній Big Tech, включно з:

  • Абебою Бірхане, яка працює над визначенням принципів відповідальності ШІ у Mozilla — «так багато грандіозних слів, які нічого не означають, в одній публікації у блозі»;
  • Тімніт Гебру, співзасновницею Науково-дослідного інституту розподіленого штучного інтелекту — «уявіть собі ChatGPT під ще більшим “суперконтролем” технобро з OpenAI. *здригнулася*»;
  • Маргарет Мітчелл, головною науковицею з питань етики у ШІ-компанії Hugging Face — «Мій контроль більший за ваш».

Так, це знайомі голоси інакомислення. А ще потужне нагадування про те, що поки одні люди вірять в OpenAI як лідера індустрії, інші вважають — компанія знаходиться на самісінькому її краю.

Але для Суцкевера суперконтроль — неминучий наступний крок. «Це проблема, яка потребує розв’язання», — каже він, і вважає, що над нею наразі працює недостатньо провідних дослідників машинного навчання, як-от він. «Я роблю це у власних інтересах», — зізнається чоловік. «Дуже важливо, щоб суперінтелект, хто б його не створив, не збунтувався. Це очевидно». 

Робота над суперконтролем тільки-но почалася. Вона вимагатиме масштабних змін в усіх дослідних інститутах. Суцкевер має чітке бачення запобіжних заходів, які хоче розробити: машина, яка ставиться до людей так, як батьки ставляться до дітей. «Для мене це золотий стандарт», — каже він. «Зазвичай діти дуже важливі для людей». (Чи є у нього діти? «Ні, але я хочу їх завести», — лунає відповідь).

Час, виділений на розмову, майже минув, і я вважаю, що ми закінчили. Але Суцкевер осідлав улюбленого коня й хоче поділитися ще однією думкою, яка навіть не приходила мені в голову. 

«Уявимо, що ми розв’язали проблему бунту ШІ, що далі? Чи взагалі знайдеться місце людині у світі зі ШІ, розумнішим за неї?», — питає він.

«Існує імовірність (вона може здаватися божевіллям у сьогоденні, але у майбутньому буде вже цілком нормальною), що багато людей вирішать частково перетворитися на ШІ». За словами Суцкевера, саме так люди, можливо, намагатимуться наздогнати ШІ. «Спочатку це спробують тільки найсміливіші й найавантюрніші. Можливо, за ними підуть інші. Або не підуть».

Почекайте, що? Він вже майже пішов. Чи він зробив би це? Це моє запитання. Чи він був би у перших рядах? «У перших рядах? Я не знаю», — зізнається. — «Але я думаю про це. Справжня відповідь: можливо». 

Після такого фінальної репліки, він виходить з кімнати. «Дуже радий бачити вас знову», — говорить він на ходу.

Знайшли помилку? Виділіть її і натисніть Ctrl+Enter

Завантаження...