Згадали ШІ 121 раз. Чим запамʼяталася конференція Google I/O
15 Травня 2024, 11:22
6 хв читання
Юлія ТкачКерую редакційним контентом, популяризую підприємництво, надихаю конкурентів та веду подкаст «Хто ці люди».
Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Режим читання
Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Завершити
Google провів свою щорічну конференцію для розробників Google I/O 2024. На презентації представили нові програмні продукти зі штучним інтелектом. Їх зібрали у матеріалі TechCunch. Розповідаємо деталі.
Що сталося
Вчора, 14 травня, надвечір за Києвом Google провела конференцію для розробників I/O, де презентувала нові продукти. Цьогоріч I/O присвятили ШІ — за 110 хв заходу Google встиг згадати про ШІ 121 раз під час Google. Ні, рахували не ми — цю цифру на завершення презентації навів СЕО Сундар Пічаї.
Firebase Genkit
Доповнення до платформи, яке має полегшити розробникам створення застосунків з ШІ на JavaScript/TypeScript, також незабаром з’явиться і підтримка мови Go. Це фреймворк з відкритим вихідним кодом, що використовує ліцензію Apache 2.0, який дозволяє розробникам швидко вбудовувати ШІ в нові та наявні програми. Зокрема, Genkit можна використовувати для: генерації та узагальнення контенту, перекладу тексту та створення зображень.
Генеративний ШІ для навчання
Google представив LearnLM, нове сімейство моделей генеративного ШІ, заточених під навчання. Це спільна робота дослідницького підрозділу Google DeepMind AI та Google Research. За словами Google, моделі LearnLM призначені для розмовного навчання студентів з низки дисциплін. Хоча вона вже доступна на кількох платформах Google, компанія впроваджує LearnLM в межах пілотної програми в Google Classroom.
ШІ-вікторини
Новинка YouTube — вікторини, створені штучним інтелектом. Цей новий розмовний інструмент ШІ дозволяє користувачам «підіймати руку» під час перегляду навчальних відео. Глядачі можуть ставити уточнювальні запитання, отримувати корисні пояснення або брати участь у вікторині з даної теми.
Розраховано на тих, кому доводиться переглядати довгі навчальні відео, наприклад, лекції або семінари, завдяки можливостям моделі Gemini в довгому контексті. Ці нові функції вже доступні для деяких користувачів Android у США.
Gemma 2
Одним з головних запитів, які Google отримав від розробників, була більша модель Gemma. Тому Google додав нову модель з 27 млрд параметрів до Gemma 2. Наступне покоління моделей Gemma від Google запустять в червні. Цей розмір оптимізований Nvidia для роботи на графічних процесорах нового покоління і може працювати на одному хості TPU і вершинному ШІ, заявили в Google.
Gemini
Gemini 1.5 Pro вбудували в Gmail, Photo, Meet, Chrome та інші сервіси для всіх. Контекстне вікно збільшили вдвічі — до 2 млн токенів. Це в 16 разів більше, ніж у GPT-4o — можна завантажити 60 тисяч рядків коду за раз. У Google Meet ШІ конспектує ваш діалог і вибирає головне. У Google Photo — знайде будь-які фотки за голосом. У Chrome — дасть швидку відповідь на запитання з посиланням на джерела. А ще зʼявилася можливість пошуку по відео.
Ask Photos
Це оновлення для Google Photos. Нова функція (запустять її пізніше цього літа), дозволить користувачам здійснювати пошук у своїй колекції фото за допомогою запитів природною мовою. Якщо раніше користувачі могли шукати конкретних людей, місця або речі на своїх фотографіях, то завдяки обробці природної мови оновлення ШІ зробить пошук потрібного контенту більш інтуїтивним і менш ручним.
Боротьба зі скамом
Google презентувала функцію, яка, на її думку, попереджатиме користувачів про потенційне шахрайство під час дзвінка. Функцію вбудують в майбутню версію Android. Вона використовує Gemini Nano, найменшу версію генеративного ШІ Google.
Система прослуховує «шаблони розмов, які зазвичай асоціюються з шахрайством у режимі реального часу. Google навів приклад, коли хтось видає себе за представників банку. Поширені тактики шахраїв, такі як запити паролів і подарункових карток також спрацьовують у системі.
Imagen 3
Остання модель у сімействі генеративних моделей ШІ Imagen. СЕО DeepMind Деміс Хассабіс заявив, що Imagen 3 точніше розуміє текстові підказки, які він перетворює на зображення, порівнюючи зі своїм попередником Imagen 2, і є більш «креативним і детальним» у своїх поколіннях. Крім того, за його словами, модель видає менше артефактів, що відволікають, і помилок: «Це [також] наша найкраща модель для рендерингу тексту, що було проблемою для моделей генерації зображень».
Project IDX
Project IDX, браузерне середовище розробки наступного покоління, орієнтоване на ШІ, тепер у відкритій бета-версії. З цим оновленням в IDE з’явилася інтеграція з Google Maps Platform, що дозволяє додавати в застосунки функції геолокації, а також інтеграцію з Chrome Dev Tools і Lighthouse для налагодження застосунків. Незабаром Google також дозволить розгортати застосунки на Cloud Run, безсерверній платформі Google Cloud для запуску фронт- і бекенд-сервісів.
Конкурент Sora
Veo — модель ШІ, яка може створювати відеокліпи з роздільною здатністю у 1080p тривалістю близько хвилини за допомогою текстової підказки. У різних візуальних і кінематографічних стилях, включно з пейзажами та часовими відрізками, а також вносити правки та корективи у вже згенеровані кадри.
Circle to Search
Функція Circle to Search з ШІ дозволяє користувачам Android отримувати миттєві відповіді. Вона розроблена для того, щоб зробити взаємодію з пошуком Google більш природною з будь-якого місця на телефоні, виконуючи певні дії. Наприклад, обводити, виділяти, писати або торкатися. А ще краще допомагати дітям з домашнім завданням безпосередньо з підтримуваних телефонів і планшетів Android.
Pixel 8a
Остання новинка в лінійці Pixel. Телефон коштує від $499, продажі стартують у вівторок. Серед інших оновлень — до пристрою додали чип Tensor G3.
Pixel Slate
Планшет Pixel від Google під назвою Slate вже доступний у продажу.