Нова функція

Слухай статті з Respeecher

Нова функція дозволяє слухати статті в зручному форматі завдяки технології від Respeecher. Насолоджуйтесь контентом у будь-який час – у дорозі, під час тренувань або відпочинку.

00:00 00:00

Наступні статті

Завантажується ⟳

Голос

Вибір голосу

Вибір голосу

Наступні статті

Завантажується ⟳

00:00 00:00

НОВИНИ

Згадали ШІ 121 раз. Чим запамʼяталася конференція Google I/O

15 Травня 2024, 11:22

6 хв читання

Юлія Ткач Головна редакторка, авторка і ведуча подкасту «Хто ці люди».

Режим читання увімкнено

Режим читання збільшує текст, прибирає всю зайву інформацію зі сторінки і дозволяє зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.

Режим читання

Завершити

Google провів свою щорічну конференцію для розробників Google I/O 2024. На презентації представили нові програмні продукти зі штучним інтелектом. Їх зібрали у матеріалі TechCunch. Розповідаємо деталі.

Що сталося

Вчора, 14 травня, надвечір за Києвом Google провела конференцію для розробників I/O, де презентувала нові продукти. Цьогоріч I/O присвятили ШІ — за 110 хв заходу Google встиг згадати про ШІ 121 раз під час Google. Ні, рахували не ми — цю цифру на завершення презентації навів СЕО Сундар Пічаї.

Of course Google used Gemini to count AI mentions during today's AI-filled #GoogleIO. And there was even one more after this. pic.twitter.com/ajL7JYPQVE
— TechCrunch (@TechCrunch) May 14, 2024

Firebase Genkit

Доповнення до платформи, яке має полегшити розробникам створення застосунків з ШІ на JavaScript/TypeScript, також незабаром з’явиться і підтримка мови Go. Це фреймворк з відкритим вихідним кодом, що використовує ліцензію Apache 2.0, який дозволяє розробникам швидко вбудовувати ШІ в нові та наявні програми. Зокрема, Genkit можна використовувати для: генерації та узагальнення контенту, перекладу тексту та створення зображень.

Генеративний ШІ для навчання

Google представив LearnLM, нове сімейство моделей генеративного ШІ, заточених під навчання. Це спільна робота дослідницького підрозділу Google DeepMind AI та Google Research. За словами Google, моделі LearnLM призначені для розмовного навчання студентів з низки дисциплін. Хоча вона вже доступна на кількох платформах Google, компанія впроваджує LearnLM в межах пілотної програми в Google Classroom.

ШІ-вікторини

Новинка YouTube — вікторини, створені штучним інтелектом. Цей новий розмовний інструмент ШІ дозволяє користувачам «підіймати руку» під час перегляду навчальних відео. Глядачі можуть ставити уточнювальні запитання, отримувати корисні пояснення або брати участь у вікторині з даної теми.

Розраховано на тих, кому доводиться переглядати довгі навчальні відео, наприклад, лекції або семінари, завдяки можливостям моделі Gemini в довгому контексті. Ці нові функції вже доступні для деяких користувачів Android у США.

Gemma 2

Одним з головних запитів, які Google отримав від розробників, була більша модель Gemma. Тому Google додав нову модель з 27 млрд параметрів до Gemma 2. Наступне покоління моделей Gemma від Google запустять в червні. Цей розмір оптимізований Nvidia для роботи на графічних процесорах нового покоління і може працювати на одному хості TPU і вершинному ШІ, заявили в Google.

Gemini

Gemini 1.5 Pro вбудували в Gmail, Photo, Meet, Chrome та інші сервіси для всіх. Контекстне вікно збільшили вдвічі — до 2 млн токенів. Це в 16 разів більше, ніж у GPT-4o — можна завантажити 60 тисяч рядків коду за раз. У Google Meet ШІ конспектує ваш діалог і вибирає головне. У Google Photo — знайде будь-які фотки за голосом. У Chrome — дасть швидку відповідь на запитання з посиланням на джерела. А ще зʼявилася можливість пошуку по відео.

Ask Photos

Це оновлення для Google Photos. Нова функція (запустять її пізніше цього літа), дозволить користувачам здійснювати пошук у своїй колекції фото за допомогою запитів природною мовою. Якщо раніше користувачі могли шукати конкретних людей, місця або речі на своїх фотографіях, то завдяки обробці природної мови оновлення ШІ зробить пошук потрібного контенту більш інтуїтивним і менш ручним.

Боротьба зі скамом

Google презентувала функцію, яка, на її думку, попереджатиме користувачів про потенційне шахрайство під час дзвінка. Функцію вбудують в майбутню версію Android. Вона використовує Gemini Nano, найменшу версію генеративного ШІ Google.

Система прослуховує «шаблони розмов, які зазвичай асоціюються з шахрайством у режимі реального часу. Google навів приклад, коли хтось видає себе за представників банку. Поширені тактики шахраїв, такі як запити паролів і подарункових карток також спрацьовують у системі.

Imagen 3

Остання модель у сімействі генеративних моделей ШІ Imagen. СЕО DeepMind Деміс Хассабіс заявив, що Imagen 3 точніше розуміє текстові підказки, які він перетворює на зображення, порівнюючи зі своїм попередником Imagen 2, і є більш «креативним і детальним» у своїх поколіннях. Крім того, за його словами, модель видає менше артефактів, що відволікають, і помилок: «Це [також] наша найкраща модель для рендерингу тексту, що було проблемою для моделей генерації зображень».

Project IDX

Project IDX, браузерне середовище розробки наступного покоління, орієнтоване на ШІ, тепер у відкритій бета-версії. З цим оновленням в IDE з’явилася інтеграція з Google Maps Platform, що дозволяє додавати в застосунки функції геолокації, а також інтеграцію з Chrome Dev Tools і Lighthouse для налагодження застосунків. Незабаром Google також дозволить розгортати застосунки на Cloud Run, безсерверній платформі Google Cloud для запуску фронт- і бекенд-сервісів.

Конкурент Sora

Veo — модель ШІ, яка може створювати відеокліпи з роздільною здатністю у 1080p тривалістю близько хвилини за допомогою текстової підказки. У різних візуальних і кінематографічних стилях, включно з пейзажами та часовими відрізками, а також вносити правки та корективи у вже згенеровані кадри.

And you’ll also be able to ask questions with video, right in Search. Coming soon. #GoogleIO pic.twitter.com/zFVu8yOWI1
— Google (@Google) May 14, 2024

Circle to Search

Функція Circle to Search з ШІ дозволяє користувачам Android отримувати миттєві відповіді. Вона розроблена для того, щоб зробити взаємодію з пошуком Google більш природною з будь-якого місця на телефоні, виконуючи певні дії. Наприклад, обводити, виділяти, писати або торкатися. А ще краще допомагати дітям з домашнім завданням безпосередньо з підтримуваних телефонів і планшетів Android.