Нова модель Gemini може самостійно працювати у браузері. Компанія повідомила про це у своєму блозі.
Що сталося
Компанія Google презентувала нову модель штучного інтелекту — Gemini 2.5 Computer Use, яка може самостійно працювати у браузері. Вона відкриває сайти, прокручує сторінки, вводить текст, заповнює форми й навіть перетягує елементи на екрані.
Gemini 2.5 Computer Use — це спеціальна версія моделі Gemini 2.5 Pro, створена для роботи з візуальними інтерфейсами. Вона отримує скриншот сторінки та інструкцію користувача, після чого вирішує, яку дію виконати: натиснути кнопку, перейти за посиланням або ввести дані.
Система працює у циклі — після кожного кроку отримує оновлене зображення сторінки, аналізує зміни й продовжує завдання. Такий підхід дає можливість Gemini працювати з будь-яким сайтом чи сервісом, навіть якщо він не має API або прямого доступу до даних.
Нагадуємо, Українські студенти віком від 18 років можуть безоплатно отримати річну підписку на набір ШІ-інструментів Google AI Pro. Програма передбачає доступ до Gemini 2.5 Pro, Deep Research, Veo 3, NotebookLM, Jules і 2 ТБ хмарного сховища.