Кодування за допомогою голосу та озвучка документів: Google анонсував нові функції Gemini
Медіа The Verge пише, що Gemini отримує можливість голосового кодування та трансформування документів у подкаст. Розповідаємо, як ці функції будуть працювати.
Що сталося
Google випустив нові функції для свого ШІ-помічника Gemini: Canvas та Audio Overviews. Canvas — це спеціальний робочий простір у Gemini, де користувачі можуть створювати та вдосконалювати як документи, так і код у режимі реального часу. Користувачі можуть створювати початкові чернетки, а потім працювати з Gemini, щоб відредагувати певні розділи, налаштувати тон або переформатувати вміст за потреби.
Для проєктів з кодування Canvas має опцію попереднього перегляду коду в реальному часі, щоб користувачі могли одразу редагувати, спостерігаючи за змінами під час роботи.
Друга функція — «Аудіоогляд», перетворює письмові матеріали — документи або слайди — на «дискусію в стилі подкасту між двома ведучими зі штучним інтелектом». Ця функція раніше була доступна в Google NotebookLM.
Чому це цікаво
Від сьогодні обидві функції доступні для підписників Gemini та Gemini Advanced. Хоча Audio Overview наразі доступний лише англійською мовою — планується розширення мовної підтримки.
Конкуренти ШІ, такі як Anthropic та OpenAI, мають схожі функції: Projects та Canvas. Також Anthropic презентувала нову модель ШІ, Claude 3.7 Sonnet, яка може не лише швидко відповідати на запитання, а й обмірковувати їх, надаючи більш детальні відповіді.
Раніше ми писали, що Google запустив функцію під назвою Deep Research, інструмент безоплатно доступний усім користувачам Gemini, без необхідності підписки на Gemini Advanced. У лютому OpenAI випустив аналогічну функцію з такою ж назвою. У жовтні OpenAI випустила функцію для написання та кодування проєктів під назвою Canvas.
Больше об этом
Схоже, Apple інтегрує Google Gemini в Apple Intelligence
Любую статью можно сохранить в закладки на сайте, чтобы прочесть ее позже.