Google запустила відкриту модель ШІ Gemma — що вона може
22 Лютого 2024, 10:05
2 хв читання
Юлія ТкачШеф-редакторка, авторка і ведуча подкасту «Хто ці люди».
Режим читання збільшує текст, прибирає всю зайву інформацію зі сторінки і дозволяє зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Режим читання
Режим читання збільшує текст, прибирає всю зайву інформацію зі сторінки і дозволяє зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Завершити
Google оголосила про запуск нового «сімейства легких, найсучасніших відкритих моделей» для розробників і дослідників ШІ — Gemma.
Що сталося
Нещодавно Google перейменувала свого чат-бота Bard у Gemini. Чому і які оновлення це потягло за собою можна пригадати тут. Тепер компанія повідомила про запуск нового «сімейства легких, найсучасніших відкритих моделей» для розробників і дослідників ШІ Gemma. Її розробили Google DeepMind та інші команди Google. Як пояснили в компанії, її назва взята з латинського gemma, що означає «дорогоцінний камінь».
Gemma вже доступна користувачам по всьому світу. Ось кілька ключових фактів.
Модель доступна у двох розмірах: Gemma 2B та Gemma 7B. Кожен розмір випускається з попередньо навченими та налаштованими за інструкцією варіантами.
Новий набір інструментів для відповідального генеративного ШІ надає рекомендації та необхідні інструменти для створення безпечних застосунків ШІ за допомогою Gemma.
Google надає набори інструментів для виведення та контрольованого доопрацювання (SFT) для всіх основних фреймворків: JAX, PyTorch і TensorFlow через рідний Keras 3.0.
Готові до використання ноутбуки Colab і Kaggle, а також інтеграція з популярними інструментами, такими як Hugging Face, MaxText, NVIDIA NeMo і TensorRT-LLM, полегшують початок роботи з Gemma.
Попередньо навчені та налаштовані за допомогою інструкцій моделі Gemma можна запускати на ноутбуці, робочій станції або в Google Cloud з легким розгортанням на Vertex AI та Google Kubernetes Engine (GKE).
Google стверджує, що Gemma пропонує «найкращу у своєму класі продуктивність для своїх розмірів у порівнянні з іншими відкритими моделями» і що вона «перевершує значно більші моделі в ключових тестах».