Мінцифра разом з «Київстар» тренуватимуть українську LLM на основі Gemma 3 від Google. Про це повідомила Мінцифра. Розповідаємо детальніше, чому обрали саме цю модель.
Що сталося
Мінцифра та «Київстар» готують першу українську велику мовну модель на базі Google Gemma 3. Міністр цифрової трансформації Михайло Федоров називає це ключовим кроком для досягнення амбітної мети — вивести Україну до 2030 року до першої трійки країн світу за рівнем розвитку та впровадження ШІ.
За планом, на базі відкритої моделі Gemma 3 мають:
- Адаптувати модель до української мови та мінімізувати лінгвістичні та етичні ризики.
- Вдосконалити український токенайзер, щоб зменшити помилки і оптимізувати обчислення.
- Донавчити модель на великих обсягах якісних україномовних текстів.
- Створити спеціалізовані бенчмарки для оцінки та тонкого налаштування моделі.
Gemma 3 обрали через кілька причин:
- Підтримує понад 140 мов (включно з українською).
- Працює не лише з текстом, а й із зображеннями.
- Має контекстне вікно до 128 000 токенів.
- Уже стала основою для найкращих українськомовних моделей, LLM — MamayLM та Lapa LLM, а також для болгарської INSAIT BgGPT.
- Модель забезпечує найкраще співвідношення продуктивності та необхідних ресурсів серед відкритих моделей, заявив директор з розробки діджитал-продуктів «Київстар» Михайло Нестор.
Нагадуємо, Україна запускає спільну ініціативу з NVIDIA для створення суверенного штучного інтелекту та розбудови національної AI-інфраструктури. Деталі розповідаємо тут.