Держава та індустрія спільно створюють суверенну українську LLM на базі Gemma щоб підвищити якість е-послуг, безпеку даних і стійкість цифрової інфраструктури.
Команда публічного сектора разом з технологічними партнерами підтвердила вибір відкритої сімʼї моделей Gemma як основи для національної великої мовної моделі. Такий вибір повʼязаний з прозорою ліцензійною політикою можливістю локального розгортання та адаптації під ресурсні обмеження. Координацію виконує профільний центр зі штучного інтелекту. Операційний лідер забезпечує обчислювальні кластери мережеву інфраструктуру і практики експлуатації.
Навіщо потрібна суверенна модель
Український інформаційний простір має свою лексику історичні назви та особливі реалії. Суверенна модель дозволяє тонке налаштування під мову права оборону освіту і державні сервіси. Контроль над навчальними даними знижує ризики помилкових висновків і дає змогу краще враховувати контекст подій. Власна модель важлива для безперервності роботи під час загроз. Вона спрощує аудит рішень і забезпечує більшу передбачуваність поведінки. Це створює базу для довіри громадян і бізнесу до цифрових сервісів.
Технічна основа рішення
Gemma пропонує архітектуру яка добре масштабується від компактних конфігурацій до потужних варіантів з розширеним контекстом. Підтримується інструкційне донавчання робота з довгими документами та інструментарій для безпечного виклику зовнішніх функцій. Інженерні команди приділяють увагу сумісності з популярними фреймворками і засобами інференсу. Це важливо для інтеграції з порталом державних послуг реєстрами і відомчими системами. Паралельно готується методологія метрік які відображають реальні потреби користувачів.
Дані та навчання моделі
На першому етапі формують корпус з відкритих україномовних джерел з акцентом на нормативні тексти довідники інструкції та освітні матеріали. Персональні дані виключаються. Окремо готують добірки для медицини інфраструктури освіти і адміністративних послуг. Для кращого розбиття слів доопрацьовується токенайзер з урахуванням особливостей відмінювання та вживання власних назв. Передбачено кілька циклів інструкційного донавчання з участю редакторів предметних областей.
Перші застосування в державі
Пілотні сценарії зосереджені на підтримці е-послуг і консультаційних асистентах. Модель допомагає формувати проєкти звернень пояснювати процедури і пропонувати кроки далі звіряючи їх з чинними правилами. Корисним стає узагальнення довгих регламентів у короткі інструкції зрозумілі громадянам. Для внутрішньої роботи відомств модель прискорює підготовку типових документів і довідок. У сфері кіберзахисту вона підтримує первинну класифікацію подій українською мовою та створює стислий звіт для чергових команд. У критичній інфраструктурі модель використовується обережно з ізольованим розгортанням і підвищеними вимогами до надійності.
Користь для бізнесу і освіти
Бізнес отримує інструмент локалізованої взаємодії з клієнтами. Україномовні контакт-центри скорочують час відповіді. Відділи маркетингу отримують допомогу у створенні зрозумілих описів продуктів і технічних інструкцій. Фінансовий сектор покладається на консервативні налаштування з детальним журналюванням щоб краще пояснювати відповіді клієнтам. В освіті модель полегшує підготовку навчальних матеріалів і перевірку читабельності. Вона пропонує приклади вправ адаптовані до віку і рівня володіння мовою. Для науковців корисним стає резюмування джерел і генерація переліків термінів з поясненнями що економить час на підготовку занять і досліджень.
Що відомо зараз
Станом на грудень 2025 року визначено технічну основу партнерську модель і дорожню карту перших релізів. Паралельно будують процес публічного зворотного звʼязку щоб покращувати покриття нішевих тем і професійних жаргонів. Нижче стислий перелік ключових пунктів які допомагають зрозуміти готовність ініціативи.
- Використовується відкрита родина Gemma з можливістю локального розгортання
- Підготовлено корпуси українською мовою з акцентом на нормативні тексти та інструкції
- Передбачено інструкційне донавчання і тести на довгий контекст та аргументацію
- Перші застосування спрямовані на е-послуги консультації і підготовку документів
- Для чутливих сфер передбачено ізольоване середовище і розширене журналювання
Після пілотів очікується розширення інтеграцій у відомчих сервісах та вихід адаптованих збірок для бізнесу. Вісь розвитку включає кращу роботу з таблицями і структурованими файлами узгодження з національними стандартами транслітерації та підсилення механізмів пояснюваності відповідей.
Інформацію для статті взято з офіційного повідомлення Міністерства Цифрової Трансформації України https://thedigital.gov.ua/news/technologies/ukrayinsku-llm-natrenuiut-na-modeli-gemma-vid-google
