Тариф перевозок на судах на воздушной подушке через Лену останется прежним
10 апреля, 19:20
Два путепровода в рамках мастер-плана начнут строить в Улан-Удэ
10 апреля, 18:50
Якутия готовится к паводкам и пожарам при поддержке федерального центра
10 апреля, 18:50
Первый день Дальневосточного МедиаСаммита в Биробиджане — главное
10 апреля, 18:45
Социальный пар и перегретый ИИ: о чем рассказал политолог Виноградов на МедиаСаммите в ЕАО
10 апреля, 18:25
"Нужно очень любить эту землю": о чем говорили на пленарной дискуссии Дальневосточного МедиаСаммита
10 апреля, 18:20
ГигаЧат освоил более 30 языков народов России и стран СНГ
10 апреля, 18:05
В Якутске стартовала регистрация на СберПрайм Зелёный Марафон 2026
10 апреля, 17:46
Алексей Лейпи: рынок базовых программ в 2026 году вырастет более чем вдвое
10 апреля, 17:40
Время важнее денег: как 96% россиян поменяли приоритеты при выборе жилья
10 апреля, 17:35
Ранее судимый прохожий обокрал ребенка в Якутске
10 апреля, 17:00
Якутск возглавил рейтинг развития рынка газомоторного топлива
10 апреля, 16:30
В Якутске таксиста обокрала пассажир
10 апреля, 16:00
ВТБ: Пользователи соцсетей зафиксировали зарождение экономики ИИ-агентов
10 апреля, 15:40
Пять человек эвакуировано из-за поджога в многоквартирном доме в Якутии
10 апреля, 15:30
Идея открыть в Биробиджане музей дружбы России и Китая прозвучала на ДВ МедиаСаммите
10 апреля, 15:20
Нефтегазовая отрасль и инвестиции: Лимаренко представил итоги развития Сахалина
10 апреля, 15:20
Путешествующий журналист: Рассказывайте читателю о, казалось бы, незначительных деталях
10 апреля, 15:15

ГигаЧат освоил более 30 языков народов России и стран СНГ

Поддержка национальных языков реализована в текстовом формате
10 апреля, 18:05
Бизнес
Сбер, сбербанк Илья Аверьянов, ИА PrimaMedia
Сбер, сбербанк
Фото: Илья Аверьянов, ИА PrimaMedia
Нашли опечатку?
Ctrl+Enter

Обновленный ИИ-помощник ГигаЧат (12+) улучшил качество понимания и создания текста более чем на 30 языках народов России и стран СНГ. В их числе татарский, башкирский, чувашский, удмуртский, якутский, бурятский, осетинский, чеченский, карачаево-балкарский и другие. Поддержка каждого языка потребовала отдельной точечной доработки модели — качество ответов обеспечивалось за счёт тщательно отобранных обучающих данных. Всего с учётом других международных языков ГигаЧат может выполнять задачи более чем на 40 языках, сообщает пресс-служба банка. 

Партнерами по сбору данных для обучения ИИ-помощника выступила ФГБУ "Дом народов России" и интернет-энциклопедия "Рувики" (0+), а также региональные академии наук, научные и образовательные организации и некоммерческие фонды, работающие в сфере сохранения локальных языков и культурного наследия народов России.

Поддержка национальных языков реализована в текстовом формате. Достаточно попросить ГигаЧат отвечать на нужном языке — и он будет его использовать, когда пользователь обращается на нём к ИИ-помощнику. Пользователи ИИ-помощника могут получать ответы, консультации и помощь в цифровых сервисах на родном языке: от поиска информации и помощи в учёбе до подготовки текстов, обращений и взаимодействия с государственными органами. Возможность общаться с ИИ на родном языке важна как для старшего поколения, получающего доступ к сервисам на родном языке, так и для подрастающего, осваивающего цифровую среду через ИИ-помощников. Такой подход помогает укреплять связь между поколениями, сохранять культурную и историческую память и создает основу для будущего развития сервисов и продуктов на национальных языках в образовании, культуре, туризме, медиа и других секторах экономики.

Как обучали языковую модель

Многие национальные языки исторически мало представлены в цифровой среде, поэтому Сбер выстраивает работу с широким кругом федеральных и региональных партнёров — университетами, библиотеками, медиа и культурными институтами, региональными ассоциациями, фондами и академиями наук, заинтересованными в оцифровке языкового наследия и развитии ИИ-сервисов на родных языках. Именно они помогают собирать и верифицировать языковые данные, необходимые для обучения модели. Носители языка также участвуют в разметке и оценке качества: контролируют корректность ответов модели, проверяют грамматику, стилистику и соответствие живой речи.

Обучающий набор по каждому языку включал от нескольких сотен тысяч до нескольких миллионов документов. Это архивные и современные тексты из фондов образовательных учреждений и библиотек, новостные и публицистические материалы медиапартнёров, а также учебные и научные тексты. Разнообразие источников обеспечивает высокое качество ответов и охват как литературного, так и разговорного языка. Команда также оптимизировала алгоритмы обработки национальных языков, что заметно повысило эффективность обучения. Такой подход позволил добиться значимого улучшения качества ответов при относительно компактных датасетах. 

"Мы хотим сделать ГигаЧат по-настоящему массовым продуктом — таким, которым сможет воспользоваться каждый житель страны. В России используют более 270 языков и диалектов, и мы ставим перед собой задачу, чтобы как можно больше жителей могли общаться с нашим ИИ-помощником на родном языке. Когда человек может объяснить задачу своими словами, на языке, на котором он думает и чувствует, ИИ-помощник становится по-настоящему полезным инструментом в обычной жизни — будь то помощь ребёнку с учёбой, разбор юридического договора или инструкция по настройке новой техники", — сказал старший вице-президент, руководитель блока "Развитие генеративного ИИ" Сбера Антон Фролов.

Генеративная модель ГигаЧат создана с нуля российскими специалистами — от сбора и разметки данных до базового обучения, дообучения под конкретные задачи и финальной оценки качества. Все этапы разработки выполнены на собственной инфраструктуре Сбера.

Ранее Сбер представил новую версию ИИ-помощника на базе флагманской модели ГигаЧат Ультра (GigaChat Ultra) (12+). Ключевое нововведение — долгосрочная память: в отличие от контекстной памяти, которая сбрасывается в конце каждого диалога, ГигаЧат теперь сохраняет факты для пользователя между сессиями и учитывает их в каждом последующем разговоре. Модель запоминает увлечения, профессию, предпочтения и информацию о близких — и самостоятельно отбирает только значимые факты, не перегружая память мелочами. Это делает ответы более персонализированными и точными. ИИ-помощник теперь сам понимает, когда нужно найти информацию в интернете, а скорость генерации ответов увеличена в два раза.

Попробовать обновлённую модель можно бесплатно в веб-версии, приложениях для Android в RuStore (0+) и AppGallery (0+), а также в мессенджерах. Для активации голосового режима и памяти достаточно авторизоваться по Сбер ID и включить нужные опции в настройках профиля.

Услуги предоставляются ПАО "Сбербанк" (ОГРН 1027700132195. Юридический адрес: Москва, ул. Вавилова, 19).

Реклама. Рекламодатель: ПАО "Сбербанк".

190699
55
74