Ледоход на Лене продвинулся на 53 км
Читать
Россиян ждут ещё четыре выходных с 8 по 11 мая
Читать
В Мирном преподавателя оштрафовали за фиктивное трудоустройство
Читать
Вы явно из разведки, если правильно ответите на 8/8 вопросов – ТЕСТ
Читать
Ваша эрудированность ниже плинтуса, если не знаете ответы на 5 из 7 — ТЕСТ
Читать
У вас высококлассная эрудиция, если одолеете 7/7 вопросов — ТЕСТ
Читать
Новая версия "Войны и мира" появится на экранах
5 мая, 23:17
ВТБ заключил первые сделки по обновленной программе льготного кредитования МСП
5 мая, 16:45
70-летнюю жительницу Якутска оштрафовали за повторную продажу спиртного
5 мая, 16:30
Завершён завоз топлива по автозимникам в районы Якутии
5 мая, 16:00
Ревнивая жительница Якутии привлечена к ответственности за оскорбление
5 мая, 15:40
В Якутске пройдут отключения воды
5 мая, 15:20
Аделина и Марк возглавили топ популярных имен для новорожденных в Якутии
5 мая, 14:00
Пожарные отстояли котельную в Сунтарском районе Якутии
5 мая, 13:00
Новые скамейки и урны установили на площади Победы в Якутске
5 мая, 12:35
От кредита до угроз: как мошенники обманули жителей Якутии на миллионы рублей
5 мая, 12:05
В Якутске стартовал сезон утренних зарядок
5 мая, 11:32
В Мирном преподавателя оштрафовали за фиктивное трудоустройство
5 мая, 11:04
Ледоход на Лене продвинулся на 53 км
5 мая, 10:00
График работы медучреждений Якутии на праздники с 8 по 11 мая
5 мая, 09:30
Мэр Якутска раскритиковал работу коммунальных и дорожных служб
5 мая, 09:00

AI Journey 2023: Сбер объявил о создании сильной продакшен-модели для русского языка

Новая LLM ляжет в основу следующей версии системы искусственного интеллекта GigaChat
Сбербанк ИА ChitaMedia
Сбербанк
Фото: ИА ChitaMedia
Общество

На международной конференции по искусственному интеллекту AI Journey (6+) разработчики Сбера анонсировали новую версию сервиса GigaChat (18+), в основе которого лежит одна из наиболее продвинутых моделей для русского языка с 29 млрд параметров. В числе первых доступ к API новинки (18+) вскоре получат бизнес-клиенты Сбера — для реализации собственных решений, а также участники академического сообщества — для проведения исследований. Об этом сообщает ИА IrkutskMedia со ссылкой на пресс-службу Байкальского банка Сбербанка.

Благодаря новой LLM GigaChat лучше следует инструкциям и может выполнять более сложные задания: значительно улучшилось качество суммаризации, рерайтинга и редактирования текстов, ответов на различные вопросы. Команда сравнила ответы новой и предыдущей моделей и зафиксировала общее повышение качества на 23%. При этом с фактологией анонсированная модель справляется на 25% лучше предыдущей версии.

Для достижения таких результатов было проведено множество экспериментов по улучшению модели и повышению эффективности её обучения. В частности, использовался фреймворк для обучения больших языковых моделей с возможностью шардирования весов нейросети по видеокартам, что позволило сократить потребление памяти на них.

По результатам внутренней оценки в бенчмарке MMLU (Massive Multitask Language Understanding) (12+) модель новой версии GigaChat с 29 млрд параметров превосходит популярный открытый аналог LLaMA 2 34B (18+).

"Обучение моделей, лежащих в основе GigaChat, — это масштабный и сложный вычислительный проект, прежде мы не делали ничего подобного. Суммарное количество вычислительных операций почти в шесть раз превысило количество операций при обучении модели ruGPT-3 (18+) с 13 млрд параметров в 2021 году. Также специально для GigaChat мы собрали и развиваем уникальный датасет, над которым работают сотни сотрудников Сбера, помогая развивать и улучшать качество ответов в самых разных доменах. Благодаря этим усилиям пользователи с каждым новым релизом GigaChat получают максимум от сервиса для решения своих задач", — уточнил старший вице-президент, СТО, руководитель блока "Технологии" Сбербанка Андрей Белевцев.

Узнать больше о возможностях GigaChat и посмотреть примеры удачных запросов можно в базе знаний о сервисе. В разработке GigaChat участвуют команды SberDevices и Sber AI при поддержке института искусственного интеллекта AIRI и ряда отраслевых экспертов, привлеченных для передачи GigaChat различных предметных знаний.

65277
55
70

Электронный ресурс (Сайт) использует cookies и метрические программы. Продолжая посещение настоящего сайта, пользователь соглашается на смешанную обработку, сбор, использование, хранение, уточнение (обновление, изменение), обезличивание, блокирование, уничтожение своих персональных данных владельцем Электронного ресурса в соответствии с Политикой обработки персональных данных и Согласием на обработку персональных данных Пользователей.
На сайте используются рекомендательные технологии