150 якутских пожарных помогают тушить лесные пожары в Забайкалье
Читать
Пока вы спали: в креме нашли бензол, штраф за мигрантов увеличат, НДФЛ для родителей
Читать
Боец из Якутии: Желаю, чтоб сердце не знало боли и тоски
Читать
Ваши школьные знания стерлись в пыль, если не осилите даже 6/8 – ТЕСТ
Читать
Сейчас только гений разгадает эти загадки из советских журналов
Читать
Вы ходячая энциклопедия, если знаете ответы на эти 8 каверзных вопросов – ТЕСТ
Читать
В Якутске пожар унес жизни двух человек
10:32
Свыше 300 вопросов от якутян поступило на "Прямую линию" Айсена Николаева
10:30
В Якутии за два ближайших года геологоразведку проведут на 26 объектах
10:00
Впервые с момента начала СВО в Якутске состоится салют 9 мая
09:30
Режим повышенной готовности вводится в Якутии в связи с приближающимся паводком
09:15
Россияне стали чаще обращаться к сервисам подбора авто — эксперт "Селекта" в "Авито Авто"
09:10
"Жилкомсервис" Якутска откачал 3582 кубометра воды — максимум за всю историю
09:00
Крупный золотопромышленник "прописался" в спецрайоне на острове Русском
08:50
Руководитель офиса банка в Якутске присваивала деньги со счетов
08:30
Айсен Николаев: Якутия продолжит производство патриотического кино
08:20
Вахта Победы: день рождение Ленина, успешная посевная и окружение Берлина
08:00
Пока вы спали: в креме нашли бензол, штраф за мигрантов увеличат, НДФЛ для родителей
08:00
Боец из Якутии: Желаю, чтоб сердце не знало боли и тоски
23 апреля, 18:30
Фермерфест от Сбербанка пройдёт 26 апреля в Иркутске
23 апреля, 17:30
"Доверяй, но проверяй": интервью с оперуполномоченным МВД Якутии
23 апреля, 15:25

Российская нейросеть A-Vibe обогнала OpenAI и Google

8 апреля, 16:00 Общество
Тематическая иллюстрация Илья Аверьянов, ИА PrimaMedia
Тематическая иллюстрация
Фото: Илья Аверьянов, ИА PrimaMedia
Нашли опечатку?
Ctrl+Enter

Большая языковая модель A-Vibe от Авито заняла первое место среди облегченных моделей (до 10 млрд параметров) в независимом российском бенчмарке MERA, обойдя международные аналоги от OpenAI, Google и Anthropic. На втором месте — T-lite-it-1.0, на третьем — Ru adapt Gen2.5-7B-Lite-v1*. Как выяснили в исследовании, A-Vibe лучше аналогичных моделей понимает запросы, генерирует код и поддерживает осмысленный диалог, сообщает Авито.

"Первое место доказывает, что оптимизированная архитектура и качественные данные могут обеспечить отличные результаты даже при небольшом размере модели. A-Vibe создавалось оптимальной по соотношению между качеством, скоростью работы и затратой ресурсов. Такой баланс позволяет обеспечивать быструю обработку запросов даже в периоды пиковой нагрузки и масштабировать технологию на всю аудиторию платформы. Именно обучение небольшой модели под наши нужды позволяет нам закладывать окупаемость инвестиций: Авито планирует вложить в GenAI около 12 млрд рублей, а заработать более 21 млрд рублей к 2028 году", — отметил старший директор по данным и аналитике Авито Андрей Рыбинцев.

A-Vibe* обошла такие модели, как GPT-4o mini, Gemma 3 27B, Claude 3.5 Haiku, Mistral Large и другие популярные небольшие нейросети. Тестирование включало задачи различной сложности — от базового понимания текста до продвинутых лингвистических задач, требующих глубокой работы с контекстом.

предоставлено Авито

Скриншот. Фото: предоставлено Авито

Некоторые результаты тестирования MERA:

  • Генерация кода: на 25% лучше Gemini 1.5 с 8 млрд параметров
  • Ведение диалога: на 32% точнее Llama 3.1 с 405 млрд параметров
  • Способность анализировать смысл текста: на 23% точнее Claude 3.5 Haiku

"Мы рассматриваем возможность выпуска модели в открытый доступ, что станет нашим вкладом в развитие российского рынка ИИ. Это поможет малому бизнесу внедрять передовые технологии без значительных инвестиций, образовательным учреждениям создавать прикладные программы, а независимым разработчикам строить современные сервисы на базе отечественных технологий. Для нас это возможность получить ценную обратную связь от рынка и улучшить наши модели", — комментирует руководитель разработки больших языковых моделей "Авито" Анастасия Рысьмятова.

Справка: Бенчмарк MERA — это российский стандарт оценки языковых моделей, разработанный научным сообществом. В рамках замера тестируют понимание русского языка и культурного контекста. Проект поддерживает Альянс ИИ, ведущие индустриальные игроки и академические партнеры, которые занимаются исследованием языковых моделей.

*A-Vibe разработана ООО "Авито Тех" — ИТ-компанией группы Авито

**возрастное ограничение для всех нейросетей 18+ 

16842
55
70

Электронный ресурс (Сайт) использует cookies и метрические программы. Продолжая посещение настоящего сайта, пользователь соглашается на смешанную обработку, сбор, использование, хранение, уточнение (обновление, изменение), обезличивание, блокирование, уничтожение своих персональных данных владельцем Электронного ресурса в соответствии с Политикой обработки персональных данных и Согласием на обработку персональных данных Пользователей.
На сайте используются рекомендательные технологии