Якутия в фокусе: от спуска коффердама до ПМЭФа в Петербурге
13:30
Около 700 якутян объединил благотворительный забег "ONCORUN - 2026"
13:00
35 человек эвакуировали пожарные из горящего дома в Якутске
12:25
Психологи Якутии: Очень важно поддерживать себя и близких во время тревожности
12:00
Пушкинский день в Якутске, народные песни и куклы ручной работы
11:30
В Якутске мошенники продают пустоту вместо ответов на ЕГЭ
11:00
Фоторепортаж "Саха-Бохо Фест" в Якутске: этника, мода и мистика собрали поклонников
10:30
Где бегать в Якутске: круги комфорта для городского марафонца
10:00
Тело утонувшего ребенка в Мирнинском районе Якутии найдено
09:51
Ипотечная ловушка: банки в Якутии выделяют меньше, чем запрашивают заемщики
09:00
Гороскоп на 7 июня: Телец избегает спешки, Водолей разбирается с финансами
07:00
Село Усть-Янск полностью освободилось от воды
6 июня, 21:50
Бастрыкин поручил возбудить дело об исчезновении мужчины в Якутии
6 июня, 21:30
В Якутии ищут пропавшего трёхлетнего ребёнка
6 июня, 20:06
ПМЭФ-2026: Сахалинская область под руководством Валерия Лимаренко вошла в топ-3 инвестиционного климата России
6 июня, 18:30

Ученые проверили ГигаЧат на знания в области математики и компьютерных наук

18 марта, 18:50
Общество
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук pxhere.com
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук
Фото: pxhere.com
Нашли опечатку?
Ctrl+Enter

Нейросеть Сбера ГигаЧат (12+) сдала экзамен по направлению "Математика и компьютерные науки". В ходе аттестационного испытания, проведенного на базе Сколтеха, работа модели была оценена аттестационной комиссией на оценку "4" ("хорошо").

Аттестация проходила в два этапа. Сначала модель прошла тестирование на 500 вопросах закрытого типа в формате MMLU, которые были разработаны преподавателями Сколтеха. Они охватывали девять тем в области компьютерных наук: алгоритмы и структуры данных, базы данных, кибербезопасность, программное обеспечение, программирование, сети и оборудование, специализированное ПО, управление и искусственный интеллект. Средний показатель правильных ответов модели на вопросы составил 76,9%.

Второй этап — очный экзамен с участием аттестационной комиссии, состоящей из восьми докторов технических и физико-математических наук. Эксперты комиссии выбрали три билета из 45, по которым проводили оценку знаний нейросети. Каждый билет содержал два задания — теоретическое и практическое. Все задачи были разработаны специально для этого испытания и отсутствовали в открытых базах, что исключало возможность поиска готовых ответов и требовало от нейросети применения реальных знаний. Для объективной оценки глубины компетенций эксперты не только проверяли ответы, но и задавали уточняющие вопросы, просили объяснить ход рассуждений и анализировали работу модели с нестандартными формулировками. 

Оценка проводилась по профильному принципу: например, при оценке ответов модели на задания по программированию решающий голос принадлежал соответствующему эксперту. Применение весовых коэффициентов позволило обеспечить максимальную объективность аттестации. По итогам очного экзамена модель набрала 7 из 10 баллов по шкале Сколтеха.

233940
55
70