Тихий страж: в Якутии устанавливают дымовые извещатели
20 марта, 17:50
В Якутске показали лучшие практики народного творчества
20 марта, 17:35
Закон о запрете склонения к абортам принят в ЕАО
20 марта, 16:30
В Магаданской области с подрядной организации взыскали почти 11 млн рублей
20 марта, 16:30
Снег с мусором свозили в водоохранную зону Якутска
20 марта, 15:45
В Якутии прокуратура помогла переселить 8 семей из аварийного дома
20 марта, 15:16
Жительницу Якутска оштрафовали за оскорбление пристава
20 марта, 14:45
Качество медпомощи улучшилось для более 50 тысяч жителей Южной Якутии
20 марта, 14:15
Виктор Пинский: ВКП должна играть ведущую роль в организации профсоюза в СНГ
20 марта, 14:10
Аналитики МегаФона отмечают всплеск интереса к ИИ-инструментам среди туристов ДФО
20 марта, 14:00
В Якутске проведены рейды миграционной полиции
20 марта, 13:45
Премия им. Арсеньева привлекает литературное сообщество Китая
20 марта, 13:35
В Якутии наградили деятелей культуры и искусства 
20 марта, 13:00
Жителей Якутии приглашают на всероссийский конкурс "Цифровой марафон 2026"
20 марта, 12:51
В Якутии будет создан филиал Национального центра "Россия"
20 марта, 12:25

Ученые проверили ГигаЧат на знания в области математики и компьютерных наук

18 марта, 18:50
Общество
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук pxhere.com
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук
Фото: pxhere.com
Нашли опечатку?
Ctrl+Enter

Нейросеть Сбера ГигаЧат (12+) сдала экзамен по направлению "Математика и компьютерные науки". В ходе аттестационного испытания, проведенного на базе Сколтеха, работа модели была оценена аттестационной комиссией на оценку "4" ("хорошо").

Аттестация проходила в два этапа. Сначала модель прошла тестирование на 500 вопросах закрытого типа в формате MMLU, которые были разработаны преподавателями Сколтеха. Они охватывали девять тем в области компьютерных наук: алгоритмы и структуры данных, базы данных, кибербезопасность, программное обеспечение, программирование, сети и оборудование, специализированное ПО, управление и искусственный интеллект. Средний показатель правильных ответов модели на вопросы составил 76,9%.

Второй этап — очный экзамен с участием аттестационной комиссии, состоящей из восьми докторов технических и физико-математических наук. Эксперты комиссии выбрали три билета из 45, по которым проводили оценку знаний нейросети. Каждый билет содержал два задания — теоретическое и практическое. Все задачи были разработаны специально для этого испытания и отсутствовали в открытых базах, что исключало возможность поиска готовых ответов и требовало от нейросети применения реальных знаний. Для объективной оценки глубины компетенций эксперты не только проверяли ответы, но и задавали уточняющие вопросы, просили объяснить ход рассуждений и анализировали работу модели с нестандартными формулировками. 

Оценка проводилась по профильному принципу: например, при оценке ответов модели на задания по программированию решающий голос принадлежал соответствующему эксперту. Применение весовых коэффициентов позволило обеспечить максимальную объективность аттестации. По итогам очного экзамена модель набрала 7 из 10 баллов по шкале Сколтеха.

233940
55
70