Гороскоп на неделю: Близнецы внимательны с документами, дисциплина Козерога
16:00
Новый порядок оплаты на пароме Якутск-Нижний Бестях вызвал трудности
15:46
Более одного млн тонн грузов планируют перевезти по рекам Якутии в 2026 году
15:00
С 1 июня в Якутии стартуют регулярные рейсы скоростных судов
14:30
Более 330 выпускников педколледжей пополнят школы и детсады Якутии
14:00
Историю "Короля поп-музыки" оценили зрители в Якутске
13:30
Подарок к юбилею: Балетная школа Якутии представила "Двух голубей"
13:00
Ледоход продолжается на севере Якутии
12:30
Спасатели оказали помощь участнику соревнований по зимнему плаванию в Якутии
12:00
Якутская наука и бизнес на экспорт: Победители "Золотого Меркурия"
11:30
Якутия в фокусе: первый кандидат в мэры, триумф спортсменов, приговор за рабский труд
11:00
В Якутии за сутки трое погибших, покушение, ДТП с ребёнком
10:27
Потоки воды разрушили дорожное покрытие на севере Якутии
10:00
Якутскими огнеборцами спасен  жилой дом в Борисовке-1
09:28
Ледяной затор на Яне: в селе Усть-Янск введён режим повышенной готовности 
08:40
Шесть лет за решеткой проведет экс-глава УФСИН Якутии
08:00
Гороскоп на 31 мая: Тельца удивят просьбой, Водолей избегает скучных компаний
07:00
Основатель ГК "Дело" Сергей Шишкарёв: Готовы работать, чтобы Россия прирастала детьми
30 мая, 19:35

Ученые проверили ГигаЧат на знания в области математики и компьютерных наук

18 марта, 18:50
Общество
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук pxhere.com
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук
Фото: pxhere.com
Нашли опечатку?
Ctrl+Enter

Нейросеть Сбера ГигаЧат (12+) сдала экзамен по направлению "Математика и компьютерные науки". В ходе аттестационного испытания, проведенного на базе Сколтеха, работа модели была оценена аттестационной комиссией на оценку "4" ("хорошо").

Аттестация проходила в два этапа. Сначала модель прошла тестирование на 500 вопросах закрытого типа в формате MMLU, которые были разработаны преподавателями Сколтеха. Они охватывали девять тем в области компьютерных наук: алгоритмы и структуры данных, базы данных, кибербезопасность, программное обеспечение, программирование, сети и оборудование, специализированное ПО, управление и искусственный интеллект. Средний показатель правильных ответов модели на вопросы составил 76,9%.

Второй этап — очный экзамен с участием аттестационной комиссии, состоящей из восьми докторов технических и физико-математических наук. Эксперты комиссии выбрали три билета из 45, по которым проводили оценку знаний нейросети. Каждый билет содержал два задания — теоретическое и практическое. Все задачи были разработаны специально для этого испытания и отсутствовали в открытых базах, что исключало возможность поиска готовых ответов и требовало от нейросети применения реальных знаний. Для объективной оценки глубины компетенций эксперты не только проверяли ответы, но и задавали уточняющие вопросы, просили объяснить ход рассуждений и анализировали работу модели с нестандартными формулировками. 

Оценка проводилась по профильному принципу: например, при оценке ответов модели на задания по программированию решающий голос принадлежал соответствующему эксперту. Применение весовых коэффициентов позволило обеспечить максимальную объективность аттестации. По итогам очного экзамена модель набрала 7 из 10 баллов по шкале Сколтеха.

233940
55
70