Торжественной церемонией завершился Дальневосточный МедиаСаммит в Биробиджане
21:50
В поисках идентичности: что скрывает культурный код ЕАО, обсудили эксперты ДВ МедиаСаммита
17:45
Роль журналиста и блогера примерили участники МедиаСаммита в ЕАО
17:10
Более 88 % жителей Якутии обеспечены качественной питьевой водой
17:00
ИИ против живого разума: о ценности человека в эпоху нейросетей рассказали на МедиаСаммите
16:35
Из-за короткого замыкания электропроводки сгорела баня в Якутске
16:00
Алгоритмы охватов: участникам МедиаСаммита в ЕАО раскрыли секреты продвижения контента
15:20
"Дальневосточная школа журналистики – это такая "гремящая штука", она известна всей стране"
15:10
День охотника в Якутии: медвежьи трофеи, волчьи награды и охотничьи состязания
15:00
В Якутии пресечена кража 6 тонн дизельного топлива с нефтяного месторождения
14:00
Евгений Поддубный: Правда остается ключевой ценностью журналистики
13:20
В Якутске со двора дома госпитализирован мужчина с переломом лобной кости
13:00
Свыше 1,5 млн заявлений подали якутяне в 2025 году через портал Госуслуг 
12:00
Якутия-2026: Куда устремятся туристы в майские праздники?
11:00
Авито Недвижимость: жители России оценивают свои дома и ЖК на 4,5
10:35
Весеннее пробуждение: сезон цветения "сестры" сакуры в Якутии
10:00
Развитие электромобильного такси в Якутии: проблемы инфраструктуры и рынка
09:00
Тариф перевозок на судах на воздушной подушке через Лену останется прежним
10 апреля, 19:20

Ученые Сбера создали бенчмарк для повышения качества медицинских консультаций

Медицинский бенчмарк оценивает не только точность диагностики, но и качество диалога между врачом и пациентом
Ученые Сбера создали бенчмарк для повышения качества медицинских консультаций ИА ChitaMedia
Ученые Сбера создали бенчмарк для повышения качества медицинских консультаций
Фото: ИА ChitaMedia

Учёные из Центра практического искусственного интеллекта Сбера разработали медицинский бенчмарк 3MDBench, который моделирует консультации между врачом и пациентом на основе жалоб, снимков и характера пациента, с автоматической оценкой качества. Об этом эксперты рассказали в ходе международной конференции AI Journey (18+) ("Путешествие в мир искусственного интеллекта").

В этой системе взаимодействуют два виртуальных агента, каждый из которых управляется большой языковой или мультимодальной моделью искусственного интеллекта (AI). Один агент действует как врач, а другой — как пациент. Смысл в том, чтобы оценить, насколько эффективно современные AI-модели решают задачи врача, который консультирует пациентов дистанционно. Система проверяет их способность распознавать симптомы, формулировать диагноз и поддерживать естественный, понятный и эмпатичный диалог с пациентом. Такая симуляция позволяет изучить, как темперамент пациента и выбранная стратегия общения влияют на точность диагностики и общее качество взаимодействия. Научная статья под названием 3MDBench: Medical Multimodal Multi-agent Dialogue Benchmark (18+) опубликована на международной конференции EMNLP 2025. (18+)

Актуальность исследования обусловлена стремительным развитием телемедицины и растущей ролью языковых моделей в здравоохранении. Существующие медицинские бенчмарки часто включают лишь тесты с выбором ответа или короткие текстовые задачи, не моделируют полноценное общение между врачом и пациентом, не учитывают темперамент и эмоциональную реакцию человека. К тому же большинство из них берут в расчёт качество коммуникации и визуальные данные — например, фотографии симптомов, которые важны для постановки диагноза.

Бенчмарк 3MDBench включает почти 3000 случаев с 34 диагнозами, которые основаны на реальных мультимодальных телемедицинских данных (текст + изображение). Исследование учёных Сбера показало, что использование диалога и мультимодальной информации существенно повышает точность диагностики. Добавление диалогов, по оценкам ученых Сбера, увеличивает F1-меру на 6,5%, а включение информации от специально обученной свёрточной нейросети для классификации медицинских изображений — до 20%. Также подтверждено, что мультиагентная симуляция с персонализированными пациентами обеспечивает более реалистичную и содержательную оценку моделей. 

Компании, которые разрабатывают медицинские ИИ-системы и телемедицинские платформы, могут бесплатно использовать 3MDBench для оценки и улучшения диагностических возможностей своих нейросетей в реалистичных условиях. Интеграция мультимодальных данных и улучшение диалоговых стратегий помогут компаниям-разработчикам, телемедицинским провайдерам, страховым компаниям и производителям медицинского ПО повысить качество удалённых консультаций.

РИА PrimaMedia

Медицинская плашка. Фото: РИА PrimaMedia

234715
55
70