ШІ Microsoft показав вищу точність діагнозів, ніж лікарі — дослідження

Як працює новий діагностичний ШІ Microsoft? Він перевершив лікарів у точності та витратах, аналізуючи складні випадки з NEJM

Команда Microsoft AI представила результати дослідження, у якому штучний інтелект MAI-DxO успішно вирішував складні медичні діагностичні задачі. Випробування базувалося на клінічних випадках із журналу New England Journal of Medicine (NEJM), одного з найавторитетніших у світі. ШІ діагностував правильно у 85% випадків — це вчетверо більше за результат досвідчених лікарів, які працювали без доступу до колег, джерел чи цифрових асистентів. Про це повідомляє медіа про науку, технології та здоров’я КРВ.медіа з посиланням на Microsoft.

MAI-DxO — оркестратор діагностики нового покоління

Microsoft AI розробила MAI-DxO — так званий «діагностичний оркестратор», який працює як віртуальна команда лікарів. Він імітує послідовний процес клінічного мислення, наближений до реального: від початкового звернення пацієнта — до остаточного діагнозу з аналізом симптомів, запитань, тестів та витрат.

Для оцінювання ефективності MAI-DxO дослідники використали 304 клінічних випадки з NEJM — авторитетного медичного журналу, який щотижня публікує найскладніші кейси зі шпиталю Массачусетської загальної лікарні. Ці випадки зазвичай потребують участі кількох спеціалістів та численних обстежень. На цьому матеріалі ШІ досяг 85,5% точності. Для порівняння, група із 21 лікаря (із США та Великої Британії, досвід — від 5 до 20 років) мала середню точність у 20%.

SD Bench — симулятор реального діагностичного процесу

Розроблений Microsoft SD Bench — це не просто набір тестів, а симулятор клінічної роботи. Він дозволяє моделі або людині взаємодіяти з клінічним випадком покроково: ставити запитання, замовляти обстеження, робити припущення і коригувати діагноз на основі нових даних. Кожна дія у SD Bench має віртуальну вартість, що дозволяє моделювати реальні витрати на охорону здоров’я.

Такий підхід дає змогу оцінювати як точність діагнозу, так і ефективність у витратах. Важливо, що MAI-DxO досягав правильної відповіді з меншою кількістю досліджень, ніж більшість моделей і навіть лікарі, — це свідчить про оптимізацію якості при зменшенні вартості.

orkestrator mai dx peretvoryuye bud yaku movnu model na virtualnu panel kliniczystiv krv.media 1

Оркестратор MAI-DxO перетворює будь-яку мовну модель на команду віртуальних лікарів

Microsoft

ШІ не замінить лікарів, але може їх підсилити

У Microsoft підкреслюють, що MAI-DxO не є заміною лікарям. Його мета — стати інструментом підтримки прийняття рішень. ШІ не володіє емпатією чи здатністю будувати довіру з пацієнтом, проте може допомогти лікарю зменшити кількість непотрібних тестів, точніше визначити діагноз та зменшити навантаження на систему охорони здоров’я.

Варто також враховувати, що в експерименті лікарі не мали доступу до колег, клінічних ресурсів або цифрових інструментів, які зазвичай використовуються в реальній практиці. Це дозволило провести чисте порівняння між людськими й алгоритмічними можливостями, але частково обмежує загальну оцінку.

porivnyannya diagnostychnyh agentiv na bazi shtuchnogo intelektu za tochnistyu ta serednoyu vartistyu diagnostychnogo testu na vypadok krv.media

Новини технологій | ШІ

Штучний інтелект навчився «читати» емоції собак, котів та коней

shtuchnyj intelekt navchyvsya chytaty emocziyi tvaryn krv.media

Наука | ШІ

Як штучний інтелект допомагає виявляти серцево-судинні захворювання

yak shtuchnyj intelekt dopomagaye vyyavlyaty serczevo sudynni zahvoryuvannyakrv.media 2

Новини науки | Гаджети

Інфрачервона ШІ-камера шукатиме сліди прибульців та НЛО

shi kamera dlya vistezhennya prybulcziv krv.media

Впровадження, обмеження і майбутні кроки

Попри високі результати, MAI-DxO ще не призначений для використання у медичній практиці. Його впровадження можливе лише після незалежної клінічної валідації, затвердження відповідними органами та впровадження етичних рамок. Наразі система перебуває у фазі дослідницького проєкту.

Дослідники також підкреслюють: хоча результати MAI-DxO найкращі у складних випадках, ще треба оцінити, як система працює з типовими щоденними зверненнями. У майбутньому Microsoft планує надати доступ до SD Bench як публічного еталона, що дозволить незалежно перевіряти нові ШІ-системи в медицині.

Раніше ми писали, що штучний інтелект створив новий білок, відтворивши 500 мільйонів років еволюції

Теж цікаво

Новини науки | Динозаври

В Аргентині відкрили динозавра, який міг полювати на рибу як чапля

Новини здоров'я | Дослідження

Вчені створили очні краплі зі шпинату: вони працюють завдяки світлу

Новини науки | Астероїд

Дослідження: гриби активно поширилися після вимирання динозаврів

Новини науки | Динозаври

У Таїланді знайшли найбільшого динозавра в історії Південно-Східної Азії