Команда Microsoft AI представила результати дослідження, у якому штучний інтелект MAI-DxO успішно вирішував складні медичні діагностичні задачі. Випробування базувалося на клінічних випадках із журналу New England Journal of Medicine (NEJM), одного з найавторитетніших у світі. ШІ діагностував правильно у 85% випадків — це вчетверо більше за результат досвідчених лікарів, які працювали без доступу до колег, джерел чи цифрових асистентів. Про це повідомляє медіа про науку, технології та здоров’я КРВ.медіа з посиланням на Microsoft.
MAI-DxO — оркестратор діагностики нового покоління
Microsoft AI розробила MAI-DxO — так званий «діагностичний оркестратор», який працює як віртуальна команда лікарів. Він імітує послідовний процес клінічного мислення, наближений до реального: від початкового звернення пацієнта — до остаточного діагнозу з аналізом симптомів, запитань, тестів та витрат.
Для оцінювання ефективності MAI-DxO дослідники використали 304 клінічних випадки з NEJM — авторитетного медичного журналу, який щотижня публікує найскладніші кейси зі шпиталю Массачусетської загальної лікарні. Ці випадки зазвичай потребують участі кількох спеціалістів та численних обстежень. На цьому матеріалі ШІ досяг 85,5% точності. Для порівняння, група із 21 лікаря (із США та Великої Британії, досвід — від 5 до 20 років) мала середню точність у 20%.

SD Bench — симулятор реального діагностичного процесу
Розроблений Microsoft SD Bench — це не просто набір тестів, а симулятор клінічної роботи. Він дозволяє моделі або людині взаємодіяти з клінічним випадком покроково: ставити запитання, замовляти обстеження, робити припущення і коригувати діагноз на основі нових даних. Кожна дія у SD Bench має віртуальну вартість, що дозволяє моделювати реальні витрати на охорону здоров’я.
Такий підхід дає змогу оцінювати як точність діагнозу, так і ефективність у витратах. Важливо, що MAI-DxO досягав правильної відповіді з меншою кількістю досліджень, ніж більшість моделей і навіть лікарі, — це свідчить про оптимізацію якості при зменшенні вартості.

ШІ не замінить лікарів, але може їх підсилити
У Microsoft підкреслюють, що MAI-DxO не є заміною лікарям. Його мета — стати інструментом підтримки прийняття рішень. ШІ не володіє емпатією чи здатністю будувати довіру з пацієнтом, проте може допомогти лікарю зменшити кількість непотрібних тестів, точніше визначити діагноз та зменшити навантаження на систему охорони здоров’я.
Варто також враховувати, що в експерименті лікарі не мали доступу до колег, клінічних ресурсів або цифрових інструментів, які зазвичай використовуються в реальній практиці. Це дозволило провести чисте порівняння між людськими й алгоритмічними можливостями, але частково обмежує загальну оцінку.

Впровадження, обмеження і майбутні кроки
Попри високі результати, MAI-DxO ще не призначений для використання у медичній практиці. Його впровадження можливе лише після незалежної клінічної валідації, затвердження відповідними органами та впровадження етичних рамок. Наразі система перебуває у фазі дослідницького проєкту.
Дослідники також підкреслюють: хоча результати MAI-DxO найкращі у складних випадках, ще треба оцінити, як система працює з типовими щоденними зверненнями. У майбутньому Microsoft планує надати доступ до SD Bench як публічного еталона, що дозволить незалежно перевіряти нові ШІ-системи в медицині.
Раніше ми писали, що штучний інтелект створив новий білок, відтворивши 500 мільйонів років еволюції