AI, która z jednej nocy snu przewiduje 130 chorób. Nowy model SleepFM to przełom w medycynie snu

Naukowcy opracowali model sztucznej inteligencji, który z jednej nocy badań snu potrafi oszacować ryzyko aż 130 różnych schorzeń – od zawału serca i udaru, przez demencję, po niektóre nowotwory. To jeden z najbardziej imponujących przykładów tego, jak głębokie uczenie zaczyna czytać „język snu” lepiej niż człowiek.

Czym jest SleepFM i na czym polega „multimodalny” model snu?

SleepFM (Sleep Foundation Model) to duży model AI wyszkolony na rekordowo dużym zbiorze danych z badań polisomnograficznych – ponad 585 tysięcy godzin snu około 65 tysięcy osób. Polisomnografia to złoty standard diagnostyki snu, który jednocześnie rejestruje wiele sygnałów z ciała, takich jak fale mózgowe (EEG), czynność serca (EKG), oddech czy ruchy mięśni.

„Multimodalny” oznacza, że model uczy się jednocześnie z różnych kanałów sygnału biologicznego, a nie z jednego parametru, jak np. tętno. SleepFM nie próbuje ręcznie „wyłuskać” jednej prostej cechy, ale tworzy gęste reprezentacje (embeddingi), które opisują całą noc snu w postaci wektora cech ukrytych.

Jak uczono model „języka snu”?

Kluczowa innowacja SleepFM to zastosowanie podejścia foundation model: zamiast trenować osobny model do każdego zadania, naukowcy uczą jeden duży model na ogromnych ilościach surowych danych, a dopiero potem wykorzystują go do wielu różnych zastosowań. W tym przypadku oznacza to pretrenowanie na danych z wielu ośrodków, różniących się konfiguracją aparatury i protokołów badania snu.

Zastosowano tu kontrastowe uczenie (contrastive learning), które pozwala modelowi rozróżniać między fragmentami snu należącymi do tego samego pacjenta lub różnych osób, a także między różnymi wzorcami sygnałów. Dzięki temu AI uczy się struktury snu – przejść między fazami, mikroprzebudzeń, subtelnych zmian w oddechu i pracy serca – bez konieczności ręcznego oznaczania każdego fragmentu przez ekspertów.

Co potrafi SleepFM? Od klasyfikacji snu po prognozę chorób

Autorzy pracy pokazują, że SleepFM radzi sobie z klasycznymi zadaniami z medycyny snu co najmniej tak dobrze jak wyspecjalizowane modele, takie jak U‑Sleep i YASA. Model osiąga wysokie wyniki w automatycznym oznaczaniu faz snu, wykrywaniu bezdechu sennego oraz klasyfikowaniu jego nasilenia.

Prawdziwe wrażenie robi jednak to, co dzieje się dalej: jedna noc snu przetworzona przez SleepFM wystarcza, by przewidywać ryzyko 130 różnych przyszłych schorzeń z co najmniej przyzwoitą dokładnością (C‑Index i AUROC co najmniej 0,75). Na liście znajdują się m.in. zgony z różnych przyczyn, choroby układu krążenia, przewlekła choroba nerek, demencja, udar, a także wybrane nowotwory, takie jak rak piersi, prostaty czy czerniaki skóry.

Konkretne liczby: ryzyko śmierci, demencji i chorób serca

W analizie szczegółowej badacze pokazują wyniki dla kluczowych schorzeń wysokiego ryzyka. Dla ogólnej śmiertelności, demencji, niewydolności serca, przewlekłej choroby nerek, udaru czy zgonów sercowo‑naczyniowych model osiąga wysokie wartości C‑Index i AUROC, często powyżej 0,8, co oznacza dobrą zdolność rozróżniania osób o wysokim i niskim ryzyku.

Przykładowo, dla zgonu ogólnego raportowane wartości AUROC sięgają około 0,84, dla niewydolności serca około 0,83, dla demencji około 0,87, a dla przewlekłej choroby nerek około 0,82. To poziom, który w wielu zastosowaniach klinicznych jest już traktowany jako praktycznie użyteczny, zwłaszcza jeśli model uzupełnia istniejące kalkulatory ryzyka oparte na wieku, wynikach badań krwi czy wywiadzie.

Które elementy snu „zdradzają” choroby?

Jednym z ważnych pytań jest to, czy model opiera się na konkretnych fragmentach snu i konkretnych sygnałach. Analiza badaczy sugeruje, że różne fazy snu i różne modality (EEG, oddech, ruchy, EKG) wnoszą odmienny wkład w przewidywanie różnych chorób.

Przykładowo, dla chorób sercowo‑naczyniowych i neurodegeneracyjnych szczególnie informacyjne okazują się fragmenty snu w fazach N1/N2 oraz REM, gdzie widać charakterystyczne zmiany w rytmie serca i aktywności mózgu. Z kolei dla niektórych zaburzeń oddechowych istotne są wzorce przerywanego oddechu i mikroprzebudzeń, które model wychwytuje w sygnałach oddechowych i ruchowych.

Transfer learning: jeden model, wiele zastosowań

SleepFM został przetestowany nie tylko na danych użytych do pretrenowania, ale też na niezależnym zbiorze ze Sleep Heart Health Study (SHHS), który nie był częścią treningu. Model zachował wysoką skuteczność, co pokazuje, że nie „nauczył się na pamięć” konkretnej kohorty, lecz uogólnia wzorce snu między populacjami.

Co więcej, ten sam model może być dalej dostrajany (fine‑tuning) do nowych zadań, np. wykrywania konkretnych chorób lub wspierania decyzji w innych badaniach snu. To klasyczne podejście foundation models: raz wytrenowany model bazowy staje się fundamentem dla wielu wyspecjalizowanych aplikacji, przy czym każda wymaga już dużo mniej oznaczonych danych.

Czy to koniec tradycyjnej diagnostyki? Nie tak szybko

Brzmi jak science fiction, ale autorzy pracy podkreślają, że SleepFM nie zastępuje lekarzy ani klasycznych metod diagnostycznych. Model może raczej pełnić rolę zaawansowanego narzędzia do stratyfikacji ryzyka – pomagać wyłonić pacjentów, którym warto zaoferować dokładniejszą diagnostykę, częstsze kontrole lub profilaktyczne interwencje.

Kluczowe ograniczenia to m.in. brak pełnej interpretowalności (wciąż dopiero rozwijane są metody wyjaśniania, które fragmenty sygnału najbardziej wpływają na prognozę) oraz fakt, że dane pochodzą z badań wykonanych w kontrolowanym środowisku sleep‑labów, a nie z masowych urządzeń konsumenckich. Badacze zaznaczają, że kolejnym krokiem będzie rozszerzenie tego typu modeli na dane z wearables – zegarków, opasek czy smart‑pierścieni.

Co to oznacza dla przeciętnego użytkownika smartwatcha?

Choć SleepFM korzysta z pełnej polisomnografii, trend jest jasny: foundation models przenoszą się z języka i obrazów na dane behawioralne i fizjologiczne. Już dziś powstają modele dla danych z czujników w urządzeniach noszonych, które łączą informacje o ruchu, tętnie, zmienności rytmu serca czy temperaturze skóry, aby przewidywać zmęczenie, stres, ryzyko kontuzji czy infekcji.

Jeżeli takie podejście zostanie udoskonalone i przetestowane klinicznie, za kilka lat zegarek nie tylko powie, ile spaliśmy, ale też zasugeruje: „Twój profil snu przypomina osoby, u których częściej rozwija się nadciśnienie czy cukrzyca – skonsultuj się z lekarzem”. Oczywiście, pod warunkiem solidnych badań, regulacji i zabezpieczeń prywatności.

Wyzwania: etyka, prywatność i ryzyko nadinterpretacji

Tak potężne narzędzia natychmiast rodzą pytania o etykę i prywatność. Dane polisomnograficzne są głęboko wrażliwe – zawierają informacje o zdrowiu, nawykach, a pośrednio nawet o stanie psychicznym, więc ich masowe gromadzenie i przetwarzanie wymaga rygorystycznych zabezpieczeń.

Drugie ryzyko to nadinterpretacja: fakt, że model potrafi wyliczyć ryzyko demencji czy raka, nie oznacza, że u konkretnej osoby ta choroba na pewno się rozwinie. Tego typu narzędzia muszą być używane w kontekście klinicznym, jako jeden z elementów układanki – obok wywiadu, badań laboratoryjnych, obrazowych i decyzji lekarza.