Propuštene preporuke za nastavak radiološkog praćenja (follow-up) predstavljaju značajan, ali često potcenjen bezbednosni rizik u savremenim zdravstvenim sistemima. Kada radiolog u nalazu preporuči kontrolu, na primer, kontrolni CT za tri meseca ili MR pregled radi praćenja suspektne lezije, ta preporuka bi morala biti precizno prepoznata, evidentirana i sprovedena. U svakodnevnoj praksi, najčešće usled velikog obima posla, deo ovih kritičnih preporuka ostaje neregistrovan.
Studija objavljena 18. februara u časopisu NEJM Catalyst pokazuje da sistemi zasnovani na agentima veštačke inteligencije (AI) mogu drastično unaprediti identifikaciju takvih preporuka unutar radioloških izveštaja.
Ograničenja trenutnih sistema: Problem „makroa“
U zdravstvenom sistemu Parkland u Dalasu, još 2018. godine uveden je mehanizam za automatizaciju praćenja. Radiolozi su koristili tzv. makroe, unapred definisane šablonske fraze koje se ubacuju u nalaz. Kada sistem detektuje makro, on automatski taguje izveštaj u elektronskom zdravstvenom kartonu (EZK) i prosleđuje ga u radnu listu tima zaduženog za kontaktiranje pacijenata.
Iako je ovaj pristup inicijalno bio koristan, oslanjanje na ručni unos makroa pokazalo se nedovoljno pouzdano. Ukoliko radiolog ne upotrebi striktno definisanu frazu ili preporuku napiše slobodnim tekstom, sistem je ne prepoznaje. Time se stvaraju dijagnostički propusti koji direktno utiču na ishod lečenja.
Semantička analiza umesto šablona
Istraživači su razvili AI agenta zasnovanog na velikom jezičkom modelu (LLM – Meta Llama-3 70B) koji vrši duboku semantičku analizu celokupnog radiološkog nalaza. Umesto da traži specifičnu frazu, model „razume“ kontekst i samostalno identifikuje preporuku za kontrolu.
Zanimljivo je da model nije zahtevao kompleksno fino podešavanje (fine-tuning), već je optimizovan putem inženjeringa upita (prompt engineering) na uzorku od 1.000 nasumično odabranih naloga za rendgenske, CT, ultrazvučne i MR preglede.
Impresivni rezultati u brojkama
U evaluaciji sprovedenoj na 10.000 radioloških izveštaja, AI model je upoređen sa standardnim sistemom zasnovanim na makroima:
- Uravnotežena tačnost (balanced accuracy): Premašila je 97% u identifikaciji nalaza koji zahtevaju praćenje.
- Stopa detekcije: AI je identifikovao 6,18 puta više opravdanih slučajeva za kontrolu u odnosu na ručni unos (513 naspram 83 slučaja).
- Ekstrakcija detalja: Sa tačnošću od 94%, model je uspešno izdvajao ključne elemente: preporučeni vremenski interval, tip dijagnostičke procedure i kliničko obrazloženje.
Testiranje u realnom kliničkom okruženju
Sistem je prošao kroz tromesečni pasivni režim rada, tokom kojeg je u realnom vremenu analizirao preko 120.000 radioloških izveštaja bez ometanja kliničkih tokova posla. U ovom periodu, AI je uspešno markirao 9.600 izveštaja za dalje praćenje, dok je sistem zasnovan na makroima registrovao svega 1.145.
Zaključak: Dodatna bezbednosna mreža
Ovaj tehnološki iskorak ne menja ulogu radiologa niti preispituje njegovu kliničku odluku. Naprotiv, on služi kao dodatna bezbednosna mreža koja osigurava da nijedna stručna preporuka ne ostane „izgubljena u tekstu“.
Iako su potrebna dalja istraživanja kako bi se potvrdilo da li veći broj registrovanih follow-up preporuka direktno vodi do boljih ishoda lečenja, studija jasno ilustruje kako se generativna AI može promišljeno primeniti za rešavanje kritičnih propusta u dijagnostičkoj bezbednosti unutar zdravstvenih ustanova koje imaju veliki obim posla.
Originalni rad u NEJM Catalyst možete pronaći ovde.
Napomena: Tekst predstavlja informativni prikaz objavljene naučne literature. Ne sadrži kliničke preporuke i ne može zameniti stručnu procenu lekara u realnim okolnostima.