Rekrutacja uczestników to jeden z kluczowych ograniczników w rozwoju leków: aż 80% badań nie osiąga celów rekrutacyjnych, a opóźnienia mogą kosztować nawet 8 mln USD dziennie. Autorzy proponują multimodalny model głębokiego uczenia, który przewiduje liczbę pacjentów oraz oszacowuje niepewność przewidywań.
Wyzwania w prognozowaniu rekrutacji
Dotychczas stosowano:
- Modele deterministyczne (XGBoost, LightGBM) dające estymatę punktową, nie uwzględniające zmienności.
- Modele stochastyczne (procesy Poissona, Poisson–Gamma) zwracające przedziały ufności, ale słabo skalujące się przy złożonych danych.
Architektura modelu
Dane wejściowe
- Key: faza, kraj, obszar terapeutyczny, sponsor, liczba ośrodków, planowana rekrutacja
- Context: tekst (tytuł, cele, kryteria inkluzji/ekskluzji)
Osadzanie tekstu
Łączymy pola tekstowe i kodujemy Clinical Longformerem (4096 tokenów).Fuzja multimodalna
- Warstwy FC na danych strukturalnych $z_{cat}, z_{num}$
- Embedding tekstu $z_{emb}$ jako zapytania w multi‐head attention wobec $z_{cat}$ i $z_{num}$.
Wyjście punktowe
Wynik $\hat{N}$ to estymata liczby uczestników (MAE ≈ 52, $R^2≈0.76$).
Ujęcie niepewności
Sieć uczy się parametrów Gamma $(\alpha,\lambda)$ na poziomie ośrodka, co pozwala na generowanie 90 % przedziałów ufności:
$$ \mu \sim \mathrm{Gamma}(\alpha,\lambda). $$
W testach 78.7 % rzeczywistych wartości trafia w CI (mediana szerokości ≈ 99 pacjentów).
Prognoza czasu trwania rekrutacji
Przyjmując proces Poissona z parametrem $\mu\sim\mathrm{Gamma}(\alpha,\lambda)$:
- Wyznaczamy $(\alpha,\lambda)$ i opóźnienia startu ośrodka.
- Symulujemy 1024 scenariusze rekrutacji.
- Agregujemy czas do prognozy całkowitej.
Wyniki vs klasyczne podejście:
- MAE: 7.52 vs 10.55 miesięcy
- Pokrycie 6-mies. CI: 32.2 % vs 14.9 %
Dane i ewaluacja
- Zbiór: 11 400+ triali z IQVIA DQS & Citeline (9410/1000/1000)
- Baseliny: XGBoost, LightGBM, BioBERT, ClinicalBERT, Llama 2 (7B) z LoRA
- Efektywność: poprawa MAE o ~9 % vs LightGBM, najwyższe $R^2=0.77$.
Znaczenie i kierunki rozwoju
- Zarządzanie ryzykiem: precyzyjniejsze planowanie budżetu i aktywacji ośrodków.
- Wydajność: inferencja w ~0.07 s vs 8.74 s.
- Perspektywy: end-to-end z LLM, prognozy w czasie rzeczywistym, adaptacja do lokalnych warunków rekrutacji.
Links
- Na podstawie publikacji 📄 arXiv:2507.23607 PDF