Rekrutacja uczestników to jeden z kluczowych ograniczników w rozwoju leków: aż 80% badań nie osiąga celów rekrutacyjnych, a opóźnienia mogą kosztować nawet 8 mln USD dziennie. Autorzy proponują multimodalny model głębokiego uczenia, który przewiduje liczbę pacjentów oraz oszacowuje niepewność przewidywań.

Wyzwania w prognozowaniu rekrutacji

Dotychczas stosowano:

  • Modele deterministyczne (XGBoost, LightGBM) dające estymatę punktową, nie uwzględniające zmienności.
  • Modele stochastyczne (procesy Poissona, Poisson–Gamma) zwracające przedziały ufności, ale słabo skalujące się przy złożonych danych.

Architektura modelu

  1. Dane wejściowe

    • Key: faza, kraj, obszar terapeutyczny, sponsor, liczba ośrodków, planowana rekrutacja
    • Context: tekst (tytuł, cele, kryteria inkluzji/ekskluzji)
  2. Osadzanie tekstu
    Łączymy pola tekstowe i kodujemy Clinical Longformerem (4096 tokenów).

  3. Fuzja multimodalna

    • Warstwy FC na danych strukturalnych $z_{cat}, z_{num}$
    • Embedding tekstu $z_{emb}$ jako zapytania w multi‐head attention wobec $z_{cat}$ i $z_{num}$.
  4. Wyjście punktowe
    Wynik $\hat{N}$ to estymata liczby uczestników (MAE ≈ 52, $R^2≈0.76$).

Ujęcie niepewności

Sieć uczy się parametrów Gamma $(\alpha,\lambda)$ na poziomie ośrodka, co pozwala na generowanie 90 % przedziałów ufności:

$$ \mu \sim \mathrm{Gamma}(\alpha,\lambda). $$

W testach 78.7 % rzeczywistych wartości trafia w CI (mediana szerokości ≈ 99 pacjentów).

Prognoza czasu trwania rekrutacji

Przyjmując proces Poissona z parametrem $\mu\sim\mathrm{Gamma}(\alpha,\lambda)$:

  1. Wyznaczamy $(\alpha,\lambda)$ i opóźnienia startu ośrodka.
  2. Symulujemy 1024 scenariusze rekrutacji.
  3. Agregujemy czas do prognozy całkowitej.

Wyniki vs klasyczne podejście:

  • MAE: 7.52 vs 10.55 miesięcy
  • Pokrycie 6-mies. CI: 32.2 % vs 14.9 %

Dane i ewaluacja

  • Zbiór: 11 400+ triali z IQVIA DQS & Citeline (9410/1000/1000)
  • Baseliny: XGBoost, LightGBM, BioBERT, ClinicalBERT, Llama 2 (7B) z LoRA
  • Efektywność: poprawa MAE o ~9 % vs LightGBM, najwyższe $R^2=0.77$.

Znaczenie i kierunki rozwoju

  • Zarządzanie ryzykiem: precyzyjniejsze planowanie budżetu i aktywacji ośrodków.
  • Wydajność: inferencja w ~0.07 s vs 8.74 s.
  • Perspektywy: end-to-end z LLM, prognozy w czasie rzeczywistym, adaptacja do lokalnych warunków rekrutacji.