NLP | MLLog.dev

TAPS: Dlaczego dane treningowe modelu-draftu mają większe znaczenie niż jego architektura

Speculative decoding to jedna z najbardziej eleganckich sztuczek w inferencji LLM: mały, szybki model-draft model-draft Lekki model językowy, który szybko proponuje kandydujące tokeny. Większy model ‘weryfikator’ sprawdza te propozycje równolegle, akceptując poprawne i odrzucając błędne - przyspieszając generowanie bez zmiany jakości wyjścia. proponuje tokeny, a duży weryfikator weryfikator Pełnowymiarowy docelowy model językowy, który sprawdza propozycje draftu. Przetwarza wszystkich kandydatów w jednym przebiegu, akceptując te zgodne z własną dystrybucją - gwarantując identyczną jakość jak standardowe dekodowanie autoregresyjne. zatwierdza lub odrzuca je równolegle. Ta sama dystrybucja wyjściowa, mniej kosztownych przebiegów. ...

Zgubieni w Opowieściach: Jak LLM-y Gubią Wątek w Długich Historiach

Poproś dowolny model językowy o napisanie opowiadania na 10 000 słów. Na pierwszej stronie bohater ma niebieskie oczy. Na piątej — brązowe. W rozdziale trzecim jest czwartek, w szóstym ten sam dzień to nagle sobota. Postać, która zginęła na stronie siedem, spokojnie rozmawia na stronie dziesięć. Brzmi znajomo? Publikacja “Lost in Stories: Consistency Bugs in Long Story Generation by LLMs” po raz pierwszy systematycznie bada ten problem — i wyniki są otrzeźwiające. Nawet najlepsze modele produkują średnio jeden błąd spójności na każde 10 000 słów, a ludzie-eksperci wykrywają zaledwie 17% z nich. ...

ASkDAgger: Jak Sztuczna Inteligencja Uczy Się Efektywniej Dzięki Zadawaniu Pytań

W świecie, w którym roboty i systemy AI coraz częściej uczą się poprzez obserwację i interakcję z ludźmi, kluczowym wyzwaniem pozostaje efektywność tego procesu. Tradycyjne metody uczenia się przez naśladowanie (Imitation Learning) często wymagają od ludzkiego nauczyciela ciągłego nadzoru i korygowania błędów, co jest czasochłonne i kosztowne. Zespół naukowców z Jelle Luijkx na czele proponuje przełomowe rozwiązanie w swojej najnowszej publikacji zatytułowanej “ASkDAgger: Active Skill-level Data Aggregation for Interactive Imitation Learning”. ...