HeLo – Nowa ścieżka rozwoju rozpoznawania emocji z danych multimodalnych

Współczesne systemy rozpoznawania emocji coraz częściej sięgają po dane z wielu źródeł – od sygnałów fizjologicznych (np. rytm serca, przewodność skóry) po obraz z kamery rejestrującej mimikę twarzy. Celem jest odzwierciedlenie bogactwa ludzkich odczuć, gdzie często współistnieje kilka emocji jednocześnie. Tradycyjne metody skupiały się jednak na jednoznacznym przypisaniu jednej emocji do próbki (np. „radość” lub „smutek”). Publikacja “HeLo: Heterogeneous Multi-Modal Fusion with Label Correlation for Emotion Distribution Learning” proponuje kompletnie nowe podejście – uczenie rozkładu emocji, w którym model przewiduje, z jakim prawdopodobieństwem występują każda z podstawowych emocji. ...

lipca 10, 2025

RetrySQL: samokorekta w generacji zapytań SQL

Zadanie text-to-SQL polega na przekształceniu zapytań w języku naturalnym na zapytania SQL wykonywane na relacyjnej bazie danych. Choć nowoczesne modele językowe (LLM) znakomicie radzą sobie z wieloma zadaniami generatywnymi, generowanie poprawnych, złożonych zapytań SQL nadal stanowi wyzwanie. W artykule RetrySQL: text-to-SQL training with retry data for self-correcting query generation autorzy przedstawiają nowy paradygmat treningowy, który uczy model samodzielnej kontroli i korekty wygenerowanych kroków rozumowania. Idea RetrySQL Generowanie kroków rozumowania Dla każdego przykładu z zestawu BIRD tworzony jest ciąg kroków, które prowadzą do budowy zapytania SQL (np. $FROM$ → $WHERE$ → $GROUP\ BY$), generowany syntetycznie przy użyciu GPT-4o. ...

lipca 7, 2025