Nie tylko większe modele: dlaczego AI powinno lepiej widzieć, a nie tylko rosnąć

W ostatnich latach rozwój sztucznej inteligencji kojarzy się głównie z coraz większymi modelami i coraz większymi zbiorami danych. GPT-4, Claude, Gemini – każdy z nich bije rekordy rozmiarów i mocy obliczeniowej. Ale czy większy zawsze znaczy lepszy? Zespół badaczy (Baek, Park, Ko, Oh, Gong, Kim) w swojej najnowszej publikacji “AI Should Sense Better, Not Just Scale Bigger” (arXiv:2507.07820) przekonuje, że doszliśmy do momentu, w którym większe modele niekoniecznie są najbardziej efektywną drogą rozwoju. Zamiast tego proponują zupełnie nowe podejście: sensoryka adaptacyjna. ...

lipca 13, 2025

HGMP: Rewolucja w analizie złożonych grafów dzięki prompt learning

W erze dominacji modeli jezykowych i uczenia maszynowego, nieprzerwanie rośnie znaczenie danych strukturalnych: sieci społecznych, powiązań biologicznych, relacji biznesowych. Dane te przedstawia się w formie grafów, które często nie są jednorodne: zawierają węzły różnych typów (np. ludzie, produkty, firmy) oraz różne typy relacji (np. “zakupił”, “polecił”, “pracuje w”). Przetwarzanie takich heterogenicznych grafów wymaga specjalistycznych metod. Czym są grafy heterogeniczne? Graf heterogeniczny (ang. heterogeneous graph) to struktura, w której: występuje wiele typów węzłów i krawędzi, każdy typ może mieć inne cechy i pełnić inną rolę, relacje są semantycznie złożone (np. “oglądał”, “recenzował”, “produkował”). To odzwierciedlenie wielu realnych systemów: sieci finansowych, portali społecznościowych czy wiedzy encyklopedycznej (jak Wikipedia). ...

lipca 12, 2025

Predykcja i generacja antybiotyków przeciw przyszłym patogenom za pomocą ApexOracle

Narastający kryzys oporności na antybiotyki (AMR) wymaga nowych rozwiązań obliczeniowych, które wyprzedzą szybko ewoluujące patogeny. ApexOracle to zintegrowana platforma ML, służąca zarówno do przewidywania aktywności związków wobec określonych szczepów bakteryjnych, jak i do generacji de novo cząsteczek celowanych na przyszłe „superbakterie”. Motywacja i zakres Globalne znaczenie: AMR odpowiada za blisko 5 mln zgonów rocznie. Tradycyjne wyzwania: Długotrwałe i kosztowne procesy odkrywania leków, reagujące na bieżące zagrożenia. Cel ApexOracle: Połączenie kontekstu genomowego z projektowaniem molekularnym w jednym przepływie. Architektura ApexOracle Wyobraź sobie, że masz trzy zestawy wskazówek: kod genetyczny bakterii (genom), krótki opis jej właściwości (jak prosta karta informacyjna) oraz składniki potencjalnego leku (przepis chemiczny). ApexOracle działa jak wysoce zaawansowany detektyw, który jednocześnie analizuje wszystkie trzy źródła informacji. Następnie dobiera najskuteczniejsze molekuły, a nawet tworzy całkowicie nowe przepisy chemiczne, które mogą zatrzymać rozwój bakterii. ...

lipca 11, 2025

HeLo – Nowa ścieżka rozwoju rozpoznawania emocji z danych multimodalnych

Współczesne systemy rozpoznawania emocji coraz częściej sięgają po dane z wielu źródeł – od sygnałów fizjologicznych (np. rytm serca, przewodność skóry) po obraz z kamery rejestrującej mimikę twarzy. Celem jest odzwierciedlenie bogactwa ludzkich odczuć, gdzie często współistnieje kilka emocji jednocześnie. Tradycyjne metody skupiały się jednak na jednoznacznym przypisaniu jednej emocji do próbki (np. „radość” lub „smutek”). Publikacja “HeLo: Heterogeneous Multi-Modal Fusion with Label Correlation for Emotion Distribution Learning” proponuje kompletnie nowe podejście – uczenie rozkładu emocji, w którym model przewiduje, z jakim prawdopodobieństwem występują każda z podstawowych emocji. ...

lipca 10, 2025

Nowoczesne Metody w Pamięci Asocjacyjnej

Pamięć asocjacyjna umożliwia przechowywanie wzorców i odtwarzanie ich na podstawie niekompletnych lub zaszumionych danych. Zainspirowana tym, jak mózg przypomina sobie wspomnienia, pamięć asocjacyjna jest realizowana przez rekurencyjne sieci neuronowe, które z czasem zbieżają do zapisanych wzorców. Publikacja ‘Nowoczesne Metody w Pamięci Asocjacyjnej’ autorstwa Krotova i współautorów oferuje przystępny wstęp dla początkujących oraz rygorystyczne omówienie matematyczne dla ekspertów, łącząc klasyczne koncepcje z najnowszymi osiągnięciami w głębokim uczeniu. Klasyczne Sieci Hopfielda Wprowadzone w 1982 roku przez Johna Hopfielda, sieci Hopfielda wykorzystują binarne neurony $s_i ∈ [{-1,+1}]$ oraz symetryczne wagi $w_{ij}$. Energię sieci definiuje się jako ...

lipca 9, 2025

QuEst: Łączenie danych i predykcji dla solidnej estymacji kwantylowej

Wyobraź sobie, że rejestrujesz czas swojego porannego dojazdu, wykonując 50 pomiarów GPS. Uruchamiasz też symulator ruchu drogowego, generując 5 000 scenariuszy. Chcesz oszacować 95-ty percentyl czasu dojazdu — czas, którego nie przekroczysz w 95% dni. Korzystając tylko z 50 pomiarów, masz szeroki przedział ufności. Symulator może natomiast systematycznie zaniżać czas (nie uwzględnia korków czy zamknięć dróg). QuEst sprytnie łączy oba źródła: Oblicza 95-ty percentyl na danych rzeczywistych i na symulacjach. Odejmuje wynik symulatora obliczony na tych samych 50 symulacjach, znosząc przesunięcie. Miesza dwie estymaty wagą $\lambda$, dobraną tak, by zminimalizować wariancję. Daje to nieobciążony, precyzyjny wynik i węższy przedział ufności niż przy użyciu tylko jednego źródła. ...

lipca 8, 2025

RetrySQL: samokorekta w generacji zapytań SQL

Zadanie text-to-SQL polega na przekształceniu zapytań w języku naturalnym na zapytania SQL wykonywane na relacyjnej bazie danych. Choć nowoczesne modele językowe (LLM) znakomicie radzą sobie z wieloma zadaniami generatywnymi, generowanie poprawnych, złożonych zapytań SQL nadal stanowi wyzwanie. W artykule RetrySQL: text-to-SQL training with retry data for self-correcting query generation autorzy przedstawiają nowy paradygmat treningowy, który uczy model samodzielnej kontroli i korekty wygenerowanych kroków rozumowania. Idea RetrySQL Generowanie kroków rozumowania Dla każdego przykładu z zestawu BIRD tworzony jest ciąg kroków, które prowadzą do budowy zapytania SQL (np. $FROM$ → $WHERE$ → $GROUP\ BY$), generowany syntetycznie przy użyciu GPT-4o. ...

lipca 7, 2025

Jak nowoczesna teoria informacji pomaga diagnozować choroby psychiczne – MvHo‑IB w akcji

Diagnozowanie zaburzeń psychicznych takich jak autyzm, depresja czy schizofrenia to wyzwanie, które wykracza poza zwykłe zdjęcie mózgu. Dzięki resting-state fMRI (rs-fMRI) — czyli obserwacji aktywności mózgu w stanie spoczynku — wiemy, które obszary są aktywne jednocześnie. Na tej podstawie buduje się tzw. połączenia funkcjonalne (functional connectivity, FC). Wieloletnie badania wykorzystywały grafy i sieci neuronowe, ale skupiały się prawie wyłącznie na relacjach parzystych — czyli “czy obszar A i B współdziałają?”. A co z relacjami wyższego rzędu — np. między A, B i C równocześnie? ...

lipca 6, 2025

Wielopoziomowe wskazówki krokowe w uczeniu przez wzmacnianie

Uczenie przez wzmacnianie (RL) pozwala agentom uczyć się zachowań na podstawie sygnałów nagrody. Jednak w zadaniach wymagających rozumowania długiego łańcucha decyzji pojawiają się dwa główne wyzwania: Problem “near-miss” – jeden błąd na końcu rozumowania unieważnia cały ciąg kroków. Stagnacja eksploracji – agent zbyt długo powtarza znane ścieżki, nie odkrywając nowych strategii. Artykuł StepHint: Multi-level Stepwise Hints Enhance Reinforcement Learning to Reason prezentuje metodę pod nazwą StepHint, która dostarcza agentowi wielopoziomowe wskazówki krokowe, wspierając zarówno początkujących, jak i zaawansowanych użytkowników. ...

lipca 5, 2025

Jak przewidzieć popyt na hulajnogi? XGBoost i mikromobilność w mieście

Czy można przewidzieć, kiedy i gdzie ludzie wypożyczą elektryczną hulajnogę? Okazuje się, że tak – i to z bardzo dużą dokładnością. W nowej publikacji badacze pokazują, jak użycie zaawansowanych algorytmów, takich jak XGBoost, może zrewolucjonizować zarządzanie mikromobilnością w miastach. 🌍 Tło: Mikromobilność i problem popytu W wielu miastach świata bezdokowe hulajnogi elektryczne stały się codziennym środkiem transportu. Jednak dla operatorów pozostaje kluczowe pytanie: Gdzie i kiedy ludzie będą chcieli skorzystać z hulajnogi? ...

lipca 4, 2025