<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Badania Naukowe on MLLog.dev</title><link>https://mllog.dev/pl/categories/badania-naukowe/</link><description>Recent content in Badania Naukowe on MLLog.dev</description><image><title>MLLog.dev</title><url>https://mllog.dev/images/default_mllog.png</url><link>https://mllog.dev/images/default_mllog.png</link></image><generator>Hugo -- 0.147.9</generator><language>pl</language><lastBuildDate>Tue, 27 Jan 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://mllog.dev/pl/categories/badania-naukowe/index.xml" rel="self" type="application/rss+xml"/><item><title>To Grok Grokking: Dlaczego sieci neuronowe czasem rozumieją z opóźnieniem</title><link>https://mllog.dev/pl/posts/grokking-dowodliwy-ridge-regression/</link><pubDate>Tue, 27 Jan 2026 00:00:00 +0000</pubDate><guid>https://mllog.dev/pl/posts/grokking-dowodliwy-ridge-regression/</guid><description>&lt;p>W uczeniu maszynowym spodziewamy się, że model albo się nauczy, albo przeucza. Czego się nie spodziewamy, to żeby model najpierw się przeuczył, a potem — dużo później, bez żadnych zmian — nagle zaczął dobrze generalizować. To zjawisko nazywa się &lt;strong>grokking&lt;/strong> i intryguje badaczy od momentu odkrycia. Nowa publikacja wreszcie wyjaśnia dlaczego to się dzieje i dowodzi tego matematycznie — w najprostszym możliwym ustawieniu.&lt;/p>
&lt;h2 id="czym-jest-grokking">Czym jest grokking?&lt;/h2>
&lt;p>Grokking został po raz pierwszy zaobserwowany w 2022 roku na małych zadaniach algorytmicznych (jak arytmetyka modularna). Wzorzec jest uderzający:&lt;/p></description></item><item><title>LLM-kaskady z ograniczeniami kosztów — poznaj C3PO</title><link>https://mllog.dev/pl/posts/llm-kaskady-oprogramowanie-c3po/</link><pubDate>Fri, 14 Nov 2025 00:00:00 +0000</pubDate><guid>https://mllog.dev/pl/posts/llm-kaskady-oprogramowanie-c3po/</guid><description>&lt;p>Wyobraź sobie, że masz w ręku armię pomocników – kilku różnych dużych modeli językowych (LLM) – każdy z nich może pomóc w rozwiązywaniu zadania: od prostych pytań po wieloetapowe rozumowanie.&lt;br>
Tylko że każdy pomocnik „kosztuje”: czas, energię, a czasem też dolary z budżetu API.&lt;br>
Czy da się to wszystko ułożyć taktownie – tak, by korzystać z najtańszego wystarczającego modelu, a w razie potrzeby „podbić” mocniejszy – i jednocześnie nie przekroczyć budżetu?&lt;/p></description></item></channel></rss>