<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Repository-Exploration on MLLog.dev</title><link>https://mllog.dev/pl/tags/repository-exploration/</link><description>Recent content in Repository-Exploration on MLLog.dev</description><image><title>MLLog.dev</title><url>https://mllog.dev/images/default_mllog.png</url><link>https://mllog.dev/images/default_mllog.png</link></image><generator>Hugo -- 0.147.9</generator><language>pl</language><lastBuildDate>Tue, 09 Jun 2026 08:00:00 +0100</lastBuildDate><atom:link href="https://mllog.dev/pl/tags/repository-exploration/index.xml" rel="self" type="application/rss+xml"/><item><title>SWE-Explore: Benchmark oceniający jak agenci kodujący eksplorują repozytoria</title><link>https://mllog.dev/pl/posts/swe-explore-benchmarking-coding-agents-repository-exploration/</link><pubDate>Tue, 09 Jun 2026 08:00:00 +0100</pubDate><guid>https://mllog.dev/pl/posts/swe-explore-benchmarking-coding-agents-repository-exploration/</guid><description>SWE-Explore izoluje eksplorację repozytorium od generowania patchy - 848 issue&amp;#39;ów, 10 języków, 203 repozytoria. Benchmark ujawnia, że agenci świetnie znajdują właściwe pliki, ale fatalnie celują na poziomie linii kodu, a efektywność kontekstu koreluje z resolve rate na poziomie r = 0.950.</description></item></channel></rss>