Zastanawiałeś się kiedyś, czy ten drogi słoik “miodu akacjowego” rzeczywiście pochodzi z akacji? Albo czy etykieta mówi prawdę o kraju pochodzenia? Nowa publikacja pokazuje, że uczenie maszynowe i analiza minerałów mogą to sprawdzić — bez żadnego mikroskopu.
Skąd pomysł?
Gdy pszczoły produkują miód, przemycają do niego śladowe ilości pierwiastków z roślin i gleby. Te mineralne odciski palców — jak wapń, magnez czy cynk — różnią się zależnie od środowiska. To jak chemiczny podpis, który pozwala odczytać pochodzenie miodu.
Badacze wykorzystali zestaw 429 próbek miodu, w których zmierzono stężenia 12 pierwiastków: $$\mathrm{Al, B, Ba, Zn, Ca, Sr, Fe, P, K, Na, Mn, Mg}$$
Każda próbka miała etykiety:
- Botaniczne — jakie kwiaty odwiedzały pszczoły (np. akacja, lipa).
- Geograficzne — z którego regionu świata pochodzi miód.
Jak to działa?
Zastosowano popularne modele ML — SVM, drzewa decyzyjne, Random Forest — by przewidzieć:
- Rodzaj kwiatów.
- Region pochodzenia.
Najpierw dane zostały oczyszczone:
- Braki zastąpiono zerami.
- Wszystkie wartości przeskalowano (0–1):
$$x’_i = \frac{x_i - \min(x_i)}{\max(x_i) - \min(x_i)}$$
Skuteczność? Świetna!
Zadanie | Najlepszy model | Skuteczność |
---|---|---|
Botaniczne (czysty miód) | Random Forest | 99,50 % |
Botaniczne (fałszowany) | Random Forest | 99,44 % |
Botaniczne (pełny zbiór) | Random Forest | 99,30 % |
Region geograficzny | Random Forest | 98,01 % |
Random Forest rozpoznał 9 z 13 regionów z dokładnością 100 %. Najtrudniejszy był „America” (67 %).
Co z tego wynika?
- Modele nieliniowe, jak Random Forest, najlepiej wykrywają złożone relacje między minerałami.
- Dodanie syropu cukrowego nie zniszczyło klasyfikacji — metoda jest odporna na fałszowanie.
- Przewidywanie regionu jest trudniejsze niż typu kwiatu — niektóre gleby są podobne.
Praktyczne zastosowanie
Badanie miodu można zautomatyzować: jeden pomiar pierwiastków (np. ICP-OES) + model ML = wynik z 99% pewnością. To ważne dla producentów, laboratoriów i konsumentów.
Co dalej?
- Zrównoważyć dane (więcej próbek np. z USA).
- Przetestować inne modele (np. RBF, sieci neuronowe).
- Walidować na nowych próbkach z innych lat.
- Użyć narzędzi wyjaśniających (np. SHAP), by zrozumieć, które pierwiastki są najważniejsze.
📎 Linki
- Na podstawie publikacji 📄 arXiv:2507.22032 PDF