Zastanawiałeś się kiedyś, czy ten drogi słoik “miodu akacjowego” rzeczywiście pochodzi z akacji? Albo czy etykieta mówi prawdę o kraju pochodzenia? Nowa publikacja pokazuje, że uczenie maszynowe i analiza minerałów mogą to sprawdzić — bez żadnego mikroskopu.

Skąd pomysł?

Gdy pszczoły produkują miód, przemycają do niego śladowe ilości pierwiastków z roślin i gleby. Te mineralne odciski palców — jak wapń, magnez czy cynk — różnią się zależnie od środowiska. To jak chemiczny podpis, który pozwala odczytać pochodzenie miodu.

Badacze wykorzystali zestaw 429 próbek miodu, w których zmierzono stężenia 12 pierwiastków: $$\mathrm{Al, B, Ba, Zn, Ca, Sr, Fe, P, K, Na, Mn, Mg}$$

Każda próbka miała etykiety:

  • Botaniczne — jakie kwiaty odwiedzały pszczoły (np. akacja, lipa).
  • Geograficzne — z którego regionu świata pochodzi miód.

Jak to działa?

Zastosowano popularne modele ML — SVM, drzewa decyzyjne, Random Forest — by przewidzieć:

  • Rodzaj kwiatów.
  • Region pochodzenia.

Najpierw dane zostały oczyszczone:

  • Braki zastąpiono zerami.
  • Wszystkie wartości przeskalowano (0–1):

$$x’_i = \frac{x_i - \min(x_i)}{\max(x_i) - \min(x_i)}$$

Skuteczność? Świetna!

ZadanieNajlepszy modelSkuteczność
Botaniczne (czysty miód)Random Forest99,50 %
Botaniczne (fałszowany)Random Forest99,44 %
Botaniczne (pełny zbiór)Random Forest99,30 %
Region geograficznyRandom Forest98,01 %

Random Forest rozpoznał 9 z 13 regionów z dokładnością 100 %. Najtrudniejszy był „America” (67 %).

Co z tego wynika?

  • Modele nieliniowe, jak Random Forest, najlepiej wykrywają złożone relacje między minerałami.
  • Dodanie syropu cukrowego nie zniszczyło klasyfikacji — metoda jest odporna na fałszowanie.
  • Przewidywanie regionu jest trudniejsze niż typu kwiatu — niektóre gleby są podobne.

Praktyczne zastosowanie

Badanie miodu można zautomatyzować: jeden pomiar pierwiastków (np. ICP-OES) + model ML = wynik z 99% pewnością. To ważne dla producentów, laboratoriów i konsumentów.

Co dalej?

  • Zrównoważyć dane (więcej próbek np. z USA).
  • Przetestować inne modele (np. RBF, sieci neuronowe).
  • Walidować na nowych próbkach z innych lat.
  • Użyć narzędzi wyjaśniających (np. SHAP), by zrozumieć, które pierwiastki są najważniejsze.

📎 Linki