Jazyk od AI. Čísla od štátu.
Statpedia kombinuje veľký jazykový model s deterministickým vyhľadávaním v oficiálnej databáze ŠÚ SR. AI rozumie reči a vyberá metriku — každé jediné číslo však pochádza z autoritatívneho zdroja.
Rozdelenie zodpovedností.
Najčastejšia kritika AI nástrojov je halucinácia — model si vymyslí číslo, ktoré znie pravdivo. Statpedia to obchádza inak: jazyk a dáta majú oddelené role a žiaden z nich nemá právomoc toho druhého.
AI rozumie otázke v slovenčine, identifikuje metriku, región a obdobie, a skladá ľudskú odpoveď s kontextom. Žiadne číslo však nevymýšľa — každé pochádza z DATAcube ŠÚ SR. Ak agent v dátach nenájde pokrytie pre dotaz, čestne odmietne odpovedať namiesto pokusu o aproximáciu.
„Jazyk si berieme od AI. Čísla výhradne od ŠÚ SR."
Čo Statpedia robí — a čo nerobí.
Otvorenosť o limitoch je rovnako dôležitá ako schopnosti. Tu je oboje:
Statpedia robí
- Sprístupňuje verejné dáta zo Štatistického úradu v ľudskej forme.
- Pri každej odpovedi uvádza zdrojovú DATAcube kocku na overenie.
- Hľadá súvislosti medzi metrikami v jednej odpovedi.
- Pravidelne sa aktualizuje podľa nových publikácií ŠÚ SR.
Statpedia nerobí
- Nemá vlastné dáta — všetko pochádza z DATAcube ŠÚ SR.
- Nie je oficiálnym zdrojom — pri rozpore má prednosť ŠÚ SR.
- Nenahrádza analytika — pre hĺbkovú analýzu treba odborníka.
Tri hlavné typy chýb.
Tieto vzorce vysvetľujú väčšinu zlyhaní v aktuálnom benchmarku. Pracujeme na nich postupne — verejne a otvorene.
Over-cautious refusals
Agent odmietne odpovedať na otázku, ktorú by zvládol — z prílišnej opatrnosti. Najčastejšie pri menej obvyklých regiónoch alebo metrikách.
Value extraction
Agent vyberie zlý stĺpec alebo riadok zo správnej tabuľky — napríklad zamení medziročnú zmenu za absolútnu hodnotu.
Trend interpretation
Pri otázkach typu „ako sa to vyvíja" agent niekedy vráti len posledné číslo namiesto časového radu, alebo nesprávne porovná obdobia.
Každá odpoveď má zdroj.
Pri každom čísle, ktoré Statpedia uvedie, nájdeš odkaz na konkrétnu DATAcube kocku — identifikátor formátu pr3101qr. Z neho vieš odpoveď overiť priamo na portáli ŠÚ SR. Je to záruka, že nič nevymýšľame.
Ak agent niekde uvedie hodnotu, ktorá nesedí so ŠÚ SR, prosíme napíšte nám — každá hlásená chyba ide do benchmarku a pomáha to ďalším.
Vyskúšaj to v praxi.
Najlepší spôsob ako overiť že to funguje — položiť vlastnú otázku a porovnať odpoveď so ŠÚ SR.