Statpedia
Statpedia · metodológia

Jazyk od AI. Čísla od štátu.

Statpedia kombinuje veľký jazykový model s deterministickým vyhľadávaním v oficiálnej databáze ŠÚ SR. AI rozumie reči a vyberá metriku — každé jediné číslo však pochádza z autoritatívneho zdroja.

Composite score
87,5 %
cieľ 95 %
na 842-otázkovom benchmarku
Value accuracy
90 %
cieľ 95 %
správnosť čísla v odpovedi
Spoľahlivosť
1 / 200
cieľ 1 / 500
priebežne meraná miera halucinácií
Priemerná latencia
~ 22 s
cieľ pod 10 s
cesta k cieľu · v progrese
Cena za 1 odpoveď
~ 6 ¢
cieľ pod 3 ¢
priemer na jednu otázku · jednoduché lacnejšie, komplexné drahšie
Aktuálny stavCieľ kam smerujeme
01princíp

Rozdelenie zodpovedností.

Najčastejšia kritika AI nástrojov je halucinácia — model si vymyslí číslo, ktoré znie pravdivo. Statpedia to obchádza inak: jazyk a dáta majú oddelené role a žiaden z nich nemá právomoc toho druhého.

AI rozumie otázke v slovenčine, identifikuje metriku, región a obdobie, a skladá ľudskú odpoveď s kontextom. Žiadne číslo však nevymýšľa — každé pochádza z DATAcube ŠÚ SR. Ak agent v dátach nenájde pokrytie pre dotaz, čestne odmietne odpovedať namiesto pokusu o aproximáciu.

„Jazyk si berieme od AI. Čísla výhradne od ŠÚ SR."
02limity

Čo Statpedia robí — a čo nerobí.

Otvorenosť o limitoch je rovnako dôležitá ako schopnosti. Tu je oboje:

Statpedia robí

  • Sprístupňuje verejné dáta zo Štatistického úradu v ľudskej forme.
  • Pri každej odpovedi uvádza zdrojovú DATAcube kocku na overenie.
  • Hľadá súvislosti medzi metrikami v jednej odpovedi.
  • Pravidelne sa aktualizuje podľa nových publikácií ŠÚ SR.

Statpedia nerobí

  • Nemá vlastné dáta — všetko pochádza z DATAcube ŠÚ SR.
  • Nie je oficiálnym zdrojom — pri rozpore má prednosť ŠÚ SR.
  • Nenahrádza analytika — pre hĺbkovú analýzu treba odborníka.
03kde to zlyháva

Tri hlavné typy chýb.

Tieto vzorce vysvetľujú väčšinu zlyhaní v aktuálnom benchmarku. Pracujeme na nich postupne — verejne a otvorene.

1

Over-cautious refusals

Agent odmietne odpovedať na otázku, ktorú by zvládol — z prílišnej opatrnosti. Najčastejšie pri menej obvyklých regiónoch alebo metrikách.

2

Value extraction

Agent vyberie zlý stĺpec alebo riadok zo správnej tabuľky — napríklad zamení medziročnú zmenu za absolútnu hodnotu.

3

Trend interpretation

Pri otázkach typu „ako sa to vyvíja" agent niekedy vráti len posledné číslo namiesto časového radu, alebo nesprávne porovná obdobia.

04overenie

Každá odpoveď má zdroj.

Pri každom čísle, ktoré Statpedia uvedie, nájdeš odkaz na konkrétnu DATAcube kocku — identifikátor formátu pr3101qr. Z neho vieš odpoveď overiť priamo na portáli ŠÚ SR. Je to záruka, že nič nevymýšľame.

ZDROJ ODPOVEDE
Štatistický úrad SR · DATAcube
cube · pr3101qr · aktualizované 15. 12. 2025
otvoriť ŠÚ SR

Ak agent niekde uvedie hodnotu, ktorá nesedí so ŠÚ SR, prosíme napíšte nám — každá hlásená chyba ide do benchmarku a pomáha to ďalším.

05pokračujte

Vyskúšaj to v praxi.

Najlepší spôsob ako overiť že to funguje — položiť vlastnú otázku a porovnať odpoveď so ŠÚ SR.