Statpedia · metodológia

Jazyk od AI. Čísla od štátu.

Statpedia kombinuje veľký jazykový model s deterministickým vyhľadávaním v oficiálnej databáze ŠÚ SR. AI rozumie reči a vyberá metriku — každé jediné číslo však pochádza z autoritatívneho zdroja.

Composite score

87,5 %

→ cieľ 95 %

na 842-otázkovom benchmarku

Value accuracy

90 %

→ cieľ 95 %

správnosť čísla v odpovedi

Spoľahlivosť

1 / 200

→ cieľ 1 / 500

priebežne meraná miera halucinácií

Priemerná latencia

~ 22 s

→ cieľ pod 10 s

cesta k cieľu · v progrese

Cena za 1 odpoveď

~ 6 ¢

→ cieľ pod 3 ¢

priemer na jednu otázku · jednoduché lacnejšie, komplexné drahšie

Aktuálny stavCieľ kam smerujeme

01 — princíp

Rozdelenie zodpovedností.

Najčastejšia kritika AI nástrojov je halucinácia — model si vymyslí číslo, ktoré znie pravdivo. Statpedia to obchádza inak: jazyk a dáta majú oddelené role a žiaden z nich nemá právomoc toho druhého.

AI rozumie otázke v slovenčine, identifikuje metriku, región a obdobie, a skladá ľudskú odpoveď s kontextom. Žiadne číslo však nevymýšľa — každé pochádza z DATAcube ŠÚ SR. Ak agent v dátach nenájde pokrytie pre dotaz, čestne odmietne odpovedať namiesto pokusu o aproximáciu.

„Jazyk si berieme od AI. Čísla výhradne od ŠÚ SR."

02 — limity

Čo Statpedia robí — a čo nerobí.

Otvorenosť o limitoch je rovnako dôležitá ako schopnosti. Tu je oboje:

Statpedia robí

Sprístupňuje verejné dáta zo Štatistického úradu v ľudskej forme.
Pri každej odpovedi uvádza zdrojovú DATAcube kocku na overenie.
Hľadá súvislosti medzi metrikami v jednej odpovedi.
Pravidelne sa aktualizuje podľa nových publikácií ŠÚ SR.

Statpedia nerobí

Nemá vlastné dáta — všetko pochádza z DATAcube ŠÚ SR.
Nie je oficiálnym zdrojom — pri rozpore má prednosť ŠÚ SR.
Nenahrádza analytika — pre hĺbkovú analýzu treba odborníka.

03 — kde to zlyháva

Tri hlavné typy chýb.

Tieto vzorce vysvetľujú väčšinu zlyhaní v aktuálnom benchmarku. Pracujeme na nich postupne — verejne a otvorene.

Over-cautious refusals

Agent odmietne odpovedať na otázku, ktorú by zvládol — z prílišnej opatrnosti. Najčastejšie pri menej obvyklých regiónoch alebo metrikách.

Value extraction

Agent vyberie zlý stĺpec alebo riadok zo správnej tabuľky — napríklad zamení medziročnú zmenu za absolútnu hodnotu.

Trend interpretation

Pri otázkach typu „ako sa to vyvíja" agent niekedy vráti len posledné číslo namiesto časového radu, alebo nesprávne porovná obdobia.

04 — overenie

Každá odpoveď má zdroj.

Pri každom čísle, ktoré Statpedia uvedie, nájdeš odkaz na konkrétnu DATAcube kocku — identifikátor formátu pr3101qr. Z neho vieš odpoveď overiť priamo na portáli ŠÚ SR. Je to záruka, že nič nevymýšľame.

ZDROJ ODPOVEDE

Štatistický úrad SR · DATAcube

cube · pr3101qr · aktualizované 15. 12. 2025

otvoriť ŠÚ SR

Ak agent niekde uvedie hodnotu, ktorá nesedí so ŠÚ SR, prosíme napíšte nám — každá hlásená chyba ide do benchmarku a pomáha to ďalším.

05 — pokračujte

Vyskúšaj to v praxi.

Najlepší spôsob ako overiť že to funguje — položiť vlastnú otázku a porovnať odpoveď so ŠÚ SR.

Spýtať sa AI O projekte Spätná väzba