Štatistiky, ktoré pochopí každý.
Slovensko má jednu z najlepších štátnych štatistických databáz v regióne. Statpedia je vrstvou medzi týmito surovými dátami a ľuďmi, ktorí ich potrebujú — pridáva kontext, historický trend, regionálne porovnanie a AI agenta, ktorý rozumie slovenskej reči.
Dáta sú verejné. Cesta k nim nie.
Štatistický úrad SR má jednu z najlepších otvorených štatistických databáz v Európe. Problém nie je v dátach — problém je, ako sa k nim dostať.
Predstav si, že chceš zistiť priemernú mzdu vo svojom kraji za posledný rok. Cez oficiálny portál ŠÚ SR ťa čaká toto:
Kódy kociek a tabuľkové procesory
- vybrať tematickú oblasť z 32 možností
- nájsť kód kocky (napr. pr3101qr)
- nastaviť 6 dimenzií tabuľky
- exportovať do CSV, otvoriť v Exceli
- zorientovať sa v stĺpcoch
Odpoveď v jazyku, ktorému rozumieš
- napíš otázku v normálnom jazyku
- odpoveď s číslom, kontextom a zdrojom
- follow-up otázky pre detail
Či potrebuješ rýchle číslo do článku, alebo celú tabuľku pre vlastnú analýzu — Statpedia zvládne oboje. Novinár dostane jedno číslo s kontextom, študent vysvetlenie, výskumník odkaz priamo na zdrojový dataset v DATAcube. Surové dáta neskrývame — vedieme ťa k nim bez siedmich krokov a kódov kociek.
Tri vrstvy. Jeden výsledok.
Statpedia nemá vlastné dáta. Sú to lepšie dvere k oficiálnemu zdroju — s kontextom, regionálnym porovnaním a konverzačným prístupom.
Pripravené odpovede
Na časté otázky o slovenských štatistikách — priemerné mzdy, inflácia, populácia, priemysel — máme pripravené články s aktuálnymi číslami, grafom a kontextom. Žiadne čakanie na AI, žiadne klikanie cez sedem krokov DATAcube.
AI chat
Pre otázky, ktoré nesedia do žiadnej hotovej stránky. AI agent rozumie slovenskej reči, dohľadáva relevantné dáta, kombinuje viaceré zdroje a vždy uvádza, z ktorej kocky čerpal.
Statpedia nie je hotový produkt.
Je to projekt, ktorý sa každý mesiac mení k lepšiemu. Aktuálne štyri priority:
Presnosť odpovedí
Vlastný benchmark s testovacími otázkami, automatické porovnanie každej zmeny voči očakávaným odpovediam, postupná redukcia chybnej interpretácie čísel a halucinácií.
Nižšia latencia
Optimalizácia pipeline od dotazu k odpovedi. Caching často kladených otázok, paralelné spracovanie, výber rýchlejších modelov tam, kde sa nestrácí kvalita.
Zníženie ceny odpovedí
Inteligentný cache pre opakované a parafrázované otázky, lacnejší model pre extrakciu úmyslu, presnejšie čítanie dát aby agent nemíňal tokeny na zbytočné kroky. Cieľ: udržať službu free pri raste návštevnosti.
Širšie pokrytie
Pravidelné dopĺňanie nových tematických oblastí — školstvo, zdravotníctvo, doprava, životné prostredie. Hlbšie regionálne moduly pre obce a okresy.
DATAcube je základ. Ekosystém je širší.
Statpedia je vo vývoji a DATAcube je jej prvý — zatiaľ jediný — zdroj. Nie vždy nájde dáta, ktoré v DATAcube reálne sú; to je presne to, na čom pracujeme. Zároveň sme si vedomí, že DATAcube je len jeden kúsok slovenského dátového ekosystému. Toto je mapa toho, čo by dávalo zmysel pridať ďalej — nie roadmap s termínmi, ale orientačný pohľad na to, kde sú medzery.
Eurostat
Rovnaký JSON-stat formát ako DATAcube — existujúci parser sa dá znova použiť. Pridáva schopnosť porovnávať slovenské čísla s EÚ a V4. Efekt viditeľný hneď.
NBS
ŠÚ pokrýva makroekonomiku, ale finančné dáta — úrokové sadzby, hypotéky, vklady — sú v Národnej banke. Čísla, ktoré ľudí reálne zaujímajú a Statpedia tu má medzeru.
Geo vrstva · ÚGKK / ZBGIS
Municipality pages pre všetky obce potrebujú aspoň hranice obcí a register adries. Bez toho sa regionálny modul neposkladá poriadne.
Slovensko.Digital DataHub
Agreguje viacero registrov naraz — CRZ, RPO, Obchodný vestník, účtovné závierky. Jeden krok otvorí niekoľko zdrojov. Treba overiť podmienky pre produkčné použitie.
Sektorové dáta — NCZI, SHMÚ, SAŽP — sú zaujímavé až vo fáze, keď bude jasné, že o to používatelia stoja. NCZI má hlavne PDF ročenky vhodné pre RAG; SHMÚ nemá stabilné API a treba rátať s krehkosťou. Národný katalóg data.slovensko.sk by sa dal využiť na automatické sledovanie nových datasetov — skôr neskorší krok, keď bude základ stabilný.
FinStat rieši firmy, Slovensko.Digital registre, LexDATA legislatívu. Statpedia by mohla byť tým, čo zjednocuje štatistické a verejné dáta s prirodzeným jazykom pre bežného človeka — ale to je hypotéza, ktorú treba overiť na používateľoch, nie deklarovať dopredu.
Štyri typické otázky, jeden nástroj.
Statpedia neslúži všetkým rovnako. Každý z týchto ľudí prichádza s inou potrebou — ale všetci dostanú odpoveď v jazyku, ktorému rozumejú.
„Píšem o regionálnych rozdieloch v príjmoch. Aká je priemerná mzda vo všetkých 8 krajoch za posledný štvrťrok?"
„Robím prácu o starnutí populácie. Ako sa za posledných 20 rokov menil priemerný vek v Banskobystrickom kraji?"
„Pripravujem report pre regionálne zastúpenie. Porovnaj nezamestnanosť vo všetkých okresoch Prešovského kraja za posledných 5 rokov."
„Sťahujem sa do Žiliny. Ako vyzerá v meste priemerný vek obyvateľov, mzdy a aké sú trendy s cenami nehnuteľností?"
Čo Statpedia robí — a čo nerobí.
Otvorenosť o tom, kde projekt končí, je rovnako dôležitá ako to, čo dokáže. Tu je oboje:
Statpedia robí
- Sprístupňuje verejné dáta zo Štatistického úradu v ľudskej forme.
- Pri každej odpovedi uvádza zdrojovú kocku (napr. pr3101qr) na overenie.
- Hľadá súvislosti medzi metrikami (mzda + populácia + región) v jednej odpovedi.
- Pravidelne sa aktualizuje podľa nových dátových publikácií ŠÚ SR.
Statpedia nerobí
- Nemá vlastné dáta — všetko pochádza z DATAcube ŠÚ SR.
- Nie je oficiálnym zdrojom — pri rozpore má prednosť ŠÚ SR.
- Nenahrádza analytika — pre hĺbkovú analýzu potrebuješ odborníka.
- Nie je neomylná — AI môže zle interpretovať otázku, preto vždy uvádzame zdroj na overenie.
Solo projekt, otvorene.

Peter
autor · údržba · vízia
„Statpediu som postavil sám popri zamestnaní, lebo dáta zo Štatistického úradu sú síce verejné, ale ich UI to nikdy neuľahčilo. Začalo to ako experiment s AI agentom nad slovenskými dátami — dnes je to nástroj, ktorý chce pomáhať ľuďom dostať sa k číslu, ktoré potrebujú."