Statpedia
Statpedia · o projekte

Štatistiky, ktoré pochopí každý.

Slovensko má jednu z najlepších štátnych štatistických databáz v regióne. Statpedia je vrstvou medzi týmito surovými dátami a ľuďmi, ktorí ich potrebujú — pridáva kontext, historický trend, regionálne porovnanie a AI agenta, ktorý rozumie slovenskej reči.

Dátové kocky
686
zo ŠÚ SR DATAcube
Ukazovatele
4,2 mil.
individuálnych čísel
Pokryté obce
2 927
všetky slovenské
História dát
30+
rokov, niektoré od 1993
01prečo

Dáta sú verejné. Cesta k nim nie.

Štatistický úrad SR má jednu z najlepších otvorených štatistických databáz v Európe. Problém nie je v dátach — problém je, ako sa k nim dostať.

Predstav si, že chceš zistiť priemernú mzdu vo svojom kraji za posledný rok. Cez oficiálny portál ŠÚ SR ťa čaká toto:

CEZ DATACUBE

Kódy kociek a tabuľkové procesory

  • vybrať tematickú oblasť z 32 možností
  • nájsť kód kocky (napr. pr3101qr)
  • nastaviť 6 dimenzií tabuľky
  • exportovať do CSV, otvoriť v Exceli
  • zorientovať sa v stĺpcoch
CEZ STATPEDIU

Odpoveď v jazyku, ktorému rozumieš

  • napíš otázku v normálnom jazyku
  • odpoveď s číslom, kontextom a zdrojom
  • follow-up otázky pre detail

Či potrebuješ rýchle číslo do článku, alebo celú tabuľku pre vlastnú analýzu — Statpedia zvládne oboje. Novinár dostane jedno číslo s kontextom, študent vysvetlenie, výskumník odkaz priamo na zdrojový dataset v DATAcube. Surové dáta neskrývame — vedieme ťa k nim bez siedmich krokov a kódov kociek.

02ako to funguje

Tri vrstvy. Jeden výsledok.

Statpedia nemá vlastné dáta. Sú to lepšie dvere k oficiálnemu zdroju — s kontextom, regionálnym porovnaním a konverzačným prístupom.

Pripravené odpovede

/rychle-odpovede

Na časté otázky o slovenských štatistikách — priemerné mzdy, inflácia, populácia, priemysel — máme pripravené články s aktuálnymi číslami, grafom a kontextom. Žiadne čakanie na AI, žiadne klikanie cez sedem krokov DATAcube.

AI chat

/chat

Pre otázky, ktoré nesedia do žiadnej hotovej stránky. AI agent rozumie slovenskej reči, dohľadáva relevantné dáta, kombinuje viaceré zdroje a vždy uvádza, z ktorej kocky čerpal.

03kde sa práve zlepšujeme

Statpedia nie je hotový produkt.

Je to projekt, ktorý sa každý mesiac mení k lepšiemu. Aktuálne štyri priority:

PRIORITA 1

Presnosť odpovedí

Vlastný benchmark s testovacími otázkami, automatické porovnanie každej zmeny voči očakávaným odpovediam, postupná redukcia chybnej interpretácie čísel a halucinácií.

aktívne · každá deploy verzia
PRIORITA 2

Nižšia latencia

Optimalizácia pipeline od dotazu k odpovedi. Caching často kladených otázok, paralelné spracovanie, výber rýchlejších modelov tam, kde sa nestrácí kvalita.

aktívne · postupné kroky
PRIORITA 3

Zníženie ceny odpovedí

Inteligentný cache pre opakované a parafrázované otázky, lacnejší model pre extrakciu úmyslu, presnejšie čítanie dát aby agent nemíňal tokeny na zbytočné kroky. Cieľ: udržať službu free pri raste návštevnosti.

aktívne · cache + smart routing
PRIORITA 4

Širšie pokrytie

Pravidelné dopĺňanie nových tematických oblastí — školstvo, zdravotníctvo, doprava, životné prostredie. Hlbšie regionálne moduly pre obce a okresy.

plánované · kvartálne sprinty
04budúci vývoj

DATAcube je základ. Ekosystém je širší.

Statpedia je vo vývoji a DATAcube je jej prvý — zatiaľ jediný — zdroj. Nie vždy nájde dáta, ktoré v DATAcube reálne sú; to je presne to, na čom pracujeme. Zároveň sme si vedomí, že DATAcube je len jeden kúsok slovenského dátového ekosystému. Toto je mapa toho, čo by dávalo zmysel pridať ďalej — nie roadmap s termínmi, ale orientačný pohľad na to, kde sú medzery.

najbližší krok

Eurostat

Rovnaký JSON-stat formát ako DATAcube — existujúci parser sa dá znova použiť. Pridáva schopnosť porovnávať slovenské čísla s EÚ a V4. Efekt viditeľný hneď.

najbližší krok

NBS

ŠÚ pokrýva makroekonomiku, ale finančné dáta — úrokové sadzby, hypotéky, vklady — sú v Národnej banke. Čísla, ktoré ľudí reálne zaujímajú a Statpedia tu má medzeru.

pred obcami

Geo vrstva · ÚGKK / ZBGIS

Municipality pages pre všetky obce potrebujú aspoň hranice obcí a register adries. Bez toho sa regionálny modul neposkladá poriadne.

licenčná kontrola

Slovensko.Digital DataHub

Agreguje viacero registrov naraz — CRZ, RPO, Obchodný vestník, účtovné závierky. Jeden krok otvorí niekoľko zdrojov. Treba overiť podmienky pre produkčné použitie.

Sektorové dáta — NCZI, SHMÚ, SAŽP — sú zaujímavé až vo fáze, keď bude jasné, že o to používatelia stoja. NCZI má hlavne PDF ročenky vhodné pre RAG; SHMÚ nemá stabilné API a treba rátať s krehkosťou. Národný katalóg data.slovensko.sk by sa dal využiť na automatické sledovanie nových datasetov — skôr neskorší krok, keď bude základ stabilný.

FinStat rieši firmy, Slovensko.Digital registre, LexDATA legislatívu. Statpedia by mohla byť tým, čo zjednocuje štatistické a verejné dáta s prirodzeným jazykom pre bežného človeka — ale to je hypotéza, ktorú treba overiť na používateľoch, nie deklarovať dopredu.
05pre koho

Štyri typické otázky, jeden nástroj.

Statpedia neslúži všetkým rovnako. Každý z týchto ľudí prichádza s inou potrebou — ale všetci dostanú odpoveď v jazyku, ktorému rozumejú.

N
Novinár
overuje číslo do článku

Píšem o regionálnych rozdieloch v príjmoch. Aká je priemerná mzda vo všetkých 8 krajoch za posledný štvrťrok?"

Š
Študent
pripravuje seminárku

Robím prácu o starnutí populácie. Ako sa za posledných 20 rokov menil priemerný vek v Banskobystrickom kraji?"

A
Analytik
samospráva, výskum, banka

Pripravujem report pre regionálne zastúpenie. Porovnaj nezamestnanosť vo všetkých okresoch Prešovského kraja za posledných 5 rokov."

O
Občan
osobné rozhodnutie

Sťahujem sa do Žiliny. Ako vyzerá v meste priemerný vek obyvateľov, mzdy a aké sú trendy s cenami nehnuteľností?"

06zdroj a limity

Čo Statpedia robí — a čo nerobí.

Otvorenosť o tom, kde projekt končí, je rovnako dôležitá ako to, čo dokáže. Tu je oboje:

Statpedia robí

  • Sprístupňuje verejné dáta zo Štatistického úradu v ľudskej forme.
  • Pri každej odpovedi uvádza zdrojovú kocku (napr. pr3101qr) na overenie.
  • Hľadá súvislosti medzi metrikami (mzda + populácia + región) v jednej odpovedi.
  • Pravidelne sa aktualizuje podľa nových dátových publikácií ŠÚ SR.

Statpedia nerobí

  • Nemá vlastné dáta — všetko pochádza z DATAcube ŠÚ SR.
  • Nie je oficiálnym zdrojom — pri rozpore má prednosť ŠÚ SR.
  • Nenahrádza analytika — pre hĺbkovú analýzu potrebuješ odborníka.
  • Nie je neomylná — AI môže zle interpretovať otázku, preto vždy uvádzame zdroj na overenie.
07kto za projektom stojí

Solo projekt, otvorene.

Peter — autor projektu Statpedia

Peter

autor · údržba · vízia

„Statpediu som postavil sám popri zamestnaní, lebo dáta zo Štatistického úradu sú síce verejné, ale ich UI to nikdy neuľahčilo. Začalo to ako experiment s AI agentom nad slovenskými dátami — dnes je to nástroj, ktorý chce pomáhať ľuďom dostať sa k číslu, ktoré potrebujú."