Index spotrebiteľských cien je v centre záujmu už mnoho rokov, odkedy bol publikovaný v 90. rokoch v Českej republike, no nedávny rast cien vyvolal ďalšie otázky o metodike a zdrojoch údajov používaných v cenovej štatistike. Používatelia sa zaujímajú nielen o samotné čísla, ale aj o štatistickú problematiku ovplyvňujúcu interpretáciu a kvalitu indexu spotrebiteľských cien, ktorý sa často používa ako aproximácia miery inflácie. Príspevok predstavuje cenovú štatistiku zostavovanú Českým štatistickým úradom a špecificky sa zameriava na zdroje údajov a najmä údaje zo skenerov. Článok vysvetľuje, ako sa v oficiálnej tvorbe štatistiky implementujú pokročilé štatistické metódy, ako je strojové učenie. Myslíme si, že oficiálna štatistika je na historickej križovatke, kde sa budú zavádzať moderné metódy. Náš článok ukazuje využitie postupov strojového učenia aplikovaných na dáta zo skenera v rámci indexu spotrebiteľských cien. Použitá metóda je založená na logistickej regresii a výkonnom riešení Python a poskytuje rýchle a kvalitné výsledky.