Fotka účtenky = zaúčtováno: jak AI zpracovává doklady

Vyfotíte účtenku, pošlete ji a za pár sekund máte hotový účetní záznam se všemi údaji. Zní to jako kouzlo, ale ve skutečnosti za tím stojí sofistikovaná kombinace technologií, které se vyvíjely desítky let. OCR (optické rozpoznávání znaků), strojové učení, počítačové vidění a zpracování přirozeného jazyka společně tvoří systém, který dokáže "přečíst" papírový doklad a přeměnit ho na strukturovaná data.
V tomto článku se podíváme pod kapotu celého procesu. Vysvětlíme, jak přesně AI "vidí" a "čte" vaši účtenku, jaké informace z ní extrahuje, jak přesné výsledky můžete čekat a na co si dát pozor. Vše technicky přesně, ale srozumitelně -- žádné akademické fráze, jen praktické vysvětlení toho, co se děje od momentu stisknutí spouště fotoaparátu po uložení záznamu do vaší evidence.
Krok 1: Pořízení snímku -- co ovlivňuje kvalitu zpracování
Vše začíná fotografií. A i když moderní AI systémy zvládnou i poměrně nekvalitní snímky, určitá pravidla pomohou dosáhnout lepších výsledků.
Co AI potřebuje vidět
Na účtence nebo faktuře jsou z účetního pohledu důležité tyto údaje:
- Dodavatel (název firmy, IČO, DIČ)
- Datum vystavení a případně datum zdanitelného plnění
- Celková částka
- Sazba a výše DPH (pokud jste plátce)
- Základ daně
- Popis zboží nebo služby (pro správnou kategorizaci)
- Číslo dokladu (pro případnou kontrolu)
Tipy pro lepší fotky dokladů
- Rovný pohled shora -- fotografujte doklad kolmo, ne pod úhlem
- Dostatečné osvětlení -- nejlepší je denní světlo, vyhněte se ostrým stínům
- Celý doklad v záběru -- ujistěte se, že jsou viditelné všechny okraje
- Stabilní ruce -- přidržte telefon oběma rukama nebo opřete o stůl
- Vyhlazený doklad -- pokud je účtenka zmačkaná, před focením ji natáhněte
- Pozor na odlesky -- lesklé termopapíry mohou odrážet světlo
I když nesplníte všechny podmínky, moderní AI si s většinou situací poradí. Ale čím lepší vstup, tím rychlejší a přesnější výsledek.
Co se děje v telefonu před odesláním
Ještě než fotku odešlete, váš telefon provede základní optimalizace: automatické ostření, korekci expozice a kompresi obrázku. WhatsApp pak fotku mírně komprimuje pro rychlejší odeslání, ale zachovává dostatečnou kvalitu pro čtení textu. Rozlišení typické WhatsApp fotky (přibližně 1600 x 1200 pixelů) je pro OCR zpracování více než dostatečné.
Krok 2: Předzpracování obrazu -- příprava pro rozpoznávání
Když AI systém přijme váš obrázek, nezačne okamžitě "číst" text. Nejprve provede sérii úprav, které dramaticky zlepšují přesnost rozpoznávání.
Geometrická korekce
Pokud jste fotili pod úhlem, systém detekuje perspektivní zkreslení a obrázek "narovná". Představte si, že fotografujete účtenku ležící na stole z mírného úhlu -- AI dokáže dopočítat, jak by doklad vypadal při pohledu přímo shora, a obrázek podle toho transformuje.
Korekce osvětlení
Nerovnoměrné osvětlení (například stín z ruky) může způsobit, že část textu je tmavá a část světlá. Systém provede adaptivní vyrovnání jasu, aby celý dokument měl konzistentní kontrast.
Převod na černobílý obraz
Pro účely OCR je barevná informace zbytečná -- důležitý je jen kontrast mezi textem a pozadím. Systém převede obrázek do černobílé (binární) podoby, kde je text černý na bílém pozadí. Tento proces se nazývá binarizace a existují sofistikované algoritmy, které se přizpůsobují různým podmínkám fotografie.
Detekce orientace
Pokud jste fotili doklad vzhůru nohama nebo otočený o 90 stupňů, systém automaticky detekuje správnou orientaci textu a obrázek otočí.
Odstranění šumu
Papírová textura, drobné skvrny, pozadí stolu -- to vše je "šum", který AI musí odfiltrovat, aby se soustředil pouze na relevantní text a čísla.
Proč je předzpracování tak důležité
Bez předzpracování by přesnost OCR u běžných fotografií z mobilu dosahovala pouze 70-80 %. Díky automatickým korekcím se přesnost zvyšuje na 95-99 %+. Rozdíl mezi 80% a 99% přesností znamená u účtenky s 10 poli rozdíl mezi 2 chybami a prakticky žádnou chybou.
Krok 3: OCR -- rozpoznávání textu z obrázku
Teď přichází jádro celého procesu: optické rozpoznávání znaků (OCR). Zjednodušeně řečeno, systém "čte" text z obrázku. Ale moderní OCR je mnohem sofistikovanější, než si většina lidí představuje.
Jak OCR "vidí" písmena
Tradiční OCR systémy porovnávaly tvary na obrázku s předem uloženou databází písem. Moderní systémy založené na hlubokém učení (deep learning) fungují jinak -- naučily se rozpoznávat znaky ze stovek milionů příkladů, podobně jako se lidské dítě učí číst.
Proces probíhá v několika fázích:
Detekce textových oblastí -- Neuronová síť nejprve identifikuje, kde na obrázku se nachází text. Odliší text od loga, čárových kódů, obrázků a dekorativních prvků.
Segmentace řádků -- Text se rozdělí na jednotlivé řádky. U účtenek to bývá jednoduché (řádky jsou jasně oddělené), u faktur s tabulkami složitější.
Rozpoznání znaků -- Každý řádek se analyzuje a jednotlivé znaky (písmena, číslice, interpunkce) se identifikují. Moderní systémy zpracovávají celé řádky najednou, což zlepšuje přesnost -- kontext okolních znaků pomáhá rozpoznat i méně čitelné znaky.
Jazyková korekce -- Rozpoznaný text se porovná s jazykovým modelem. Pokud OCR "přečte" slovo "čásfka" místo "částka", jazykový model opravu navrhne. Tato postprocessingová fáze výrazně snižuje chybovost.
Přesnost moderního OCR v číslech
| Typ dokladu | Přesnost na úrovni znaků | Přesnost na úrovni polí | |------------|--------------------------|------------------------| | Tištěná faktura (PDF kvalita) | 99,5 %+ | 99 %+ | | Tištěná účtenka (termopapír, dobrá kvalita) | 98-99 % | 95-99 % | | Tištěná účtenka (vybledlá, pomačkaná) | 93-97 % | 85-95 % | | Rukou psaný doklad | 85-92 % | 70-85 % | | Doklad pod úhlem (korekce zapnuta) | 96-99 % | 93-98 % | | Špatně osvětlený doklad | 90-96 % | 82-93 % |
Přesnost na úrovni znaků = procento správně rozpoznaných jednotlivých znaků. Přesnost na úrovni polí = procento polí (datum, částka, dodavatel), kde je celý údaj rozpoznán správně.
Pro srovnání: lidský přepis dat má průměrnou chybovost 1-4 % na úrovni polí. U monotónního přepisování (například 50 účtenek za sebou) chybovost roste s únavou.
Krok 4: Inteligentní extrakce dat -- od textu ke strukturovaným údajům
OCR vám dá "surový" text. Ale text "Celkem: 1 234,50 Kč" je pro počítač stále jen řetězec znaků. Dalším krokem je pochopení, co ten text znamená -- přiřazení správných hodnot ke správným polím.
Jak AI rozumí struktuře dokladu
Každý obchod, restaurace nebo dodavatel používá jiný formát účtenky. Albert má jiné rozvržení než Lidl, benzínka jiné než lékárna. Přesto AI dokáže ze všech extrahovat stejné informace. Jak?
Layout analýza -- AI analyzuje prostorové rozvržení textu na dokladu. Rozpozná hlavičku (informace o prodejci), tělo (seznam položek) a patičku (součty, DPH, platba).
Kontextové rozpoznávání -- Systém hledá klíčová slova a vzory. "Celkem", "Součet", "K úhradě" signalizují celkovou částku. "DPH", "21 %", "15 %" signalizují daňové informace. "Datum", mezera a formát DD.MM.RRRR signalizují datum vystavení.
Vztahové mapování -- AI chápe vztahy mezi údaji. Číslo za slovem "Celkem" je celková částka. Procento za "DPH" je sazba daně. Částka na řádku s "DPH 21 %" je výše daně v této sazbě.
Konkrétní příklad extrakce
Představte si tuto účtenku z elektroniky:
DATART International, a.s.
IČO: 64828824
DIČ: CZ64828824
Provozovna: OC Chodov, Praha 4
Datum: 15.02.2026 Čas: 14:23
Pokladna: 3 Účtenka č.: 2026-00847
USB-C kabel 2m 249,00
Myš bezdrátová 599,00
Podložka pod myš 149,00
----------
Mezisoučet: 997,00
DPH 21%: 172,89
Základ 21%: 824,11
CELKEM: 997,00
Platba kartou: 997,00
Karta: **** **** **** 4521
AI z tohoto textu extrahuje:
📋
- Dodavatel: DATART International, a.s. (rozpoznán z hlavičky)
- IČO: 64828824 (rozpoznán vzor 8 číslic za "IČO:")
- DIČ: CZ64828824 (rozpoznán vzor CZ + čísla za "DIČ:")
- Datum: 15.02.2026 (rozpoznán formát data)
- Číslo dokladu: 2026-00847 (rozpoznáno z řádku "Účtenka č.:")
- Položky: USB-C kabel (249 Kč), Myš bezdrátová (599 Kč), Podložka pod myš (149 Kč)
- Celková částka: 997,00 Kč (rozpoznáno z řádku "CELKEM:")
- DPH sazba: 21 % (rozpoznáno z řádku "DPH 21%:")
- DPH částka: 172,89 Kč
- Základ daně: 824,11 Kč
- Způsob platby: Kartou (rozpoznáno z textu "Platba kartou")
Validace dat -- kontrola správnosti
Po extrakci AI provede automatické kontroly:
- Matematická kontrola: Základ (824,11) + DPH (172,89) = Celkem (997,00)? Ano, souhlasí.
- Kontrola DPH sazby: 21 % z 824,11 = 173,06? Drobný rozdíl způsobený zaokrouhlením -- v toleranci.
- Kontrola IČO: 64828824 -- odpovídá formátu (8 číslic), lze ověřit v rejstříku ARES.
- Kontrola data: 15.02.2026 -- validní datum, není v budoucnosti, není příliš staré.
- Kontrola DIČ: CZ64828824 -- odpovídá formátu, koresponduje s IČO.
Pokud některá kontrola selže, systém vás upozorní a požádá o manuální ověření.
Krok 5: Inteligentní kategorizace -- kam doklad patří
Samotná extrakce dat nestačí. Pro správnou daňovou evidenci musí být každý doklad zařazen do správné kategorie. A tady AI opravdu ukazuje svou sílu oproti prostému OCR.
Jak AI vybírá kategorii
Kategorizace probíhá na základě více signálů současně:
Dodavatel -- Pokud je dodavatel Benzina, OMV nebo Shell, s vysokou pravděpodobností jde o pohonné hmoty. Alza nebo DATART signalizují elektroniku. Makro nebo Metro signalizují velkoobchodní nákup.
Položky na dokladu -- Rozpoznané položky ("USB kabel", "myš", "podložka") umožňují přesnější kategorizaci: IT vybavení / kancelářské potřeby.
Částka a kontext -- Malá částka u dodavatele jídla (100-300 Kč) naznačuje stravování. Vysoká částka u stejného dodavatele (3 000+ Kč) může být firemní catering.
Historie uživatele -- Pokud jste v minulosti doklady od stejného dodavatele přiřazovali do konkrétní kategorie, AI tuto preferenci respektuje.
Čas a frekvence -- Doklad z čerpací stanice každé pondělí ráno je pravděpodobně pravidelné tankování služebního vozu.
📊
| Signál na dokladu | Navržená kategorie | Spolehlivost | |-------------------|-------------------|-------------| | Dodavatel: Shell, produkt: Natural 95 | Pohonné hmoty | 99 % | | Dodavatel: Alza, produkt: Monitor 27" | IT vybavení | 97 % | | Dodavatel: Makro, položky: kancelářský papír | Kancelářské potřeby | 95 % | | Dodavatel: Restaurace U Fleků | Stravování / Reprezentace | 85 % (vyžaduje upřesnění) | | Dodavatel: neznámý, položky: neurčité | Ostatní výdaje | 60 % (vyžaduje manuální přiřazení) |
Učení z vašich oprav
Klíčová vlastnost moderních AI systémů je schopnost učit se. Když opravíte kategorii -- například přeřadíte doklad z restaurace z "Stravování" na "Reprezentace, oběd s klientem" -- systém si tuto opravu zapamatuje. Příště při podobném dokladu navrhne správnou kategorii s vyšší spolehlivostí.
Tento proces se nazývá "učení ze zpětné vazby" (reinforcement learning from human feedback) a je důvodem, proč AI asistent funguje tím lépe, čím déle ho používáte.
Krok 6: Uložení a archivace
Finální krok je uložení strukturovaných dat a originálního snímku.
Co se ukládá
- Strukturovaná data: Všechna extrahovaná pole v databázovém formátu (datum, částka, dodavatel, kategorie, DPH...)
- Originální fotografie: Archivní kopie v plném rozlišení jako důkaz o existenci dokladu
- Metadata: Čas zpracování, verze AI modelu, skóre spolehlivosti pro jednotlivá pole
- Historie změn: Pokud jste něco opravovali, ukládá se i historie úprav
Zákonné požadavky na archivaci
Jak dlouho musíte doklady uchovávat
Podle českého zákona o účetnictví a daňového řádu:
- Daňové doklady (faktury, účtenky): minimálně 10 let od konce zdaňovacího období, ve kterém vznikla povinnost přiznat DPH
- Účetní záznamy v daňové evidenci: minimálně 5 let (obecná archivační lhůta pro daňové povinnosti je 3 roky + běží od konce roku podání, v praxi minimálně 5 let)
- Mzdové podklady: až 30 let (pro účely důchodového pojištění)
Digitální archivace je plně v souladu se zákonem, pokud je zajištěna čitelnost, věrnost a trvalost záznamu. Kvalitní fotografie z moderního smartphonu tyto podmínky splňuje.
Speciální případy: co AI zvládne a kde narazí
Účtenky na termopapíru
Termopapír (běžné účtenky z obchodů a restaurací) časem bledne. AI dokáže zpracovat i částečně vybledlou účtenku, ale čím dříve ji vyfotíte, tím lepší výsledek. U velmi starých a vybledlých účtenek může být přesnost nižší.
Doporučení: Foťte účtenky co nejdříve po obdržení -- ideálně hned u pokladny.
Vícejazyčné doklady
Pokud nakupujete v zahraničí nebo od zahraničních dodavatelů, AI systémy zvládají rozpoznávání textu ve většině evropských jazyků. Moderní OCR modely jsou trénovány na desítkách jazyků současně.
Doklady s více sazbami DPH
Některé nákupy obsahují položky s různými sazbami DPH (například potraviny se sníženou sazbou a nepotravinářské zboží se základní sazbou). AI dokáže rozpoznat a správně rozlišit jednotlivé sazby.
Dobropisy a opravné doklady
AI rozpozná, že se jedná o dobropis (záporná částka, text "dobropis" nebo "opravný doklad") a správně ho zaeviduje jako snížení výdajů, ne jako nový výdaj.
PDF faktury
Elektronické faktury v PDF formátu jsou pro AI paradoxně jednodušší než fotky papírových dokladů -- text je přímo strojově čitelný, není potřeba OCR v pravém slova smyslu. Přesnost extrakce z PDF dosahuje téměř 100 %.
PDF vs. fotka: srovnání přesnosti
| Zdroj dokladu | Přesnost extrakce | Rychlost zpracování | |--------------|-------------------|---------------------| | PDF faktura (strukturovaná) | 99,5 %+ | Pod 2 sekundy | | PDF faktura (skenovaný obraz) | 97-99 % | 3-5 sekund | | Fotka dokladu (dobrá kvalita) | 95-99 % | 3-8 sekund | | Fotka dokladu (slabší kvalita) | 85-95 % | 5-15 sekund |
U PDF faktur je zpracování nejrychlejší a nejpřesnější, protože text nemusí být rozpoznáván z obrázku.
Jak se AI neustále zlepšuje
Jedním z největších přínosů AI zpracování dokladů je kontinuální zlepšování. Každý zpracovaný doklad přispívá k tomu, aby systém byl přesnější.
Globální učení
Když tisíce uživatelů posílají doklady od stejného řetězce (Albert, Kaufland, Penny), AI se naučí rozpoznávat specifický formát účtenek daného řetězce. Nový uživatel pak má prospěch z toho, že systém už tento formát zná.
Personalizované učení
Vaše opravy a potvrzení pomáhají AI lépe pochopit vaše specifické potřeby. Pokud jste IT konzultant a doklady z restaurací vždy kategorizujete jako "Reprezentace -- oběd s klientem", systém se přizpůsobí vašemu profilu.
Aktualizace modelů
Vývojáři pravidelně trénují AI modely na nových datech, přidávají podporu pro nové formáty dokladů a zlepšují přesnost na základě anonymizované zpětné vazby od uživatelů.
Praktický test: zpracování 5 různých dokladů
Aby článek nebyl jen teorie, podívejme se na typickou sadu dokladů, kterou by OSVČ mohla za den nasbírat:
| Doklad | Typ | Očekávaný výsledek AI | Potenciální problém | |--------|-----|----------------------|---------------------| | Účtenka z Benziny za tankování | Termopapír, tištěný | Pohonné hmoty, 1 580 Kč, DPH 21 % | Žádný -- standardní formát | | Faktura od webhostingu (PDF) | Elektronická PDF | IT služby, 290 Kč/měsíc, DPH 21 % | Žádný -- PDF je ideální vstup | | Paragon z papírnictví | Termopapír, drobný | Kancelářské potřeby, 347 Kč | Malý formát, možné oříznutí | | Účet z restaurace (oběd s klientem) | Tištěný na běžném papíru | Stravování/Reprezentace, 890 Kč | Vyžaduje upřesnění kategorie | | Faktura od grafika za logo (ručně) | Poloruční, nestandardní | Služby/Marketing, 5 000 Kč | Ruční písmo -- nižší přesnost |
Z pěti dokladů budou pravděpodobně 3-4 zpracovány zcela automaticky bez nutnosti zásahu. U 1-2 budete muset potvrdit nebo upřesnit kategorii. To je v praxi otázka několika sekund, nikoli minut.
Často kladené otázky
Jak přesné je rozpoznávání českých účtenek? U standardních tištěných účtenek z obchodních řetězců a čerpacích stanic dosahuje přesnost 97-99 %. Česká specifika (háčky, čárky, formát data DD.MM.RRRR, formát částek s desetinnou čárkou) jsou v moderních AI modelech plně podporována.
Rozpozná AI i účtenku, kde se přetiskl papír? Částečně. Pokud je přetisk mírný a klíčové údaje (částka, datum) jsou čitelné, AI si poradí. U silně přetištěných nebo přeložených dokladů může být přesnost nižší -- v takovém případě systém požádá o ruční doplnění.
Co když účtenka obsahuje osobní nákup smíchaný s firemním? AI extrahuje všechny položky. Vy pak můžete označit, které položky jsou firemní a které osobní. Systém oddělí účetně relevantní část.
Funguje rozpoznávání i pro zahraniční doklady? Ano, moderní OCR systémy podporují desítky jazyků a měn. Doklad v němčině, angličtině nebo slovenštině bude zpracován stejně spolehlivě jako český.
Co se stane, když AI něco rozpozná špatně? Dostanete souhrn rozpoznaných dat k potvrzení. Pokud je některý údaj chybný, jednoduše ho opravíte. AI si opravu zapamatuje pro příště. Každý zpracovaný doklad tak přispívá k vyšší přesnosti v budoucnosti.
Nahradí AI skenování dokladů klasický skener? Pro účely OSVČ a daňové evidence ano. Fotoaparát moderního smartphonu pořizuje snímky v dostatečné kvalitě pro archivaci. Profesionální účetní firmy zpracovávající tisíce dokladů denně mohou stále preferovat dedikované skenery, ale pro individuálního živnostníka je telefon víc než dostačující.
Přestaňte přepisovat -- začněte fotit
Technologie pro automatické zpracování dokladů je v roce 2026 dostatečně vyspělá na to, aby spolehlivě nahradila ruční přepisování u běžných OSVČ. Přesnost přes 99 % u tištěných dokladů, zpracování za jednotky sekund a průběžné zlepšování díky strojovému učení -- to vše dělá z AI zpracování dokladů praktický nástroj, ne futuristickou vizi.
DokladBot tuto technologii zpřístupňuje přímo ve WhatsApp. Žádná speciální aplikace, žádný skener, žádný software. Jen váš telefon, fotoaparát a WhatsApp, který už máte.
Pošlete první účtenku a přesvědčte se sami, jak rychle a přesně AI zpracování funguje.
Vyzkoušejte DokladBot -- od fotky k účetnímu záznamu za 5 sekund.
Oficiální zdroje
- Finanční správa ČR -- archivace dokladů -- pravidla pro uchovávání účetních a daňových dokladů
- Zákon č. 563/1991 Sb., o účetnictví -- legislativní rámec pro vedení účetní evidence
- ARES -- ekonomické subjekty -- ověření IČO a registračních údajů firem
- Český statistický úřad -- statistiky o podnikatelském prostředí v ČR
Článek má informativní charakter a nepředstavuje účetní ani daňové poradenství. Přesnost AI zpracování se může lišit v závislosti na kvalitě vstupních dokladů a konkrétním poskytovateli služby. Údaje platné k únoru 2026.
Nechcete ztrácet čas s papírováním?
Vyzkoušejte DokladBot - účetnictví přes WhatsApp. První týden zdarma.
Související články

Kolik stojí účetní vs. AI nástroj: srovnání nákladů
Kolik skutečně zaplatíte za vedení účetnictví jako OSVČ? Porovnáváme náklady na externího účetního, účetní software a AI nástroje. Zjistěte, co se vám v roce 2026 nejvíce vyplatí.

WhatsApp pro podnikatele - 10 způsobů jak ušetřit čas
WhatsApp není jen na chatování. Zjistěte, jak ho využít pro efektivní podnikání a ušetřit hodiny času týdně.

5 věcí, které AI účetní asistent vyřeší za vás
AI účetní asistent dokáže přebrat překvapivě velkou část vaší administrativy. Podívejte se na 5 konkrétních věcí, které za vás vyřeší - od kategorizace účtenek po odhad daně z příjmů.