ai dokumentumfeldolgozás idp folyamat modern ocr technológia

E-gazdaság

Az AI-os dokumentumfeldolgozás már nem kísérlet: így dolgoznak a magyar vállalatok napi több ezer számlával, szerződéssel

Megjelent: 2026. április 29. szerda

A legtöbb hazai cégnél még mindig emberek pötyögik kézzel a számlákat az ERP-be, olvasnak át szerződéseket, és válogatnak űrlapokat. Az intelligens dokumentumfeldolgozás (IDP) ezt a munkát automatizálja — nem kísérleti jelleggel, hanem napi több ezer dokumentumon. Megnéztük, hogyan működik a gyakorlatban, és mit jelent ez egy magyar vállalat költségstruktúrájára nézve.

A magyar középvállalatok és nagyvállalatok többsége ma is úgy dolgozik a beérkező dokumentumokkal, ahogy tíz éve: valaki megnyitja a postafiókot, lementi a PDF-eket, kinyitja az ERP-t, és átpötyögi a számla adatait — szállító, dátum, összeg, áfakulcs, fizetési határidő. Ugyanez történik a beérkező szerződésekkel, a kárbejelentő űrlapokkal, az árajánlatokkal és a szállítólevelekkel.

A folyamat lassú és hibalehetőséget kínál. És drága. Nemzetközi beszerzési kutatások (Ardent Partners, Levvel Insights) évek óta nagyjából egyező tartományban mérik a kézi számlafeldolgozás darabköltségét: a teljesen automatizált folyamatokénál nagyságrendileg tízszeres. Egy közepes magyar cégnél, amely havonta több ezer számlát fogad, ez a különbség éves szinten már nem zsebpénz.

A megoldást intelligens dokumentumfeldolgozásnak, angol rövidítéssel IDP-nek (Intelligent Document Processing) hívják. Nem új technológia, de az utóbbi két évben — a nagy nyelvi modellek és a multimodális AI elterjedésével — jutott el oda, hogy érdemes éles vállalati folyamatokra ráengedni. Korábban túl törékeny volt: minden új számlaformátum újabb fejfájást jelentett.

Mi az IDP, és miben más, mint a régi OCR?

A klasszikus OCR (optikai karakterfelismerés) annyit tudott, hogy a beolvasott képből kiolvasta a karaktereket. Ha a számlán szerepelt az „1.250.450 Ft”, azt az OCR átültette szöveggé — de hogy ez most a végösszeg, az áfa, vagy valami egészen más, azt nem értette.

Az IDP ezt a vakságot oldja fel. Egy modern IDP-rendszer egyszerre olvas és értelmez: felismeri a dokumentum típusát (számla, szerződés, megrendelő, kárbejelentő űrlap), kinyeri belőle a strukturált mezőket, validálja az adatokat (van-e ilyen szállító a törzsadatban, egyezik-e a végösszeg a sorelemek összegével), majd átadja az egészet a háttérrendszernek.

A motorháztető alatt négy AI-réteg dolgozik: az OCR a karaktereket olvassa, a számítógépes látás az elrendezést érti (táblázatok, fejlécek, aláírásmező), a természetesnyelv-feldolgozás (NLP) a kontextusból szűri ki, hogy mi micsoda, a gépi tanulás pedig a felhasználói javításokból folyamatosan tanul. Ez a négyes az, ami különbséget ad a hagyományos szkennerszoftver és egy IDP-platform között. Ha valakit mélyebben érdekel, hogyan illeszkedik az NLP a képbe, erről részletesen ír az Omnit egyik szakcikke.

Hogyan néz ki egy IDP-folyamat a gyakorlatban?

Vegyünk egy konkrét esetet: egy gyártócég havi több ezer beszállítói számlát fogad e-mailben.

Beolvasás. A rendszer figyeli a postafiókot, a megosztott meghajtót és az ERP dokumentumtárát. Minden új PDF, JPG vagy beolvasott TIFF automatikusan bekerül a feldolgozási sorba.
Előfeldolgozás. A rendszer kiegyenesíti a ferdén szkennelt képeket, eltünteti a zajt, és OCR-rel kiolvassa a szöveget. Ezt a lépést szokás lebecsülni, pedig a végeredmény nagyjából innen dől el — szemetes inputból nem lesz tiszta adat.
Osztályozás. Egy multimodális AI-modell — ami a szöveget és az elrendezést is nézi — eldönti: ez most számla, szállítólevél, vagy szerződés.
Adatkivonás. NLP- és entitásfelismerő modellek (NER) kiszedik a kulcsmezőket: szállító, adószám, számla száma, kelte, fizetési határidő, áfakulcsok soronként, végösszeg.
Validáció. A rendszer összeveti az adatokat a törzsadatokkal (létezik-e ez a szállító, jó-e az adószám), ellenőrzi a duplikációkat, és összeadja a sorelemeket. Ha eltérés van, jelzi a könyvelőnek.
Integráció. A validált adat egyenesen az ERP-be (SAP, Oracle, Microsoft Dynamics, vagy egy magyar fejlesztésű rendszer) kerül, jóváhagyásra előkészítve.

A teljes folyamat — beérkezéstől a könyvelőasztalra kerülésig — percek alatt lefut. Ami eddig egy könyvelő fél napos munkája volt, az most háttérben futó feladat, és a könyvelő csak a kivételeket nézi át manuálisan. Hogy pontosan a számlák hány százaléka az „kivétel”, az nagyon függ a beszállítói körtől és a betanítottság szintjétől — de az érdemi munka itt szépen összezsugorodik. A gyakorlati lépéseket az Omnit dokumentumfeldolgozási oldala is bemutatja.

Hol térül meg leghamarabb?

Az IDP elméletben bármilyen szöveges dokumentumra ráengedhető, de a tapasztalat azt mutatja, hogy három területen térül meg leggyorsabban.

Számlafeldolgozás a klasszikus belépő. A nagy mennyiség, a viszonylag standard formátum és az egyértelmű KPI-ok (átfutási idő, hibás könyvelések száma, késedelmi kamatok) miatt itt látszanak leghamarabb az eredmények. Pluszként elesik a késedelmi kamat kockázata is, mert a számlák gyorsabban érnek el a jóváhagyásig.

Szerződéskezelés és jogi áttekintés a másik nagy terület. Egy nagyvállalat ezerszámra fogad szerződéseket — szállítóit, ügyfeleit, NDA-kat. Az IDP nemcsak kinyeri belőlük a kulcs adatokat (felek, hatály, lejárat, kötbér, szerződéses összeg), hanem kereshetővé is teszi a teljes szerződésállományt. „Mutasd meg az összes olyan szerződésünket, ahol a felmondási idő rövidebb, mint 30 nap” — egy IDP-rendszerben ez perces lekérdezés, nem heteket csúszó jogi átfésülés.

Űrlap- és kárbejelentés-kezelés biztosítóknál, energiaszolgáltatóknál, közszférában. Standardizált űrlapok tömeges, valós idejű feldolgozása — éppen ezért ezen a területen indultak meg a hazai pilot projektek is leghamarabb. Ahogy a technokrata.hu nemrég is beszámolt róla, az UNIQA Biztosító Zrt. már lakáskárügyekben is bevetette az MI-támogatott automatizációt, ami pontosan ennek a technológiacsaládnak az alkalmazása.

Mit ad hozzá az LLM-ek megjelenése?

Az IDP valódi áttörése abban jött el, hogy a nagy nyelvi modellek beépültek a kép-értelmezési folyamatba. Korábban minden új dokumentumtípushoz — új formátumú számla, új szerződésstruktúra — külön be kellett tanítani a rendszert, több száz mintán, hetes-hónapos munkával. Ez volt az IDP-projektek tipikus halálos pontja: a bevezetés után megérkezett egy nagy új beszállító más layouttal, és kezdődött elölről a betanítás.

A modern, LLM-alapú IDP-platformok ezt „zero-shot” vagy „few-shot” módon végzik: néhány példából, vagy akár példa nélkül is képesek értelmezni egy új dokumentumtípust. Nem hibátlanul, de elég jól ahhoz, hogy a kézi javítás már csak finomhangolás legyen, ne újratanítás.

Ehhez társul a RAG (Retrieval-Augmented Generation) technológia, ami lehetővé teszi, hogy a vállalat teljes dokumentumarchívumában természetes nyelven keressünk: „Mit ír a 2024-es bérleti szerződésünk a felmondási feltételekről?” — és a rendszer hivatkozással, oldalszámmal adja vissza a választ. A RAG-ról és arról, hogyan akadályozza meg az AI-hallucinációkat, az Omnit külön cikkben írt.

Felhő vagy on-premise? A magyar piacon ez nem mellékes kérdés

A hazai — és általában az európai — vállalati IDP-bevezetéseknél az egyik legkorábban előkerülő kérdés, hogy hol fusson a feldolgozás: nyilvános felhőben (AWS, Azure, Google Cloud) vagy on-premise, azaz a cég saját szerverein.

A felhős megoldás gyorsabban elindul, és kevesebb infrastruktúrát igényel. Az on-premise viszont kötelező lehet bizonyos adatkörökben — egészségügyi adatok, közszféra, banki belső anyagok, GDPR-érzékeny ügyféladatok — és sok pénzügyi vezető egyszerűen kényelmesebben alszik attól, ha a szerződései nem hagyják el a céges infrastruktúrát. A választás stratégiai súlyát az Omnit külön elemzésben járja körbe, érdemes elolvasni, mielőtt valaki bevezetést tervez.

Mire számítson, aki most kezd hozzá?

Néhány tapasztalat a hazai bevezetésekből, amit jó tudni, mielőtt valaki nekifut.

A bevezetés nem szoftvervásárlás, hanem folyamatváltás. Az IDP-rendszer csak akkor működik jól, ha a jóváhagyási, könyvelési és validációs folyamatokat is hozzá igazítják. A legtöbb sikertelen projekt nem a technológián bukik el, hanem azon, hogy a régi munkafolyamatot rákényszerítették az új rendszerre.

A pontossági arány önmagában félrevezető szám. A 95%-os pontosság jól hangzik, de ha a maradék 5% mindig ugyanaz a tíz problémás szállító, akkor a könyvelő tényleges munkája alig csökken. Egy jó IDP-rendszer megmondja, mire nem biztos, hogy jól dolgozott — és csak azt küldi emberi felülvizsgálatra. A bizonytalanság jelzése legalább annyira fontos, mint maga a pontosság.

A betanítás nem egyszeri esemény. Új szállítók, új formátumok, új áfa-szabályozás folyamatosan érkeznek. A rendszer csak akkor marad pontos, ha a felhasználói javításokból folyamatosan tanul — és ha valaki a cégnél felelős érte, hogy ez ne maradjon abba a bevezetés utáni harmadik hónapban.

És a pilotról: érdemes egy konkrét dokumentumtípuson kezdeni — jellemzően a beérkező számla a legjobb választás —, néhány hónapos kísérleti szakaszban. Ha ott meggyőző az eredmény, lehet skálázni a többi területre. A „egyszerre mindent” típusú bevezetésekből nálunk eddig egyik sem ért happy enddel.

Konklúzió

Az IDP nem új trend, és nem is hype. A hazai nagy- és középvállalatok egy része már évek óta éles üzemben használja, és az eredmények viszonylag konzisztensek: ahol bevezették, ott a dokumentumkezelési költség jelentősen lement, az átfutási idő pedig napokról órákra (sokszor percekre) zsugorodott. A felszabaduló munkaerő — könyvelők, asszisztensek, jogi tanácsadók — nem feleslegessé válik, hanem magasabb hozzáadott értékű feladatokra kerül át.

Aki most kezd hozzá, jövőre már mérhető eredményeket lát. A téma részleteiről, a technológia hátteréről és a hazai bevezetési tapasztalatokról bővebben az Omnit AI-blogján lehet olvasni.

További friss híreket talál a Technokrata főoldalán! Csatlakozzon hozzánk a Facebookon is!

Tovább

További cikkek:digitalizáció, digitalizálás, dokumentum, dokumentumdigitalizálás, dokumentumkezelés, dokumentumkezelő, idp, ocr

Mi az IDP, és miben más, mint a régi OCR?

Hogyan néz ki egy IDP-folyamat a gyakorlatban?

Hol térül meg leghamarabb?

Mit ad hozzá az LLM-ek megjelenése?

Felhő vagy on-premise? A magyar piacon ez nem mellékes kérdés

Mire számítson, aki most kezd hozzá?

Konklúzió

További E-gazdaság

E-gazdaság

Kevesebb és drágább az új építésű lakás a Balatonon

Digitalizáció

BCW 2026: A Bosch előretör az automatizálás és a robotika területén

Ipar

Kettős jubileumot ünnepel a VARINEX: 35 éve a piacon, 20 éve a Stratasys partnereként

Ipar

Újabb elismerés a Világgazdasági Fórumtól a Schneider Electricnek

Ipar

Mi jön a gigagyárak után?

E-gazdaság

Munkaerőhiány, demográfiai lejtő, AI

E-gazdaság

Behúzhatja a kéziféket a hazai e-autózásban az ösztönzők eltűnése

E-gazdaság

Hogyan válassz SEO ügynökséget 2026-ban? – Az AI korszak új szabályai és a sikeres alkalmazkodás titkai

E-gazdaság

Új ESG eszköztár segíti a hazai vállalkozások felkészülését

Ipar

Új megoldások a mesterséges intelligenciát kiszolgáló adatközpontok hűtéséhez

E-gazdaság

Ismét az elektromos autók lettek a legdrágábbak a használtautó-piacon

Ipar

Ipari léptékű SLS 3D nyomtató a Formlabs-tól: bemutatkozott a Fuse X1

Digitalizáció

Már a mesterséges intelligencia is túlterheli a weboldalakat

Ipar

Már az új otthonok tervezésénél kiemelt szempontnak kell lennie az energiahatékonyságnak és fenntarthatóságnak a magyarok szerint

E-gazdaság

Egyeztetést sürget a szakma: augusztusig kell szabályozni a vendégmunkás helyzetet

E-Környezetvédelem

A Magyar Termék több cége együtt indul a PET Kupán

Digitalizáció

K&H: vége lehet az egyenpromóciók korszakának a bankoknál

E-gazdaság

A női vállalkozók 58%-a tapasztalt már hátrányt a neme miatt – az empátiát elvárják tőlük az üzleti életben

Ipar

Beszerzési Kiválóság Program a BME-n a Schneider Electric közreműködésével

Ipar

Élelmiszer-átrakóraktárral bővül a Dachser kecskeméti telephelye

Népszerű

Ipar

Már az új otthonok tervezésénél kiemelt szempontnak kell lennie az energiahatékonyságnak és fenntarthatóságnak a magyarok szerint

E-gazdaság

McKinsey: a mesterséges intelligencia gazdasági értékteremtése a GDP 6-7%-át teheti ki Magyarországon 2030-ig

Esemény

Június 20-án újra Múzeumok Éjszakája

FrissInfo

Minden második nő információs túlterheltségről számol be

LifeStyle

Mikroműanyagokat talált a Greenpeace műanyagtasakos bébiételekben

LifeStyle

7 szokás, amit egyre többen követnek a sport világában

Esemény

A Gillette az UEFA Bajnokok Ligája budapesti döntőjére hangol: precíz borotválkozási élmény és szurkolói játékok a Hősök terén

E-gazdaság

Új növekedési pólus formálódik Budapest déli kapujában

Garázs

A Ferrari új vállalati arculatával nyílt márkakereskedés

Garázs

Elektromos autók és a mélygarázsok új tűzkockázata?

Technokrata a Facebookon

IoT-Magazin.hu

Egy évtizede erősíti a nonprofitokat a PwC Civil Mentoring Programja

A labdarúgó magyar bajnok ETO FC-nek fejlesztettek alkalmazást a Széchenyi István Egyetem hallgatói

A tech-világ rajongóinak kötelező úti céljai Kínában

A maratoni beszélő és a kihangosított világpolgár: mit árulnak el rólunk a telefonálási szokásaink?

Itt az élménybeszámolók új korszaka: videós történetmesélés pár gombnyomásra

Szabadtéri fotókiállítás nyílt a Millenárison a negyvenéves a Hungaroringről

Újabb elismerés a Világgazdasági Fórumtól a Schneider Electricnek

Mi jön a gigagyárak után?

Autonóm mobil robotokkal a hatékonyabb raktári működésért