Már régen nem (csak) arról szólnak az optikai karakterfelismerő alkalmazások, hogy a lapolvasóval beolvasott dokumentumon található szöveget valamilyen továbbszerkeszthető formátumra alakítsák – legalább ekkora hangsúlyt kapott mára az eredeti dokumentumszerkezet megőrzése is.
Beépített képszerkesztővel javíthatjuk fel a fényképezett dokumentumot
Formátumtartó felismerés
Már a FineReader előző változata is tartalmazott egy olyan technológiát (ADRT néven), amely a dokumentum logikai szerkezetét is értelmezi és szerkeszthető formátumban reprodukálja. A tízes verzióban ezt továbbfejlesztették és a program immáron nemcsak a bekezdéseket és címeket képes felismerni és reprodukálni, hanem a tartalomjegyzéket is. Emellett fejlesztettek a betűtípusok és stílusok, valamint a lábjegyzet felismerésén is.
A korábbi változatban elérhető funkciók most is megvannak, a program képes felismerni a szöveg nyelvét (természetesen a pontosabb felismerés érdekében ez manuálisan is megadható), detektálja a táblázatokat, oldalszámokat, a fej- és a lábléceket, illetve a hivatkozásokat is, emellett természetesen kezeli a többnyelvű dokumentumokat is.
Kisebb-nagyobb változások
A gyenge minőségű dokumentumok feldolgozásánál fontos fejlesztés történt: a program immáron képes mobiltelefonokkal készült fényképek beolvasására is – ehhez minimum két megapixeles felvételek készítésére alkalmas készülékre lesz szükségünk. Szintén újítás az alnyomattal, azaz grafikai háttérrel rendelkező újságoldalak korábbinál jobb feldolgozása is. A hazai felhasználókat valószínűleg kevésbé érinti, de a program által felismert nyelvek száma kettővel nőtt: immáron a koreai és a jiddis azonosítására is képes. Javítás történt a PDF állományok tömörítéséért felelős MRC-algoritmussal kapcsolatban is, mostantól akár tizedére is képes a szoftver a dokumentumokat összenyomni.
A nagyon gyenge minőségű mobiltelefonos képnél még a szöveg elhelyezkedésének megállapítása is problémás
A digitális fotófeldolgozó modul is fejlődött. Ezek közül már említettük a mobiltelefonnak készült képek feldolgozásának lehetőségét, de ide tartozik a háromdimenziós torzítás korrigálása, az ISO-zajszűrés, a trapézkivágás kezelése és az élességállítás is.
A kezelőfelületet is érintették változások. A fejlesztők a gyakran használt funkciókat összegyűjtötték és kimeneti formátumok szerint csoportosítva kínálják fel számunkra. Ez az ablak jelenik meg a program indításakor és ennek segítségével könnyedén elkezdhetjük a munkát. Természetesen ez a „gyorsmenü” ki is kapcsolható, ha legtöbbször olyan feladatokat végzünk, amelyek nem szerepelnek rajta.
Mindez a gyakorlatban
Természetesen kíváncsiak voltunk arra, hogy a program hogy teljesít, ezért mobiltelefonnal, egy átlagos digitális, kompakt fényképezőgéppel és „rendes” lapolvasóval beolvasott dokumentumokat is megpróbáltunk vele feldolgozni. Igyekeztünk a környéken lévő leggyengébb, mákszem méretű optikával felszerelt mobilt kiválasztani, amely két megapixeles képek készítésére képes. Sajnos ennek minősége annyira gyatra volt, hogy a program sem nagyon tudott mit kezdeni vele egy-egy szó felismerésén kívül – még a szövegek és a képek azonosításával is bajban volt. Nyilván jobb minőségű felvételnél az eredmény is sokkal jobb lett volna, amire egyébként a program is felhívta a figyelmünket. A mobiltelefonos OCR-ezés tehát leginkább csak a drága, jó minőségű optikával felszerelt telefonok gazdáinak adatik meg. Azaz ne várjunk csodákat – a mobillal készített felvételeket csak végszükség esetén használjuk szövegfelismerésre. Belegondolva, ez gyakran nekünk, embereknek sem jön össze egy-egy elmosódott felvételt látva.
A gyakran használt tipikus feladatok egy központi helyen egyszerűen elérhetők
A fényképezőgépes kísérlet már sokkal jobban sikerült, a program alig pár hibával tökéletesen beolvasta és szerkeszthetővé varázsolta a lefényképezett oldalunkat – bár itt is panaszkodott, ezúttal a túlságosan kis méretű betűkre, de ennek ellenére nagyon kevés hibával dolgozott.
A lapolvasó nyújtja a legjobb minőséget és értelemszerűen ezt használva lesz a legjobb, legkevesebb beavatkozást igénylő a végeredmény is, tesztdokumentumunkat hiba nélkül reprodukálta Microsoft Wordben.
*
A FineReader tökéletes választás mindazoknak, akik nagy mennyiségű papíralapú dokumentumot szeretnének mindén egyszerűbben és hatékonyabban szerkeszthető és kereshető formátumban feldolgozni. Amennyiben rendelkezünk a régebbi változattal, a frissítés akkor éri meg elsősorban, amennyiben olyan dokumentumokat szeretnénk feldolgozni, amelyeknél fontos az eredeti struktúra minél pontosabb megtartása.
A program háromféle licencelési konstrukcióban vásárolható meg: létezik belőle Professional, Corporate és úgynevezett Site License kiadás is. Az utóbbi két variáns tartalmazza a csoportmunka funkciókat is, ráadásul hálózatos telepítés esetén egyszerre korlátlan számú számítógépre telepíthető fel – természetesen futtatni egyszerre csak annyin lehet, ahány licencet megvásároltunk. A dobozos termékként kapható Professional változatot is egyszerre két, de nem egyszerre működő – pl. egy munkahelyi és egy otthoni – gépre telepíthetjük teljesen jogtisztán.
Adatok
- Karakterfelismerés lapolvasóról, fényképről vagy védett PDF dokumentumból
- A szöveg logikai struktúrájának felismerése és reprodukálása
- A szöveg irányának és a hasáboknak felismerése
- Oldalszámozás, fej- és lábléc, lábjegyzet, bekezdések, tartalomjegyzék, valamint betűtípus és stílus megtartása
- Táblázatok és hivatkozások felismerése
- Többnyelvű dokumentumok kezelése
- Dokumentum nyelvének automatikus felismerése
- DOC/DOCX, XLS/XLSX, RTF, HTML, PDF, PDF/A, TXT, CSV és PPTX kimeneti formátumok
- Mentés HTML-be e-book-szerkesztéshez
- Automatikus és manuális képjavító funkciók
- Forgalmazó: Licencia Kft.
- Ár: 41 250 Ft (Professional Edition)
- Web: finereader.hu
Értékelés
Előny: kiváló karakterbeolvasás, jól ismeri fel a dokumentum logikai szerkezetét
Hátrány: gyenge minőségű mobiltelefonos képekkel nem nagyon tud mit kezdeni
Teljesítmény: 4
Szolgáltatás: 5
Ár/érték: 4,5