Régóta túl vagyunk már az optikai karakterfelismerés úttörő kori nehézségein, amikor még a felismerés technológiája, a betűtípusok vagy akár az ékezetek jelentettek problémát. A piacvezető termékek mind kielégítő szintet érnek el a felismerésben, és hathatósan alakítják át szerkeszthető szöveggé a beszkennelt dokumentumokat. Ez sok más extra mellett már a FineReader előző kiadásait is jellemezte, így az új verzióra nézve az a kérdés merült fel bennünk, hogy vajon mit lehetett még beletenni egy OCR-alkalmazásba.
Komplex feladat, komplex eredmény
Napi munkánkban sokat számít, ha megtakaríthatjuk az unalmas gépelést, ezért is hatékony eszköz egy jó karakterfelismerő. Minthogy a felismerés pontosságán mindig lehet javítani, a gyártó adatai szerint a FineReader 9-es 35 százalékkal pontosabb. Különösen akkor javul a pontosság, ha digitális kamerával fotózott dokumentumot olvastatunk el, illetve táblázatot vagy jogi szöveget tartalmaznak az oldalak. Valóban, jó eredményt ad a program akár faxok felismerése során vagy gyenge minőségű képek esetében is. A helyzet azonban az, hogy ebben az irányban olyan sokkal tovább nem vezet út, hiszen a legtöbb irodai dokumentum megfelelően olvasható: valami más hiányzik ahhoz, hogy jobban menjen a munka.
Nem csak oldal, dokumentum
Gyakorlatilag egy szinttel magasabb célt tűztek ki maguk elé a FineReader fejlesztői. A program új verzióját – habár OCR-nek, azaz optikai karakterfelismerőnek hívják – célszerűbb lett volna optikai oldal- vagy még inkább dokumentumfelismerőnek nevezni. Mivel a napi munkában a szöveg begépelése mellett a szövegblokkok, a sor- és oldalszámozás, valamint a formázás helyreállítása is igen sok időt vehet el, ezért ebben az irányban lépett nagyot előre a program, bevezetve az ADRT (Adaptive Document Recognition Technology, adaptív dokumentumfelismerési technológia) módszert. Az elegáns hangzású fejlesztés lényege, hogy a program nem szövegorientáltan kezeli a beolvasottakat, hanem mint egybefüggő dokumentumot dolgozza fel az oldalak sorát. Ennek megfelelően felismeri, és a végeredményben is megtartja az anyag logikai formátumát, azaz a sorszámozásokat, listákat, fej- és lábléceket, lábjegyzeteket, a hasábokat, szövegdobozokat és a szövegfolyamot, továbbá természetesen a különféle illusztrációkat, képeket is, aláírással együtt. Továbbfejlesztették a táblázatok felismerését, ily módon azok könnyebben szerkeszthetők Wordben, illetve Excelben. Még a betűtípusok „utánzására” is jobban ügyel a program.
A program javaslatokat ad a felismerés hatékonyságának növeléséhez
Számos OCR-alkalmazás képes az eredetihez megjelenésében közel álló dokumentumok készítésére (kereshető PDF), a FineReaderrel azonban ezt követően is könnyebb a munka. Az eddigieknél egyszerűbben továbbfeldolgozható, -szerkeszthető anyagot szolgáltat. Természetesen automatikusan nem ad mindig tökéletes eredményt, nem mindig sikerül jól eldöntenie egy fehér hátterű képernyőképről, hogy azzal képként vagy szövegként bánjon-e, és a blokkok sem milliméter pontosan oda kerülnek, ahol az eredetiben voltak, illetve előfordulnak szövegtúlfolyások.
Új bort új hordóba
Hála a megújult kezelőfelületnek, az eddigieknél kevesebb kattintás árán juthatunk el a célig, és erről nem csupán a leggyakoribb funkciókat listázó indítómenü gondoskodik. Azonnali előnézetet kapunk az oldal felismerési zónáinak szerkesztéséhez, és közvetlenül beleszerkeszthetünk a formázásba is, még mentés előtt. A felismerés már a háttérben elkezdődik, ily módon hamarabb belepillanthatunk a többoldalas dokumentumok elejébe.
Ha nem vigyázunk, a dokumentumba illusztrációként beszúrt képeken lévő szövegeket is feldolgozza a program. Egy-két kattintással erről könnyen lebeszélhető
A program drágább, Corporate változata ugyanezt a tudást egy kisebb iroda számára teszi könnyen elérhetővé. Egyrészt több munkaállomáson futtatható ugyanazzal a licenccel, másrészt képes hálózati mappákat figyelni, és az oda behelyezett dokumentumokat automatikusan, ütemezés szerint feldolgozni.
A FineReader 9 valóban szintet lépett, oldalfelismerőből dokumentumfelismerővé avanzsált, gyakorlatilag azonos áron. Reméljük, tovább tökéletesedik majd, addig is már most nagy segítség azoknak, akik nemcsak egy PDF-archívumot kívánnak létrehozni, hanem továbbdolgoznak a beolvasott dokumentumokon.
Adatok
- Optikai karakterfelismerés
- 179 nyelv támogatása, beépített helyesírás-ellenőrzés 36 nyelven
- Automatikus nyelvfelismerés
- Gyenge minőségű szövegek felismerése
- Digitális fényképezőgéppel rögzített dokumentumok értelmezése
- Többoldalas dokumentumok folytonos logikai struktúraként való kezelése
- DOCX, XLSX és XPS formátumok támogatása
- Magyar nyelvű felület
- Magyar nyelvű helyesírás-ellenőrző
- Vista alatti működés
- Forgalmazó: Licencia Kft.
- Ár: 36 000 Ft
Értékelés
Előny: pontos felismerés, a dokumentum szerkezetének megőrzése, PDF- és fotózott oldalak dokumentummá alakítása
Hátrány: a struktúra felismerése kézi korrekcióra szorulhat
Teljesítmény: 4,5
Szolgáltatás: 5