4 besplatna mrežna OCR alata na ultimativnom testu

4 besplatna mrežna OCR alata na ultimativnom testu

Ako želite pretvoriti bilo koji ispisani tekst u digitalni tekst koji možete kopirati, zalijepiti, urediti i pretraživati, morat ćete upotrijebiti skenere za optičko prepoznavanje znakova (OCR).





Kada odaberete skeniranje ili snimanje dokumenta, dokument će se spremiti u formatu kao što su JPEG ili PDF. OCR softver tada može prepoznati slova i brojeve u tim dokumentima te ih pretvoriti u PDF koji se može pretraživati ​​ili u datoteku koju možete uređivati ​​u programima poput Microsoft Worda.





Problem je u tome što neki OCR skeneri rade puno bolje od drugih, a najbolji su prilično teški u novčaniku.





Na primjer, omnipage18 košta 150 USD, ali je posebno dobar u prepoznavanju različitih jezika. Adobe Acrobat Pro DC košta nevjerojatnih 400 dolara, ali ima nevjerojatnu točnost. ABBYY FineReader košta 150 USD, ali je fantastičan u pretvaranju dokumenata poput časopisa i brošura u tekst koji se može pretraživati. Kasnije u ovom članku testirat ćemo ABBYY -ovu internetsku ponudu.

Međutim, ako tražite besplatne alternative, možete preuzimanje datoteka i koristiti u sustavu Windows ili OS X, trebali biste isprobati ove OCR alate. Ali ako biste radije koristili besplatnu, na liniji OCR alat, nastavite čitati, jer smo isprobali prvih nekoliko, s rezultatima u nastavku.



Ispit

Čini se da većina ljudi sada koristi svoje pametne telefone za njihovo skeniranje, a ja sam odlučio koristiti Evernoteova aplikacija koja se može skenirati (Besplatno na iOS -u i Androidu). Skenirao sam prvu stranicu Richarda Dawkina Penjanje na planinu Nevjerojatno , da vidimo kakve bismo rezultate mogli postići vrlo osnovnim oblikovanjem. Skenirao sam i stranicu Tima Ferrissa Kuhar od 4 sata isprobati skenere s nekim malo složenijim oblikovanjem. Spremio sam svaku od ovih datoteka kao PDF.

Ti su dokumenti zatim pregledani kroz neke od navodno najboljih internetskih OCR alata kako bi se vidjelo koliko su dobro prošli.





Besplatni mrežni OCR [više nije dostupno]

Srećom, nije potrebna registracija za korištenje besplatnog OCR -a na mreži. I bio sam dvostruko impresioniran kad sam vidio njihovu tvrdnju da zadržavaju oblikovanje i izgled svog dokumenta.

Web mjesto tvrdi da može podržavati PDF, GIF, BMP, JPEG, TIFF i PNG kao ulaz. Izlazi mogu biti DOC, PDF tekstualni dokument, RTF i TXT. Nažalost, nisam mogao saznati imaju li ograničenje veličine datoteke.





Osnovni dokument u PDF

Pretvoreno apsolutno savršeno. Nema se više što za reći! Krećemo u a vrlo dobar početak.

Osnovni dokument za DOC

Čini se da su se stvarne riječi besprijekorno pretvorile, osim 'ounta' iz 'Mount Rushmore' koji je nekako postao AWOL. Formatiranje je ipak druga priča. Mnogi zarezi zamijenjeni su donjim crtama, a nasumični razmaci umetnuti su na mjestima u dokumentu. Kad kasnije vidite kako je vrhunski softver prošao u ovom testu, ovo nije loš napor uopće .

Složeni dokument u PDF

Složeni dokument za DOC

Ovoga puta pretvorba je trajala samo 10 sekundi, a tekst je ponovno konvertiran s oko 95% točnosti. Bilo je nekih čudnih problema s razmakom, a softver je imao problema s pretvaranjem fonta u gornjem desnom kutu dokumenta i tu i tamo je propustio nekoliko znakova.

Presuda

i2OCR

i2OCR iznosi impresivne tvrdnje. Alat prepoznaje više od 60 jezika, može rukovati s više stupaca (uklanjanjem oblikovanja), nema ograničenja veličine datoteke, može pretvoriti prenesene datoteke i s URL -ova. I za korištenje ovog alata ne morate se registrirati.

Usluga funkcionira jednostavnim izvlačenjem teksta sa vaše slike, a zatim izlazom neformatiranog teksta. Možete brzo ispraviti sve pogreške u prikazu jedan pored drugog, prije kopiranja teksta u druge programe ili preuzimanja kao DOC, PDF ili HTML.

Napomena: kada sam pokušao učitati svoje PDF dokumente, i2OCR ih je odbio, pa sam ih morao pretvoriti u JPEG (tako što sam ih snimio, a zatim prenio datoteke).

Osnovni dokument u običnom tekstu

Složeni dokument u običnom tekstu

Većina je teksta pretvorena bez previše pogrešaka, osim naslova i recepta u gornjem desnom kutu, što za ovaj alat nije bilo čitljivo. Način na koji su stupci pretvoreni u običan tekst bio je daleko od idealnog. Ako želite ovu pretvorbu učiniti izvodljivom, potrebno je puno vremena za preuređivanje redaka u koherentne rečenice.

Presuda

OCR prepoznavanje na mreži

Mrežni OCR trenutno podržava 46 različitih jezika i može pretvoriti PDF, JPG, BMP, TIFF i GIF u format Word, Excel ili običan tekst. Web stranica tvrdi da 'pretvoreni dokumenti izgledaju potpuno isto kao i izvornici - tablice, stupci i grafike'.

Verzija koju možete koristiti bez registracije omogućuje vam pretvaranje do 15 slika na sat (ograničenje od 5 MB). Ako se prijavite za račun, iznad ovog ograničenja možete kupiti više stranica, a istovremeno možete pretvoriti dokumente s više stranica i ZIP arhive.

Osnovni dokument za DOC

Osnovni dokument besprijekorno je konvertiran osim rimskih brojeva Ja ne uzimaju se. Kao što je web mjesto obećalo, oblikovanje je bilo točno onako kako je bilo u knjizi. Svaka čast ovom alatu.

Složeni dokument za DOC

Nakon što sam bio razočaran prethodnim OCR alatima pri pretvaranju složenog dokumenta, bio sam impresioniran internetskim OCR -om. Raspored je bio gotovo savršen, kao što možete vidjeti gore. Recept se još jednom nije dobro pokupio, ali su sve druge manje pogreške bile zanemarive.

Presuda

Apsolutno fantastični rezultati online OCR -a. Jedini nedostatak koji vidim je to što nema načina za preuzimanje pretvorenih dokumenata u PDF -u jer spomenuti izlazni formati uključuju samo DOCX, XLSX i TXT.

ABBYY FineReader Online (probna verzija od 10 stranica)

Kao što je ranije spomenuto, ABBYY je jedan od tržišnih lidera u OCR softveru, koštajući oko 150 USD za njihov potpuni program koji se može preuzeti. Oni nude a Besplatna probna verzija od 10 stranica za njihov mrežni alat (potrebna je registracija). Za pretplatu od 5 USD, njihov mrežni alat omogućit će vam pretvaranje 200 stranica svakog mjeseca.

Prihvaćene datoteke mogu biti do 100 MB u bilo kojem od ovih formata: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP i PNG. ABBYY također prepoznaje gotovo 200 jezika. Izlazi su posebno impresivni, s izborom između DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 i EPUB.

Tijekom probnog perioda čak možete isprobati nekoliko BETA značajki. Prva je mogućnost prevođenja vašeg dokumenta na drugi jezik. Drugi je izvoz izmijenjenog dokumenta na vaš račun za pohranu u oblaku, bilo da se radi o Dropboxu, Google disku, Evernoteu, Microsoft OneDriveu ili Boxu.

Osnovni dokument za DOCX

Složeni dokument za DOCX

Nakon što je pretvoren, bilo je vrlo malo grešaka u tekstu unutar dokumenta (osim što se OCR ponovno borio s fontom tog recepta!), Ali oblikovanje je ostavilo mnogo želja.

Tri stupca nekako su zauzela dvije stranice, sa središnjim stupcem samo pojavljuje se na drugoj stranici. Da ste zapravo htjeli čini bilo što s ovim pretvorenim dokumentom na kraju biste čupali kosu.

Osnovni dokument u PDF

Složeni dokument u PDF

Presuda

Konačni ishod

Ako, poput većine ljudi, samo želite skenirati nekoliko članaka u časopisima i neke račune za kućanstvo, nećete morati uređivati ​​te dokumente. Stoga će vam pretvaranje izravno u PDF biti prikladno jer ćete i dalje moći pretraživati ​​te dokumente. Zbog toga je besplatni OCR na Internetu definitivno bio najbolji besplatni alat koji smo testirali. S obzirom na to, ako ste spremni platiti 5 USD mjesečno za gotovo savršenstvo, ABBYY -jev FineReader Online bio nešto precizniji.

Što se tiče pretvaranja dokumenata u DOC, nismo uspjeli pronaći savršeno rješenje, ali daleko najbolji rezultati došli su iz OCR prepoznavanje na mreži . Pretvorba nije bila savršena, ali je integritet oblikovanja uglavnom ostao netaknut, a pogreške su bile zanemarive. Kad ove rezultate usporedimo s 'premium' ponudom tvrtke ABBYY, ne možete se načuditi velikom dojmu.

U ovaj post nismo uključili OCR sposobnosti Google diska; malo za Googleovu svuda, ali više za činjenicu da smo htjeli testirati nekoliko drugih besplatnih internetskih OCR usluga.

Za vas: Koje druge mrežne OCR alate biste preporučili našim čitateljima? A što ste probali, a da ga više nikada ne biste koristili?

Udio Udio Cvrkut E -pošta Vodič za animaciju govora za početnike

Oživljavanje govora može biti izazov. Ako ste spremni započeti dodavanje dijaloga u svoj projekt, mi ćemo za vas razbiti postupak.

kako promijeniti lozinku na ps4
Pročitajte Dalje Povezane teme
  • Internet
  • Produktivnost
  • Pretvaranje datoteka
  • OCR
O autoru Rob Nightingale(272 objavljenih članaka)

Rob Nightingale diplomirao je filozofiju na Sveučilištu York u Velikoj Britaniji. Radio je kao menadžer društvenih medija i konzultant više od pet godina, održavajući radionice u nekoliko zemalja. Posljednje dvije godine Rob je također pisac tehnologije, a MakeUseOf je voditelj društvenih medija i urednik biltena. Obično ćete ga zateći kako putuje svijetom, uči montažu videa i eksperimentira s fotografijom.

Više od Roba Nightingalea

Pretplatite se na naše obavijesti

Pridružite se našem biltenu za tehničke savjete, recenzije, besplatne e -knjige i ekskluzivne ponude!

Kliknite ovdje za pretplatu