Nije uvijek moguće izvaditi tekst iz PDF datoteke koristeći konvencionalno kopiranje. Često su stranice takvih dokumenata skenirani sadržaj njihovih verzija papira. Za pretvaranje takvih datoteka u tekstualne podatke koji se mogu uređivati, koriste se posebni programi s funkcijom optičkog prepoznavanja (OCR).
Takva rješenja su vrlo teška za implementaciju i stoga troše mnogo novca. Ako redovito trebate prepoznati tekst s PDF-om, preporučljivo je kupiti odgovarajući program. U rijetkim slučajevima bilo bi logičnije koristiti jednu od dostupnih online usluga sa sličnim funkcijama.
sadržaj
Naravno, skup značajki za online usluge OCR-a ograničen je u usporedbi s punim stolnim rješenjima. Ali s takvim resursima možete raditi besplatno ili za nominalnu naknadu. Glavna stvar je da se odgovarajuće web aplikacije nose s njihovim glavnim zadatkom, odnosno prepoznavanjem teksta.
Tvrtka za razvoj usluga je jedan od lidera u području prepoznavanja optičkih dokumenata. ABBYY FineReader za Windows i Mac moćno rješenje za pretvaranje PDF-a u tekst i daljnje surađivanje s njom.
Web kolega programa, naravno, inferioran je u funkcionalnosti. Ipak, usluga može prepoznati tekst iz skeniranja i fotografija na više od 190 jezika. Podržava pretvorbu PDF datoteka u dokumente riječ , nadmašiti itd
ABBYY FineReader Online online usluga
Usluga se razlikuje vjerojatno od najpreciznijih algoritama prepoznavanja teksta na slikama i PDF datotekama. No, nažalost, njegova besplatna upotreba ograničena je na pet obrađenih stranica mjesečno. Da biste radili s više voluminoznih dokumenata, morate kupiti jednu godinu pretplatu.
Međutim, ako je funkcija OCR-a vrlo rijetko potrebna, ABBYY FineReader Online je izvrstan izbor za izdvajanje teksta iz malih PDF datoteka.
Jednostavna i praktična usluga za digitalizaciju teksta. Bez potrebe za registracijom, resurs vam omogućuje prepoznavanje 15 punih PDF stranica po satu. Besplatni OCR u cijelosti radi s dokumentima na 46 jezika i bez odobrenja podržava tri formata izvoza teksta - DOCX, XLSX i TXT.
Pri registraciji korisnik može obrađivati dokumente s više stranica, ali je besplatan broj tih stranica ograničen na 50 jedinica.
Online usluga Besplatni OCR OCR
Za ovlaštene korisnike, slijed akcija je nešto drugačiji.
Ako trebate izdvojiti tekst iz malog PDF dokumenta, možete se sigurno služiti upotrebom gore opisanog alata. Da biste radili s velikim datotekama, morat ćete kupiti dodatne simbole u besplatnom OCR-u ili pribjeći drugom rješenju.
Potpuno besplatna OCR servis koji vam omogućuje izdvajanje teksta iz gotovo svih grafičkih i elektroničkih dokumenata kao što su DjVu i PDF. Resurs ne nameće ograničenja veličine i broja prepoznatljivih datoteka, ne zahtijeva registraciju i nudi širok raspon povezanih funkcija.
NewOCR podržava 106 jezika i sposoban je ispravno rukovati čak i niskom kvalitetom skeniranja dokumenata. Moguće je ručno odabrati područje za prepoznavanje teksta na stranici s datotekama.
Alat je prikladan i prepoznaje sve znakove dovoljno visoke kvalitete. Međutim, obrada svake stranice uvezenog PDF dokumenta mora biti pokrenuta neovisno i prikazana u zasebnoj datoteci. Naravno, možete odmah kopirati rezultate prepoznavanja u međuspremnik i spojiti ih s drugima.
Ipak, s obzirom na gore navedenu nijansu, velike količine teksta pomoću NewOCR-a vrlo je teško izvaditi. Usluga se kopira s malim datotekama "s bangom".
Jednostavan i razumljiv izvor za digitalizaciju teksta omogućuje vam prepoznavanje PDF dokumenata i izlazak rezultata u TXT datoteku. Nema ograničenja broja stranica. Jedino ograničenje je da veličina ulaznog dokumenta ne smije biti veća od 5 megabajta.
Ako samo trebate izdvojiti tekst iz PDF-a, konačno oblikovanje uopće nije bitno, OCR.Space je dobar izbor. Jedini dokument mora biti "jednojezičan", jer priznavanje dva ili više jezika u isto vrijeme u usluzi nije predviđeno.
Vidi također: Slobodni analozi FineReadera
Ocjenjivanjem on-line alata predstavljenih u članku, treba napomenuti da ABBYY FineReader Online obrađuje OCR funkciju najpreciznije i preciznije. Ako je najveća točnost prepoznavanja teksta važno za vas, najbolje je razmotriti tu posebnu mogućnost. No, kako bi platili za to, najvjerojatnije, također moraju.
Ako trebate digitalizirati male dokumente, a vi ste spremni sami ispraviti pogreške na usluzi, preporučljivo je koristiti NewOCR, OCR.Space ili Free Online OCR.