Dit is nie altyd moontlik om teks uit 'n PDF-lêer uit te haal deur gebruik te maak van konvensionele kopiëring nie. Dikwels is die bladsye van sulke dokumente die gescande inhoud van hul papier weergawes. Om sulke lêers te omskep in volledig redigeerbare teks data, word spesiale programme met die OCR-funksie (Optical Character Recognition) gebruik.
Sulke oplossings is baie moeilik om te implementeer en kos dus baie geld. As jy gereeld teks met PDF moet herken, is dit raadsaam om die toepaslike program te koop. Vir seldsame gevalle sal dit logies wees om een van die beskikbare aanlyndienste met soortgelyke funksies te gebruik.
Hoe om teks van PDF aanlyn te herken
Natuurlik is die OCR-aanlyndiens funksie stel beperk in vergelyking met volledige desktop oplossings. Maar jy kan ook gratis met sulke hulpbronne werk, of vir 'n nominale fooi. Die belangrikste ding is dat die ooreenstemmende webtoepassings hul hooftaak hanteer, naamlik teksherkenning.
Metode 1: ABBYY FineReader Online
Die diensontwikkelingsmaatskappy is een van die leiers op die gebied van optiese dokumentherkenning. ABBYY FineReader vir Windows en Mac is 'n kragtige oplossing vir die omskakeling van PDF na teks en om daarmee saam te werk.
Die web-eweknie van die program is natuurlik minderwaardig as dit in funksionaliteit. Nietemin kan die diens teks van skanderings en foto's in meer as 190 tale herken. Ondersteun die omskakeling van PDF-lêers in dokumente Word, Excel, ens.
ABBYY FineReader Online aanlyn diens
- Voordat jy met die Gereedskap begin werk, maak 'n rekening op die webwerf of teken aan met jou Facebook-, Google- of Microsoft-rekening.
Om na die inlog venster te gaan, klik op die knoppie. "Teken in" in die boonste spyskaart. - Nadat jy ingeteken het, invoer die verlangde PDF-dokument in die FineReader deur die knoppie te gebruik "Laai lêers op".
Klik dan "Kies bladsynommers" en spesifiseer die verlangde span vir teksherkenning. - Kies dan die tale in die dokument, die formaat van die gevolgde lêer en klik op die knoppie "Erken".
- Na verwerking, waarvan die duur geheel en al afhang van die grootte van die dokument, kan u die voltooide lêer met teksdata aflaai deur eenvoudig op die naam te klik.
Of voer dit uit na een van die beskikbare wolkdienste.
Die diens word waarskynlik onderskei aan die mees akkurate teksherkenningsalgoritmes in beelde en PDF-lêers. Maar ongelukkig is die gratis gebruik daarvan beperk tot vyf bladsye wat per maand verwerk word. Om te werk met meer omvangryke dokumente, moet jy 'n eenjaar-intekening koop.
As die OCR-funksie egter baie selde nodig is, is ABBYY FineReader Online 'n goeie opsie om teks uit klein PDF-lêers te onttrek.
Metode 2: Gratis aanlyn OCR
Eenvoudige en gerieflike diens vir die digitalisering van teks. Sonder die behoefte aan registrasie, kan die bron u 15 volledige PDF-bladsye per uur herken. Gratis aanlyn OCR werk ten volle met dokumente in 46 tale en ondersteun sonder toestemming drie teks uitvoerformate - DOCX, XLSX en TXT.
By die registrasie kan die gebruiker multi-bladsy dokumente verwerk, maar die gratis nommer van hierdie bladsye is beperk tot 50 eenhede.
Gratis aanlyn OCR aanlyn diens
- Om die teks van die PDF as 'n "gas" te erken, sonder toestemming op die bron, gebruik die toepaslike vorm op die hoofblad van die werf.
Kies die verlangde dokument met die knoppie "Lêer", spesifiseer die hoof teks taal, uitvoer formaat, dan wag vir die lêer om te laai en klik "Skakel". - Aan die einde van die digitaliseringsproses, klik "Laai afvoer lêer af" Om die voltooide dokument te stoor met die teks op die rekenaar.
Vir gemagtigde gebruikers is die volgorde van aksies ietwat anders.
- Gebruik die knoppie "Registrasie" of "Teken in" In die hoofkieslysbalk, onderskeidelik, skep 'n rekening Free Online OCR of gaan dit in.
- Na die magtiging in die erkenningspaneel, hou die sleutel in «Ctrl», kies tot twee tale van die brondokument uit die lys wat verskaf word.
- Spesifiseer verdere opsies vir die onttrekking van teks uit PDF en klik op die knoppie. "Kies lêer" Om die dokument in die diens te laai.
Klik dan om erkenning te begin "Skakel". - Nadat u die dokument verwerk het, klik op die skakel met die naam van die uitvoerlêer in die ooreenstemmende kolom.
Die herkenningsresultaat sal onmiddellik in die geheue van u rekenaar gestoor word.
As u teks uit u0026 # 39; n klein PDF-dokument moet uittreksel, kan u veilig gebruik maak van die hulpmiddel wat hierbo beskryf word. Om met groot lêers te werk, moet u addisionele simbole in Free Online OCR koop of oordra na 'n ander oplossing.
Metode 3: NewOCR
Volledig gratis OCR-diens wat u toelaat om teks uit feitlik enige grafiese en elektroniese dokumente soos DjVu en PDF te onttrek. Die hulpbron stel nie beperkings op die grootte en aantal herkenbare lêers in nie, vereis nie registrasie nie, en bied 'n wye verskeidenheid verwante funksies.
NewOCR ondersteun 106 tale en kan selfs lae kwaliteit dokument skanderings korrek hanteer. Dit is moontlik om die area vir teksherkenning op die lêerbladsy handmatig te kies.
Aanlyn diens NewOCR
- So, jy kan dadelik met die hulpbron werk, sonder om onnodige aksies te verrig.
Direk op die hoofblad is daar 'n vorm vir die invoer van die dokument na die webwerf. Om 'n lêer na NewOCR op te laai, gebruik die knoppie "Kies lêer" in die afdeling "Kies jou lêer". Dan in die veld "Erkenning taal (tale)" kies een of meer tale van die brondokument en klik dan "Laai + OCR op". - Stel jou voorkeurherkenningsinstellings in, kies die gewenste bladsy om die teks te onttrek en klik op die knoppie. «OCR».
- Rol 'n bietjie af en vind die knoppie. «Aflaai».
Klik daarop en kies die vereiste dokumentformaat vir die aflaai in die keuselys. Daarna sal die voltooide lêer met die onttrekte teks na u rekenaar afgelaai word.
Die gereedskap is gerieflik en herken alle karakters in 'n voldoende hoë gehalte. Die verwerking van elke bladsy van die ingevoerde PDF-dokument moet egter onafhanklik van stapel gestuur word en in 'n aparte lêer vertoon word. U kan natuurlik onmiddellik die erkenningsresultate na die knipbord kopieer en saamsmelt met ander.
Desalniettemin, met die bogenoemde nuans, is groot hoeveelhede teks wat NewOCR gebruik, baie moeilik om te onttrek. Met dieselfde klein lêers is die diens "met 'n knal."
Metode 4: OCR.Space
'N eenvoudige en verstaanbare bron vir die digitalisering van teks kan jy PDF-dokumente herken en die resultaat in 'n TXT-lêer uitvoer. Daar is geen perke op die aantal bladsye nie. Die enigste beperking is dat die grootte van die insetdokument nie 5 megabytes mag oorskry nie.
OCR.Space aanlyn diens
- Registreer om met die gereedskap te werk, is nie nodig nie.
Klik net op die skakel hierbo en laai die PDF-dokument op die webwerf vanaf u rekenaar op met die knoppie "Kies lêer" of vanaf die netwerk - deur verwysing. - In die aftreklys "Kies OCR taal" kies die taal van die ingevoerde dokument.
Begin dan die teksherkenningsproses deur op die knoppie te klik. "Begin OCR!". - Aan die einde van die lêerverwerking, sien die resultaat in die "OCR'ed Result" en klik «Aflaai»om die voltooide TXT-dokument af te laai.
As jy net die teks uit die PDF moet onttrek en die finale formatering glad nie belangrik is nie, is OCR.Space 'n goeie keuse. Die enigste dokument moet "eentalig wees", aangesien die erkenning van twee of meer tale terselfdertyd in die diens nie verskaf word nie.
Sien ook: Gratis analoë FineReader
Die evaluering van die aanlyn-gereedskap wat in die artikel aangebied word, moet daarop gelet word dat die FineReader Online van ABBYY die OCR-funksie akkuraat en akkuraat hanteer. As die maksimum akkuraatheid van teksherkenning vir jou belangrik is, is dit die beste om hierdie opsie spesifiek te oorweeg. Maar om dit te betaal, sal waarskynlik ook moet.
As u klein dokumente moet digitaliseer en u gereed is om foute self by die diens reg te stel, is dit raadsaam om NewOCR, OCR.Space of Free Online OCR te gebruik.