Groete aan alle lesers van die blog!
Ek dink dat diegene wat dikwels op die rekenaar werk (nie speel nie, maar dit werk), moes hanteer met teksherkenning. Wel, jy het byvoorbeeld 'n uittreksel uit die boek gesoek en nou moet jy hierdie gedeelte in jou dokument plak. Maar die geskandeerde dokument is 'n prentjie en ons benodig teks. Hiervoor benodig ons spesiale programme en aanlyndienste om teks uit prente te herken.
Oor programme vir erkenning, het ek reeds in vorige poste geskryf:
- Scan teks en herkenning in FineReader (betaalde program);
- Werk in analoog FineReader - CuneiForm (gratis program).
In dieselfde artikel wil ek graag fokus op aanlyn dienste vir teksherkenning. Na alles, as jy die teks vinnig met 1-2 prente moet kry, maak dit nie sin om met verskeie programme te installeer nie.
Dit is belangrik! Die kwaliteit van erkenning (die aantal foute, leesbaarheid, ens.) Hang baie af van die oorspronklike beeldkwaliteit. Daarom, wanneer skandeer (foto's, ens.), Kies die gehalte so hoog as moontlik. In die meeste gevalle is die kwaliteit van 300-400 dpi voldoende (dpi is die parameter wat die kwaliteit van die prentjie kenmerk. In die instellings van byna alle skandeerders word hierdie parameter gewoonlik aangedui).
Aanlyn dienste
Om die werk van die dienste te wys, het ek 'n kiekie van een van my artikels gemaak. Hierdie skermkiekie sal na alle dienste opgelaai word, waarvan die beskrywing hieronder aangebied word.
1) //www.ocrconvert.com/
Ek hou regtig van hierdie diens as gevolg van sy eenvoud. Alhoewel die webwerf Engels is, werk dit ook goed met die Russiese taal. Jy hoef nie te registreer nie. Om erkenning te begin, moet jy 3 stappe doen:
- laai jou prent op
- kies die taal van die teks, wat in die prentjie is;
- druk die begin herkenning knoppie.
Formaat ondersteuning: PDF, GIF, BMP, JPEG.
Die resultaat word hieronder in die prentjie getoon. Ek moet sê, die teks is goed erken. Daarbenewens, baie vinnig - ek het letterlik 5-10 sekondes gewag.
2) //www.i2ocr.com/
Hierdie diens werk soortgelyk aan die bogenoemde. Hier moet u ook die lêer aflaai, die herkenningstaal kies en klik op die uittrekselknoppie. Die diens werk baie vinnig: 5-6 sekondes. een bladsy.
Ondersteunde formate: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.
Die resultaat van hierdie aanlyn diens is baie geriefliker: jy sien dadelik twee vensters - in die eerste een die herkenningsresultaat, in die tweede - die oorspronklike beeld. Daarom is dit maklik om veranderinge aan te bring tydens die redigering. Registrasie op die diens is terloops ook nie nodig nie.
3) //www.newocr.com/
Hierdie diens is op verskeie maniere uniek. Eerstens ondersteun dit die "nuutgevormde" formaat DJVU (terloops, die volledige lys van formate: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Tweedens ondersteun dit die keuse van teksareas in die prent. Dit is baie handig as jy nie net teksgebiede in die prentjie het nie, maar ook grafiese een wat jy nie moet herken nie.
Erkenningskwaliteit is bo gemiddeld, hoef nie te registreer nie.
4) //www.free-ocr.com/
'N Baie eenvoudige diens vir erkenning: laai 'n prent op, spesifiseer die taal, voer captcha in (terloops, die enigste diens in hierdie artikel waar jy dit moet doen) en druk die knoppie om die prentjie in teks te vertaal. Eintlik alles!
Ondersteunde formate: PDF, JPG, GIF, TIFF, BMP.
Die erkenningsresultaat is medium. Daar is foute, maar nie baie nie. As die kwaliteit van die oorspronklike kiekie egter hoër sou wees, sou daar 'n orde van grootte minder foute wees.
PS
Dis alles vir vandag. As jy meer interessante dienste vir teksherkenning ken - deel in die kommentaar, sal ek dankbaar wees. Een voorwaarde: dit is wenslik dat daar nie nodig is om te registreer nie en die diens was gratis.
Beste groete!