Vroeër of later word almal wat dikwels met kantoorprogramme werk, 'n tipiese taak ondervind. Skandeer die teks uit 'n boek, tydskrif, koerant, net pamflette, en vertaal hierdie prente in teksformaat, byvoorbeeld in 'n Word-dokument.
Om dit te doen benodig jy 'n skandeerder en 'n spesiale program vir teksherkenning. Hierdie artikel bespreek die gratis analoog van FineReader -spykerskrif (oor erkenning in FineReader - sien hierdie artikel).
Kom ons begin ...
Die inhoud
- 1. Kenmerke van die CuneiForm-program, funksies
- 2. 'n Voorbeeld van teksherkenning
- 3. Batch teks herkenning
- 4. Gevolgtrekkings
1. Kenmerke van die CuneiForm-program, funksies
spykerskrif
Jy kan aflaai van die ontwikkelaar se webwerf: //cognitiveforms.com/
'N Open source teksherkenningsprogrammatuur. Daarbenewens werk dit in alle weergawes van Windows: XP, Vista, 7, 8, wat behaag. Plus, voeg die volledige Russiese vertaling van die program by!
voor:
- teksherkenning in die 20 gewildste tale van die wêreld (Engels en Russies self word by hierdie nommer ingesluit);
- Groot ondersteuning vir verskeie drukfonts;
- gaan na die woordeboek herkenbare teks;
- die vermoë om die resultate van werk op verskeie maniere te red;
- die struktuur van die dokument te handhaaf;
- Uitstekende ondersteuning en erkenningstabelle.
nadele:
- ondersteun nie te groot dokumente en lêers (meer as 400 dpi);
- ondersteun nie sekere soorte skandeerders direk nie (wel, dit is nie scary nie, 'n spesiale skandeerder word by die skandeerderbestuurders ingesluit);
- die ontwerp skyn nie (maar wie benodig dit as die program die probleem volledig oplos).
2. 'n Voorbeeld van teksherkenning
Ons neem aan dat u al die nodige prente vir erkenning (geskandeer daar, of die boek in pdf / djvu formaat op die internet afgelaai het en die nodige prente van hulle afgelaai het.) Hoe om dit te doen - sien hierdie artikel).
1) Maak die vereiste prent in die CuineForm-program oop (lêer / oop of "Cntrl + O").
2) Om erkenning te begin, moet jy eers verskillende areas kies: teks, prente, tabelle, ens. In die Cuneiform-program kan dit nie net handmatig gedoen word nie, maar ook outomaties! Om dit te doen, klik op die "opmaak" knoppie in die boonste paneel van die venster.
3) Na 10-15 sekondes. Die program sal outomaties alle areas met verskillende kleure belig. Byvoorbeeld, 'n teks gebied is in blou uitgelig. Terloops, het sy alle areas korrek en redelik vinnig belig. Eerlik, ek het nie so 'n vinnige en korrekte antwoord van haar verwag nie.
4) Vir diegene wat nie die outomatiese opmerkings vertrou nie, kan jy die handleiding gebruik. Hiervoor is daar 'n nutsbalk (sien foto hieronder), danksy wat jy kan kies: teks, tafel, foto. Beweeg, vermeerder / verlaag die aanvanklike beeld, sny die rande. Oor die algemeen, 'n goeie stel.
5) Nadat alle areas gemerk is, kan u voortgaan na erkenning. Om dit te doen, klik eenvoudig op die knoppie met dieselfde naam, soos in die prent hieronder.
6) Letterlik in 10-20 sekondes. U sal 'n dokument in Microsoft Word met die erkende teks sien. Wat interessant is, in die teks vir hierdie voorbeeld was natuurlik foute, maar daar is baie min van hulle! Veral, met inagneming van hoe duidelik die oorspronklike materiaal was - die prentjie.
Die spoed en kwaliteit is redelik vergelykbaar met FineReader!
3. Batch teks herkenning
Hierdie funksie van die program kan handig wees wanneer u nie een foto moet herken nie, maar verskeie gelyktydig. Die snelkoppeling om die joernaalherkenning te begin, word gewoonlik in die beginkies versteek.
1) Nadat u die program oopgemaak het, moet u 'n nuwe pakket skep, of 'n voorheen gestoor een oopmaak. In ons voorbeeld - skep 'n nuwe een.
2) In die volgende stap gee ons dit 'n naam, verkieslik so dat ses maande later sal ons onthou wat daarin gestoor word.
3) Kies dan die dokumenttaal (Russies-Engels), dui aan of daar prente en tabelle in u gescande materiaal is.
4) Nou moet u die gids spesifiseer waarin die lêers vir erkenning geleë is. Terloops, wat interessant is, is dat die program self al die prente en ander grafiese lêers sal vind wat dit kan herken en by die projek voeg. U moet ook die ekstra verwyder.
5) Die volgende stap is nie belangrik nie - kies wat om te doen met die bronlêers, na erkenning. Ek beveel aan om die boks "niks te doen" nie.
6) Dit bly net die formaat waarin die erkende dokument gestoor gaan word, te kies. Daar is verskeie opsies:
- rtf - die lêer van die woorddokument word geopen deur alle gewilde kantore (insluitend vrye mense, 'n skakel na programme);
- txt - teksformaat, jy kan slegs teks, prente en tabelle daarin stoor;
- htm - Hypertext bladsy, gerieflik as u lêers vir die werf scan en herken. Sy en kies in ons voorbeeld.
7) Nadat u op die knoppie "Voltooi" gekliek het, sal die verwerking van u projek begin.
8) Die program werk redelik vinnig. Na erkenning, sal jy 'n oortjie met htm lêers sien. As u op so 'n lêer kliek, begin 'n blaaier waar u die resultate kan sien. Terloops, die pakket kan gered word vir verdere werk daarmee.
9) Soos u kan sien die resultate werk is baie indrukwekkend. Die program herken die prent maklik, en herken die teks maklik daaronder. Terwyl die program gratis is, is dit oor die algemeen super!
4. Gevolgtrekkings
As jy gereeld nie dokumente skandeer en herken nie, koop FineReader waarskynlik nie sin nie. CuneiForm hanteer maklik die meeste take.
Aan die ander kant het sy ook nadele.
Eerstens is daar te min gereedskap vir die redigering en kontrole van die gevolglike resultaat. Tweedens, as jy baie foto's moet herken, is dit beter om onmiddellik alles in die kolom aan die regterkant van die projek by die projek te sien: vinnig verwyder onnodig, wysigings, ens. En ten derde, op dokumente van absoluut swak gehalte verloor CuneiForm erkenning: jy moet die dokument in gedagte bring - korrekte foute, leestekens, aanhalings, ens.
Dis alles. Ken jy enige ander ordentlike gratis teksherkenningsprogrammatuur?