
Optinen merkintunnistus: myös sinä voit saada hyviä tuloksia |
 |
 |
 |
Aiemmin ajatus painetun sanan muuttamisesta muokattavaksi ja jaettavaksi tekstiksi skannerin avulla sai monen yritteliäänkin ihmisen lannistumaan. Vaikka optinen merkintunnistus (OCR) kuulosti hyvältä teoriassa, viime aikoihin saakka optisesti luetun tekstin siistimiseen tarvittava vaiva ei ollut mahdollisen ajansäätön arvoista. Usein vaikutti helpommalta kirjoittaa asia uudelleen kuin lukea se optisesti.
|
 |
 |
 |
Aika ja tekniikka on muuttanut kaiken |
 |
 |
Miksi OCR olisi poikkeus? Nykyään OCR on käytännöllinen ja aikaa säästävä tapa muuttaa suuria määriä tekstiä (ja kuvia ja taulukoita) muotoon, jota voi käsitellä tietokoneella mielensä mukaan. Kun käytät monien HP:n Scanjet-skannereiden mukana tulevaan Scan Directory -ohjelmistoon integroitua OCR-ohjelmistoa, valmistele lähdedokumenttisi huolellisesti ja huomioi pari yksityiskohtaa ORC-prosessin aikana ja optinen merkintunnistuksesi on erinomainen menestys. Säästät aikaa ja muutat sisällön työstettävään muotoon.
|
 |
Aloita hyvästä lähtökohdasta |
 |
 |
Mitä parempi lähdedokumentti, sitä paremmat OCR-tulokset. Ja vaikka jokaisen dokumentin ei tarvitse olla tahraton, seuraavat vinkit auttavat sinua valmistelemaan dokumenttisi onnistunutta skannausta varten.

- Laatu: Käytä aina ensiluokkaisia originaaleja. Repeämät, rypyt ja tahrat sotkevat OCR-ohjelmistoa ja aiheuttavat virheitä lopputuloksessa. Paranna likaista originaalia korjausnesteellä tai lisää sen kontrastia ottamalla siitä valokopio.
- Yksinkertaisuus: OCR-ohjelmisto käsittelee yleensä suuria määriä perustekstiä, jossa ei ole sarakkeita, viivoja, tekstilaatikoita tai muita asetteluja.
- Asetukset: Tekstin skannaaminen monisarakkeiselta sivulta on helppoa, jos käsittelet jokaista saraketta omana komponenttinaan. OCR-ohjelmistot antavat yleensä käyttäjän määritellä mitkä osat tekstisivusta skannataan. Jos määrittelet jokaisen sarakkeen omaksi tekstikentäkseen, OCR-prosessi alkaa ensimmäisestä sarakkeesta, siirtyy sitten seuraavaan jne.
|
|
 |
Vinkkejä parempaa skannausta varten |
 |
 |
Kun olet valmis aloittamaan skannauksen, seuraavien ehdotusten pitäisi parantaa lopputulosta:

- Varmista skannerin asetukset. Varmista, että skanneri ei käytä pehmennys- tai rasterointiasetuksia. Vaikka nämä asetukset parantavat valokuvaskannausten laatua, ne tekevät tekstin prosessoinnista vaikeampaa.
- Huomioi paperin väri. Jos skannaat värilliselle paperille painettua tekstiä, lisää kirkkautta ja kontrastia noin 10 %.
- Lisää tarkkuutta. Saat parempia tuloksia 200 dpi:n kuvasta kuin 100 dpi:n kuvasta ja 600 dpi:n kuva on parempi kuin 200 dpi:n tarkkuudella skannattu. Mutta ennen kuin käännät skannerin dpi-asetuksen maksimiin, muista, että suurella tarkkuudella skannatut kuvat vievät paljon levytilaa. Huolehdi, että tarkkuusasetus on tasapainossa käytettävissä olevan levytilan kanssa.
- Tarkista kieli. Varmista, että OCR-ohjelmisto on asetettu käsittelemään oikeaa kieltä. Useimmat OCR-ohjelmistot tukevat monia kieliä, joten tarkista, että kieliasetus ja skannattava kieli vastaavat.
- Opi yrityksestä ja erehdyksestä. Jos aiot skannata suuren tai pitkän dokumentin, skannaa yksi sivu ja käsittele se lopulliseen muotoonsa. Tämä antaa sinulle mahdollisuuden löytää ja korjata mahdollisia virheitä tai puutteita.
- Käytä oikeita välineitä. Mitä nopeampi tietokone ja skanneri, sitä vähemmän aikaa joudut odottamaan. Tarvitset vähintään 64 Mt muistia (mutta 128 Mt on parempi) perustoimintoihin, kuten kuvien erottelemiseen tekstistä, merkkien tunnistamiseen ja asettelun muuntamiseen sähköiseen muotoon. Lisäksi, jos aiot skannata useita sivuja kerralla, automaattinen syöttälaite (ADF) saattaa olla kannattava sijoitus.
- Lue käyttöopas . Mitä enemmän tiedät mistä tahansa työkalusta, sitä paremmin osaat sitä käyttää. Ennen kuin aloitat skannauksen ja optisen merkintunnistuksen, varaa aikaa sekä skannerin että ohjelmiston käyttöoppaiden ja readme-tiedostojen lukemiseen. Puoli tuntia, jonka kulutat käytössäsi oleviin OCR-työkaluihin tutustumiseen, saattaa säästää tunteja ja tekee sinusta huomattavasti tuottavamman.
|
|
 |
|
 |
|