Mainos
Jos haluat muuntaa tulostetun tekstin digitaaliseksi tekstiksi, jota voit kopioida, liittää, muokata ja etsiä, sinun on käytettävä optista merkkitunnistusta (OCR).
Kun valitset skannata tai ottaa kuvan asiakirjasta, se tallennetaan muodossa, kuten JPEG tai PDF. OCR-ohjelmisto voi sitten tunnistaa näiden asiakirjojen kirjaimet ja numerot ja muuntaa ne a: ksi haettavissa oleva PDF 4 tapaa luoda ja muokata PDF-tiedostoja ilmaiseksiKaikista yleisimmistä tietotyypeistä, joita tietokonemaailmaamme löytyy, PDF on todennäköisesti yksi rajoittavimmista, ja samalla kaikkien saatavilla (ensisijaisesti lukemiseen) ... Lue lisää tai tiedostoon, jota voit muokata esimerkiksi Microsoft Word -ohjelmissa.
Ongelmana on, että jotkut OCR-skannerit toimivat paljon paremmin kuin toiset, ja parhaat puolet ovat melko painavia lompakossa.
Esimerkiksi Omnipage18 maksaa 150 dollaria, mutta on erityisen hyvä eri kielten tunnistamisessa. Adobe Acrobat Pro DC maksaa silmiinpistävää 400 dollaria, mutta on uskomattoman tarkka.
ABBYY FineReader maksaa 150 dollaria, mutta on loistava muuntamaan asiakirjoja, kuten lehtiä ja esitteitä, etsittäväksi tekstiksi. Testaamme ABBYY: n verkkotarjouksia myöhemmin tässä artikkelissa.Kuitenkin, jos sinulla on ilmaisia vaihtoehtoja, voit ladata ja käyttää Windowsissa tai OS X: ssä, sinun pitäisi Kokeile näitä OCR-työkaluja 5 parasta tekstintunnistustyökalua tekstin purkamiseen kuvistaKun sinulla on paperiruloja, miten saat kaiken tulostetun tekstin muuntoksi jotain, jonka digitaalinen ohjelma pystyy tunnistamaan ja indeksoimaan? Pidä hyvä OCR-ohjelmisto lähellä. Lue lisää . Mutta jos haluat mieluummin ilmaisen, verkossa OCR-työkalu, jatka lukemista, sillä olemme kokeilleet muutamia parhaita tuloksia alla.
Koe
Vaikuttaa siltä, että useimmat ihmiset käyttävät nyt omia älypuhelimet skannatakseen heidät Skannaa ja hallitse kuittisi, säästä tilaa, paperia ja aikaaPaperikuitit katoavat helposti, ja niitä on vaikea löytää, kun tarvitset niitä eniten. Onneksi digitaalinen ratkaiseminen ratkaisee nämä molemmat ongelmat. Lue lisää , Päätin käyttää Evernoten skannattava sovellus (Ilmainen iOS: lla ja Androidilla). Skannasin Richard Dawkinin ensimmäisen sivun Kiipeilymäki Mahdoton, nähdäksesi mitä tuloksia voisimme saada hyvin perusmuotoilulla. Skannasin myös sivun Tim Ferrissistä ” 4 tunnin kokki kokeilla skannereita hieman monimutkaisemmalla muotoilulla. Tallensin kaikki nämä tiedostot PDF-muodossa.

Nämä asiakirjat ajettiin sitten joidenkin oletettavasti parhaimpien online OCR-työkalujen läpi nähdäkseen kuinka hyvin ne toimivat.
Ilmainen online-tekstintunnistus [ei enää saatavilla]
Onneksi ilmaisen online-tekstintunnistuksen käyttämiseksi ei vaadita rekisteröintiä. Ja minusta tehtiin kaksinkertainen vaikutus, kun näin heidän vaatimuksensa säilyttää asiakirjani muotoilu ja asettelu.

Sivusto väittää pystyvänsä tukemaan PDF, GIF, BMP, JPEG, TIFF ja PNG syötteinä. Lähdöt voivat olla joko DOC, PDF-tekstidokumentti, RTF ja TXT. Valitettavasti en pystynyt selvittämään, oliko heillä tiedostokokorajoja.
Perusasiakirja PDF-tiedostoon
Muunnettu aivan täydellisesti. Ei ole paljon muuta sanottavaa! Olemme lähtöisin a erittäin hyvä alku.
Perusasiakirja DOC: lle
Oikeat sanat näyttävät kääntyneen moitteettomasti, lukuun ottamatta "Runtmore" -yhtiön "unsia" jotenkin meneväksi AWOLiksi. Muotoilu on kuitenkin erilainen tarina. Monet pilkut korvattiin alaviivoilla ja satunnaiset välilyönnit lisättiin pisteisiin koko asiakirjassa. Kun myöhemmin näet kuinka premium-ohjelmisto menestyi tässä testissä, tämä ei ole huono yritys ollenkaan.
Monimutkainen asiakirja PDF-tiedostoon
Asiakirjan muuntaminen kesti mahtava 120 sekuntia! Valmistuttuaan koko teksti oli muunnettu noin 95-prosenttisella tarkkuudella, vaikkakin sivun oikeassa yläkulmassa olevassa erillisessä ruudussa olevaa tekstiä ei löytynyt. Myös muutamat muut merkit koko PDF-tiedostossa olivat vääriä.
Monimutkainen asiakirja DOC: lle
Tällä kertaa muuntaminen kesti vain 10 sekuntia, kun taas teksti muunnettiin uudelleen noin 95% tarkkuudella. Oli joitakin omituisia välilyöntejä koskevia ongelmia, ja ohjelmistolla oli vaikeuksia fontin muuntamisessa asiakirjan oikeassa yläkulmassa, ja hän jätti muutaman merkin pois täältä.
tuomio
Jos haluat muuntaa yksinkertaisesti muotoiltuja asiakirjoja PDF-tiedostoiksi, tämä on upea työkalu. DOC-muotoon muuntamisen tuloksissa ei ollut mitään kirjoittaa kotiin.
i2OCR esittää joitain vaikuttavia vaatimuksia. Työkalu tunnistaa yli 60 kieltä, pystyy käsittelemään monisarakkeisia asetteluja (poistamalla muotoilun), sillä ei ole tiedostokokorajoituksia, voi muuntaa ladatut tiedostot ja URL-osoitteista. Ja sinun ei myöskään tarvitse rekisteröityä käyttääksesi tätä työkalua.
Palvelu toimii yksinkertaisesti purkamalla teksti kuvasta ja tulostamalla sitten alustamaton teksti. Voit korjata nopeasti kaikki vierekkäisen näkymän virheet, ennen kuin kopioit tekstiä muihin ohjelmiin tai lataat DOC-, PDF- tai HTML-muodossa.
Huomaa: Kun yritin lähettää PDF-dokumenttejani, i2OCR hylkäsi ne, joten minun piti muuntaa ne JPEG-muotoon (ottamalla niistä kuvakaappaus ja lähettämällä sitten tiedostot).
Perusasiakirja tekstimuotoisena
Tämän työkalun toiminnasta johtuen kaikki muotoilut menetetään, vaikka kuvan muuntaminen tekstiksi oli melkein täydellinen. Oli joitain pieniä virheitä, kuten kappaleväli, ja jotkut pilkut korvattiin pisteillä, mutta nämä ovat pieniä niggejä.
Monimutkainen asiakirja tekstiä varten
Suurin osa tekstistä käännettiin ilman liikaa virheitä, lukuun ottamatta otsikkoa ja oikeassa yläreunassa olevaa reseptiä, joka ei ollut luettavissa tälle työkalulle. Tapa, jolla sarakkeet muunnettiin selkeäksi tekstiksi, oli kaukana ihanteellisesta. Jos haluat tehdä tämän muuntamisen toimivaksi, rivien uudelleenjärjestämiseen yhtenäisiksi lauseiksi tarvitaan paljon aikaa.
tuomio
Perusasiakirjoissa i2OCR toimii hyvin. Mahdollisuus muokata tekstiä ennen lataamista on myös erittäin mukava kosketus. Monimutkaisempien asiakirjojen muuntaminen on kuitenkin edelleen melko tarkka, mutta tapa, jolla teksti tulostetaan, ei tee elämästäsi paljon helpompaa.
Online OCR tukee tällä hetkellä 46 eri kieltä, ja se voi muuntaa PDF-, JPG-, BMP-, TIFF- ja GIF-muodot Word-, Excel- tai Plain Text -muotoon. Sivusto väittää, että "muunnetut asiakirjat näyttävät täsmälleen alkuperäiseltä - taulukot, sarakkeet ja grafiikat".
Ilman rekisteröintiä käytettävän version avulla voit muuntaa jopa 15 kuvaa tunnissa (5mb: n raja). Jos kirjaudut tilille, voit ostaa lisää sivuja tämän rajan yläpuolella ja samalla muuntaa myös monisivisia asiakirjoja ja ZIP-arkistoja.

Perusasiakirja DOC: lle
Perusasiakirja käännettiin moitteettomasti erillään roomalaisesta numerosta minä ei noudeta. Kuten sivusto lupasi, muotoilu oli täsmälleen sellainen kuin se oli kirjassa. Kudos tähän työkaluun.
Monimutkainen asiakirja DOC: lle
Saatuaani pettymyksen aikaisemmista OCR-työkaluista monimutkaisen asiakirjan muuntamisessa, Online OCR vaikutti minuun massiivisesti. Asettelu oli melkein täydellinen, kuten yllä näet. Jälleen kerran, reseptiä ei valittu liian hyvin, mutta muut pienet virheet olivat vähäpätöisiä.
tuomio
Erinomaisia tuloksia Online OCR: ltä. Ainoa haittapuoli, jota näen, on se, että muunnettuja asiakirjoja ei voi ladata PDF-tiedostoina, koska mainittuihin tulostusmuotoihin sisältyy vain DOCX, XLSX ja TXT.
Kuten aiemmin mainittiin, ABBYY on yksi OCR-ohjelmistojen markkinajohtajia, ja niiden kokonainen, ladattava ohjelma maksaa noin 150 dollaria. He tarjoavat 10-sivuinen ilmainen kokeilu heidän verkkotyökalulleen (rekisteröinti vaaditaan). Niiden online-työkalun avulla voit muuntaa 200 sivua kuukaudessa, jos tilauksesi on 5 dollaria.

Hyväksytyt tiedostot voivat olla enintään 100mb, missä tahansa näistä muodoista: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP ja PNG. ABBYY tunnistaa myös lähes 200 kieltä. Lähdöt ovat erityisen vaikuttavia, ja valittavana on DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 ja EPUB.
Voit jopa kokeilla pari BETA-ominaisuutta kokeilusi aikana. Ensimmäinen on mahdollisuus kääntää asiakirja toiselle kielelle. Toinen asia on viedä muunnettu asiakirja pilvitallennustilillesi, olipa kyseessä sitten Dropbox, Google Drive, Evernote, Microsoft OneDrive tai Box.
Perusasiakirja DOCX: iin
Kokonaistulokset olivat hyviä, mutta ei uskomatonta ottaen huomioon, että tämä on premium-tuote. Useita pilkuja ja pisteitä vaihdettiin, useita käänteisiä pilkuja korvattiin tähdellä, muutama iso kirjain puuttui ja yksi sana (kirjaimellinen) kirjoitettiin väärin.
Monimutkainen asiakirja DOCX: iin
Muuntamisen jälkeen asiakirjan tekstissä oli hyvin vähän vikoja (lukuun ottamatta OCR: ää, joka kamppailee uudelleen reseptin kirjasimesta!), Mutta muotoilu jätti paljon toivomisen varaa.

Kolme saraketta kesti jotenkin kaksi sivua keskimmäisen sarakkeen kanssa vain näkyy toisella sivulla. Jos halusit todella tehdä mitä tahansa tällä muunnetulla asiakirjalla voit vetää hiuksesi pois.
Perusasiakirja PDF-tiedostoon
Tarkastellessani muunnettua PDF-tiedostoa en löytänyt mitään vikaa. Ehkä olemme löytäneet, missä ABBYY menestyy. Upeita tuloksia.
Monimutkainen asiakirja PDF-tiedostoon
En jälleenkään löytänyt virheitä tästä muunnetusta tiedostosta. ABBYY tietysti osaa muuntaa PDF-tiedoston poikkeuksellisen hyvin.
tuomio
Jos maksat mielelläsi muutaman dollarin, PDF-muotoon muuntaminen näyttää toimivan ilmiömäisesti hyvin tämän palvelun ja olemisen kanssa kyky synkronoida muunnetut tiedostot pilvisäilöön on erityisen hyödyllistä, kun skannaat suurta määrää tiedostoja asiakirjoja. Kuten muissakin vaihtoehdoissa, ABBYY ei ole vieläkään selvittänyt, miten asiakirjat muutetaan virheettömästi DOC-tiedostoksi editoinnin helpottamiseksi.
Lopullinen tulos
Jos, kuten useimmat ihmiset, haluat vain skannata muutamia aikakauslehtiartikkeleita ja joitain kotitalouslaskuja, sinun ei tarvitse muokata näitä asiakirjoja. Siksi muuntaminen suoraan PDF-tiedostoksi sopii sinulle, koska voit silti hakea kyseisistä asiakirjoista. Free Online OCR oli ehdottomasti paras testattu ilmainen työkalu. Jos olet valmis maksamaan 5 dollaria kuukaudessa lähes täydellisyydestä, ABBYY: n FineReader Online oli hiukan tarkempi.
Asiakirjojen muuntamisessa DOC: ksi emme löytäneet täydellistä ratkaisua, mutta ylivoimaisesti parhaat tulokset tulivat Online OCR. Muuntaminen ei ollut täydellinen, mutta muotoilun eheys pidettiin suurelta osin ennallaan, ja virheet olivat vähäpätöisiä. Kun vertaamme näitä tuloksia ABBYY: n "premium" -tarjoukseen, et voi auttaa, mutta olla vaikuttunut massiivisesti.
Emme sisällyttäneet Google Driven tekstintunnistusominaisuudet tässä viestissä; vähän Googlen kaikesta tietoisuudesta, mutta enemmän siitä, että halusimme testata muutamia muita ilmaisia online-tekstintunnistuspalveluita siellä.
Sinulle: Mitä muita online-tekstintunnistustyökaluja suosittelisit lukijoillemme? Ja mitä olet yrittänyt et koskaan käyttänyt enää?
Rob Nightingale on saanut filosofian tutkinnon Yorkin yliopistosta, Iso-Britannia. Hän on työskennellyt sosiaalisen median johtajana ja konsulttina yli viisi vuotta, ja hän on pitänyt työpajoja useissa maissa. Viimeisen kahden vuoden aikana Rob on myös kirjoittanut tekniikkaa, ja hän on MakeUseOfin sosiaalisen median johtaja ja uutiskirjeeditori. Löydät hänet yleensä matkustamasta…