Estrarre Testo dalle Immagini: I Migliori Servizi Di OCR OnLine

I software  OCR (dall’inglese optical character recognition) sono programmi dedicati alla conversione di un’immagine contenente testo (solitamente acquisite tramite scanner) in testo digitale modificabile tramite un normale software di editing.

Fino a qualche anno fa questo tipo di software si trovava principalmente a pagamento (o integrato nelle applicazioni di gestione degli scanner o stampanti multifunzione), le versioni gratuite erano poche, non funzionavano benissimo, e spesso supportavano solo l’inglese (causando grossi problemi a testi che hanno caratteri accentati come l’italiano).

Servizi Online di OCR: Come Estrarre Testo da Immagini e pdf

Ultimamente, però, ci sono diverse alternative, ad esempio l’ottimo Tesseract-ocr (disponibile in ambiente Linux/Unix). Per la maggior parte degli utenti però, non vale la pena scaricare un software per l’ocr, visto l’uso sporadico. Un’ottima alternativa per chi facesse un’uso occasionale di questo software è l’utilizzo di alcuni servizi on line.

  1. http://www.newocr.com/: Ottimo tool che non richiede la registrazione e non ha alcun limite di caricamento; supporta 29 lingue, tra cui l’italiano, e accetta vari formati, anche pdf multipagina; riconosce il testo anche con layout a più colonne.
  2. http://www.free-ocr.com/: Accetta vari formati in ingresso ma in uscita solo txt. Supporta molte lingue, tra cui l’italiano. Si possono convertire fino a 10 file all’ora ciascuna di dimensione inferiore a 2 megabytes.
  3. http://www.onlineocr.net/: E’ utilizzabile senza registrazione, ma per avere tutte le funzionalità è necessario registrarsi. Supporta molte lingue tra cui l’italiano. Utilizza un sistema di crediti che possono essere guadagnati (o acquistati).
  4. http://finereader.abbyyonline.com/en: Richiede la registrazione. Consente di convertire gratuitamente fino a 10 file al giorno. Riconosce e ricrea la formattazione delle pagine e supporta varie lingue, tra cui l’italiano. Riconosce e restituisce vari formati.

Va detto che il compito che si prefigge il software ocr è piuttosto complicato, il risultato dipende da vari fattori: la qualità della scansione, il tipo e la dimensione del font, la formattazione della pagina…In molti casi sarà comunque necessaria la revisione del documento.

 

© 2008 Ziogeek.com

Tag: ,