Aggiungo che per i professionisti della traduzione sapere come funzionano i programmi di riconoscimento dei caratteri è fondamentale per poter essere più competitivi.
Una rapida occhiata alla pagina di Wikipedia in inglese dedicata all’argomento rivela che esistono un gran numero di programmi per il riconoscimento ottico dei caratteri.
Se hai appena acquistato uno scanner, è probabile che includesse anche un semplice programma di OCR.
Sul mercato esistono infatti sia soluzioni a pagamento, come Abbyy FineReader, Microsoft Office Document Imaging, OmniPage e Readiris, sia applicazioni gratuite, come CuneiForm, GOCR e Tesseract.
Fatte salve naturalmente le peculiarità di ognuno di essi, che non analizzeremo in dettaglio, tutti hanno almeno tre caratteristiche in comune:
- riconoscono il testo, le immagini e le tabelle presenti in un’immagine o in un PDF;
- sono compatibili con varie lingue, compresi linguaggi artificiali, come l’esperanto, e i linguaggi di programmazione;
- permettono di esportare e salvare il testo in vari formati editabili.
L’impiego di un programma di OCR nel nostro settore ha diverse applicazioni pratiche.
Innanzitutto serve a ridurre le dimensioni di un file, visto che le scansioni e i PDF tendono a essere più pesanti del corrispondente file di testo, il che si traduce in allegati di e-mail più leggeri e in una comunicazione più snella. Inoltre permette di utilizzare le funzioni degli elaboratori di testo, come il controllo dell’ortografia e la ricerca e sostituzione, in maniera più agile, e più specificamente è l’unico modo per disporre di un conteggio parole esatto, allineare documentazione bilingue, e utilizzare uno strumento CAT durante la traduzione.
Abbyy FineReader anche secondo me è la soluzione migliore, da una parte per l’ottimo rapporto qualità-prezzo, dall’altra per la sua versatilità.
Infatti è capace di lavorare con molti tipi di immagine, riconosce automaticamente la lingua del testo che sta analizzando, ed è probabile che possa anche controllarne l’ortografia grazie ai 38 dizionari che ha a disposizione e per il salvataggio finale, oltre a supportare tutti i formati di Office, RTF, HTML, ecc. è possibile anche copiare il testo riconosciuto negli appunti per poterlo incollare in qualsiasi programma.
Tra le funzioni avanzate del programma, ricordiamo la possibilità di salvare modelli di area da applicare a vari documenti simili e ripetitivi che altrimenti richiederebbero un intervento manuale dell’utente. Inoltre dalla versione 9 comprende anche la funzione screenshot reader, che permette di selezionare qualsiasi area dello schermo e di riconoscerla istantaneamente.