Categoria: Programmi

Come funzionano i programmi OCR

Una classe particolare di programmi viene classificata come OCR, dove i tre caratteri stanno per Optical Character Recognition.

Questi programmi si occupano della simulazione dell’atto della lettura (e parliamo di simulazione perché anche l’analisi semantica, effettuabile da computer particolarmente avanzati, non è in grado di compiere un vero atto di lettura nel senso umano del termine.

Il risultato fornito da questi programmi OCR è la trasformazione di un’immagine fissa (questo è per un computer la scansione di un testo scritto) in una serie di parole e caratteri modificabili ad esempio tramite un normale editor.

Il principio su cui si basano questi programmi è quello del “Pattern Recognition” ovvero del riconoscimento formale.

La prima operazione che viene eseguita è la separazione dei caratteri dal rumore di fondo, ovvero tutti quei segni, disegni, immagini e macchie varie che popolano abitualmente il foglio stampato e che non hanno nulla a che vedere con la scrittura da riconoscere.

Successivamente la forma recuperata viene paragonata con quelle contenute in un database dedicato, operazione che fornisce come risultato una probabilità di somiglianza tra ciò che viene letto dal programma OCR e le lettere contenute nel database in questione. Quando la possibilità di riconoscimento formale supera una determinata soglia, il riconoscimento viene considerato effettivo.

Questa operazione viene ripetuta su tutte le forme candidate per il riconoscimento. Il risultato finale viene sottoposto all’operatore umano che provvederà all’eventuale modifica o stampa.

Alcuni programmi OCR particolarmente evoluti impiegano anche una successiva fase di analisi semantica per aumentare la probabilità di riconoscimento delle parole, implementano sostanzialmente un meccanismo di analisi che suggerisce quale parole possa essere più probabilmente utilizzata in un determinato punto di una frase.

Per quanto quasi invisibili i programmi OCR sono molto diffusi, specialmente come tramite per altri programmi (ad esempio quelli di sintesi vocale) o programmi gestionali in uso ad esempio presso diverse amministrazioni.

Navigation