OCR

Les OCR sont ceux de la reconnaissance optique de caractères ou également connus en espagnol sous le nom de reconnaissance optique de caractères . OCR est un logiciel qui permet la reconnaissance de texte, en produisant une image pour la transformer en une succession de caractères, puis les enregistrer dans un format donné, qui peut être utilisé dans ces programmes d'édition de texte. En d'autres termes, grâce à cette nouvelle technologie, tout type de texte ou de document, qui comprend des fichiers PDF, des papiers numérisés ou même des images prises à partir d'appareils photo numériques, peut être converti en données afin qu'il ait la possibilité d'être édité.

OCR

Ce logiciel fonctionne comme suit, analysez d'abord chaque partie de l'image du document en question ; distribue la page en morceaux tels que tableaux, images, blocs de texte, entre autres; puis les lignes sont réparties en mots pour devenir plus tard des personnages; et comme les caractères ont déjà été signalés, le logiciel fait la comparaison avec un groupe d'images du motif. Cela progresse selon la série d'hypothèses sur ce qu'est chaque personnage ; et à partir de ces hypothèses, il analyse les différentes variantes des sauts de ligne dans les mots et des mots dans les caractères. Et c'est après un grand nombre d'analyses et de traitements d'hypothèses que le programme présente enfin le texte déjà reconnu et transformé dans un nouveau format .

Il convient de noter qu'aujourd'hui, le marché de l'informatique propose un certain nombre de programmes basés sur l'OCR tels que OmniPage, Abbyy Fine Reader ou READiris . YY qu'ils ont la capacité, non seulement d'analyser et de reconnaître un texte en tant que tel, mais également de reconnaître le format et le style, mais avec certaines limitations, nécessitant ainsi que le texte, après avoir été analysé, soit édité pour effectuer les ajustements requis. exiger.

Recommandé

Hispanoamérica
2020
La tension
2020
Réalité sociale
2020