Concepts

L'OCR et la reconnaissance de documents

L'OCR transforme l'image d'un document scanné en texte exploitable : on peut alors le rechercher, en extraire des informations et le classer automatiquement.

Définition

L'OCR (reconnaissance optique de caractères) lit le texte présent sur l'image d'un document scanné et le convertit en texte réellement exploitable par l'ordinateur. Sans OCR, un scan n'est qu'une photo ; avec OCR, c'est un document interrogeable.

L'image à retenir

Avant l'OCR, un scan est une photo de page : illisible pour la machine. Après l'OCR, c'est comme si quelqu'un avait retapé tout le texte — recherchable, copiable, analysable.

Ce que l'OCR permet

Cas d'usage

Comptabilité

Lecture automatique des factures

L'OCR extrait fournisseur, montant et date ; la facture se classe presque toute seule.

Archives

Numérisation d'un fonds papier

Des cartons d'archives deviennent une base recherchable, sans ressaisie manuelle.