Chapitre 9 - reconnaissance des documents, Introduction, Hapitre – I.R.I.S. Readiris Pro 12 for Windows User Guide Manuel d'utilisation
Page 59: Econnaissance des documents

Readiris
TM
Pro 12 – Guide utilisateur
53
C
HAPITRE
9
R
ECONNAISSANCE DES
DOCUMENTS
I
NTRODUCTION
Pour reconnaître des documents, Readiris applique une analyse
linguistique au cours de l'étape de reconnaissance. En conséquence,
il reconnaît du texte, des tableaux, des images, des codes à barres et
du texte manuscrit dans tous les types de documents. Readiris traite
même les documents disposés en colonnes complexes ou de piètre
qualité, des télécopies, des impressions matricielles, des documents
mal numérisés ou copiés contenant des caractères trop clairs ou trop
foncés, etc.
Readiris prend en charge 128 langues
: toutes les langues
d’Amérique et d’Europe, y compris les langues d’Europe centrale,
les langues baltes, le grec, le turc et le cyrillique. Grâce à des
modules complémentaires, Readiris peut lire des documents en
arabe, persan et hébreu et dans quatre langues asiatiques, à savoir le
japonais, le coréen, le chinois simplifié et le chinois traditionnel.
Readiris peut même traiter des alphabets mélangés : le logiciel
détecte les mots « occidentaux » qui ressortent des documents en
grec, en cyrillique, en langue asiatique, en hébreu et en arabe
puisque beaucoup de noms propres intranscriptibles, des noms de
marques etc., sont écrits à l’aide des symboles occidentaux.
Readiris repose sur les technologies de reconnaissance les plus
évoluées. La reconnaissance du texte indépendante de la police est
complétée par des techniques d’auto-apprentissage. Le système est