Contribution à la segmentation de textes manuscrits anciensReportar como inadecuado




Contribution à la segmentation de textes manuscrits anciens - Descarga este documento en PDF. Documentación en PDF para descargar gratis. Disponible también para leer online.



Résumé : Dans cet article, nous présentons une méthode de segmentation en lignes de textes manuscrits arabes. Les documents traités sont issus dans leur grande majorité de textes manuscrits anciens numérisés et stockés dans des bases documentaires. La diversité des styles des écritures utilisés, ainsi que les différentes présentations des textes montrent que la retroconversion de ces documents reste un défi majeur pour la prochaine décennie. Nous pensons qu-il faut plusieurs stratégies de segmentation pour arriver à extraire toutes les lignes de texte de tels documents. La méthode proposée (en cours de développement) s-adresse à des textes manuscrits anciens comme ceux de la figure 1. L-approche utilisée segmente souvent une page de document en trois types de blocs de texte : les petits blocs représentent généralement les symboles diacritiques ; les blocs moyens correspondent au corps du texte et les grands blocs reflètent le chevauchement entre mots des lignes voisines. La segmentation des grands blocs ainsi que l-appariement entre tous les blocs générés permet de trouver les lignes de texte. Les premiers résultats obtenus dans le stade actuel de la méthode sur une dizaine de textes manuscrits sont encourageants.

Mots-clés : Semaine du Document Numérique (SDN 2004). Conférence Internationale Francophone sur l-Ecrit et le Document (CIFED 04). Ecriture manuscrite Segmentation en ligne classification automatique K-means





Autor: Abderrazak Zahour Bruno Taconet Saïd Ramdane

Fuente: https://hal.archives-ouvertes.fr/



DESCARGAR PDF




Documentos relacionados