Modélisation du prétraitement des textesReportar como inadecuado




Modélisation du prétraitement des textes - Descarga este documento en PDF. Documentación en PDF para descargar gratis. Disponible también para leer online.

1 LRI - Laboratoire de Recherche en Informatique 2 TANC - Algorithmic number theory for cryptology LIX - Laboratoire d-informatique de l-École polytechnique Palaiseau, Inria Saclay - Ile de France, Polytechnique - X, CNRS - Centre National de la Recherche Scientifique : UMR7161

Résumé : Dans cet article, nous définissons un modèle pour l-étape de prétraitement des textes dans le cadre de la fouille de textes et plus généralement de l-extraction d-informations à partir de textes. Cet article ne contient pas les détails de l-implémentation. L-objectif est d-obtenir un modèle générique de normalisation des textes bruts. La motivation de cet article est de généraliser les travaux assez confidentiels et spécialisés qui existent pour cette étape de prétraitement. Cette étape est pourtant incontournable et d-elle dépend grandement la qualité des analyses obtenues à toutes les étapes ultérieures.





Autor: Thomas Heitz -

Fuente: https://hal.archives-ouvertes.fr/



DESCARGAR PDF




Documentos relacionados