Le Web : une source dinformation pour lintégration de multi-termes dans un processus de Recherche dInformationReportar como inadecuado




Le Web : une source dinformation pour lintégration de multi-termes dans un processus de Recherche dInformation - Descarga este documento en PDF. Documentación en PDF para descargar gratis. Disponible también para leer online.

1 CLIPS - IMAG - Communication Langagière et Interaction Personne-Système 2 CLIPS-IMAG - Equipe GEOD, Groupe d-étude sur l-oral et le dialogue

Abstract : Web is a rich and diversified source of information. In this article, we propose to benefit from this richness to collect and analyze documents, with the aim of a relational indexation based on noun phrases. Proposed data processing chain includes a spider collecting data to build textual corpora, and a linguistic module analyzing text to extract information. Comparison of obtained corpus with corpus from Amaryllis conference shows the linguistic diversity of collected corpora, and particularly the richness of extracted noun phrases.





Autor: Mohamed Hatem Haddad - Mathias Géry - Dominique Vaufreydaz -

Fuente: https://hal.archives-ouvertes.fr/



DESCARGAR PDF




Documentos relacionados