Coopération de méthodes statistiques et symboliques pour ladaptation non-supervisée dun système détiquetage en entités nomméesReportar como inadecuado




Coopération de méthodes statistiques et symboliques pour ladaptation non-supervisée dun système détiquetage en entités nommées - Descarga este documento en PDF. Documentación en PDF para descargar gratis. Disponible también para leer online.

1 LIF - Laboratoire d-informatique Fondamentale de Marseille - UMR 6166 2 ALPAGE - Analyse Linguistique Profonde à Grande Echelle ; Large-scale deep linguistic processing Inria Paris-Rocquencourt, UPD7 - Université Paris Diderot - Paris 7 3 Medialab AFP - Medialab AFP

Abstract : Named entity recognition and typing is achieved both by symbolic and probabilistic systems.
We report on an experiment for making the rule-based system NP, a high-precision system developed on AFP news corpora and relies on the Aleda named entity database, interact with LIANE, a high-recall probabilistic system trained on oral transcriptions from the ESTER corpus.
We show that a probabilistic system such as LIANE can be adapted to a new type of corpus in a non-supervized way thanks to large-scale corpora automatically annotated by NP.
This adaptation does not require any additional manual anotation and illustrates the complementarity between numeric and symbolic techniques for tackling linguistic tasks.


Résumé : La détection et le typage des entités nommées sont des tâches pour lesquelles ont étéd éveloppés à la fois des systèmes symboliques et probabilistes.
Nous présentons les résultats d-une expérience visant à faire interagir le système à base de règles NP, développé sur des corpus provenant de l-AFP, intégrant la base d-entités Aleda et qui a une bonne précision, et le système LIANE, entraîné sur des transcriptions de l-oral provenant du corpus ESTER et qui a un bon rappel.
Nous montrons qu-on peut adapter à un nouveau type de corpus, de manière non supervisée, un système probabiliste tel que LIANE grâce à des corpus volumineux annotés automatiquement par NP.
Cette adaptation ne nécessite aucune annotation manuelle supplémentaire et illustre la complémentarité des méthodes numériques et symboliques pour la résolution de tâches linguistiques.


Keywords : Named entity recognition domain adaptation cooperation between probabilistic and symbolic approaches





Autor: Frédéric Béchet - Benoît Sagot - Rosa Stern -

Fuente: https://hal.archives-ouvertes.fr/



DESCARGAR PDF




Documentos relacionados