en fr Contribution to knowledge extraction from biological data Contributions à lextraction de connaissances à partir de données biologiques Reportar como inadecuado




en fr Contribution to knowledge extraction from biological data Contributions à lextraction de connaissances à partir de données biologiques - Descarga este documento en PDF. Documentación en PDF para descargar gratis. Disponible también para leer online.

1 ORPAILLEUR - Knowledge representation, reasonning Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery

Abstract : One challenge for scientists consists in optimally exploiting the data stored in numerous public resources. This challenge is especially crucial in life sciences regarding the extraordinary multiplicity and heterogeneity of biological data. Our aim is to assist biologists for analysing such data and efficiently extract useful knowledge for solving problems such as charaterizing genes responsible for a disease or understanding drug-side-effect profiles. Our contribution can be summarised with respect to the three key steps of the Knowledge Discovery from Databases KDD process : 1 resource discovery and model-driven data integration, 2 relational data mining deployment based on inductive logic programming for extracting explicit rules in first-order logic, and 3 contribution to the interpretation of the mining results thanks to inductive batabases principles. We could show on real world problems how the third point facilitates further iterations of the KDD process.

Résumé : La maîtrise et l-exploitation des données biologiques constituent un enjeu majeur de la biologie contemporaine. En effet, les techniques à haut débit ont conduit à une multiplication de bases de données qui servent à structurer et à entreposer les résultats des expériences mais aussi de programmes chargés de traiter ces données et d-en produire des nouvelles. Ces gisements de données sont disponibles au plus grand nombre et les biologistes ont d-énormes espoirs quant à l’extraction de connaissances qui leur permettront de résoudre divers problèmes tels que l-identification de gènes responsables de maladies ou la caractérisation de médicaments du point de vue de leurs effets indésirables. Je propose des solutions méthodologiques et pragmatiques afin de faciliter cette analyse réputée difficile en raison de l’hétérogénéité des données. Ces solutions s’appuient sur le processus itératif d-Extraction de Connaissances à partir de Données ECD avec deux contraintes : l-exploitation des connaissances du domaine et la fouille de données relationnelles. Nos contributions peuvent être résumées selon les trois étapes de l’ECD : 1 Découverte de ressources et intégration de données dirigée par un modèle de domaine, 2 Fouille de données complexes pour découvrir notamment des règles grâce à la programmation logique inductive, 3 Aide à l-interprétation des modèles trouvés en permettant la structuration et la persistance des résultats de la fouille. Le dernier point est cohérent avec le cadre conceptuel des bases de données inductives et nous avons montré comment, sur des problèmes du monde réel, cela facilite les itérations du processus d-ECD

en fr

Keywords : Inductive Logic Programming Inductive databases bioinformatics knowledge extraction from databases

Mots-clés : Extraction de connaissances à partir de données Programmation Logique Inductive bioinformatique





Autor: Malika Smaïl-Tabbone -

Fuente: https://hal.archives-ouvertes.fr/



DESCARGAR PDF




Documentos relacionados