Pattern Mining in Numerical Data: Extracting Closed Patterns and their GeneratorsReportar como inadecuado




Pattern Mining in Numerical Data: Extracting Closed Patterns and their Generators - Descarga este documento en PDF. Documentación en PDF para descargar gratis. Disponible también para leer online.

* Corresponding author 1 ORPAILLEUR - Knowledge representation, reasonning INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications 2 Department of Applied Mathematics - State University Higher School of Economics

Abstract : In this paper we study the extraction of closed patterns associated to their generators in numerical data. Many works have addressed the problem of extracting itemsets for generating association rules. Considering numerical data, an appropriate discretization is most of the time necessary, in order to split attribute ranges into intervals maximizing some interest functions, e.g. support, confidence, or other statistical measures. We investigate here an alternative point of view using pattern structures in Formal Concept Analysis. Pattern structures can be efficiently used to extract closed patterns without any prior discretization. Two original and efficient algorithms for characterizing frequent closed patterns and their generators in numerical data are proposed and experimented. Finally, we conclude showing the usefulness of such patterns in classification problems and privacy preserving data-mining.

Résumé : Dans cet article, nous étudions l-extraction de motifs fermés et leurs générateurs à partir de données numériques. De nombreux travaux s-intéressent à l-extraction de motifs pour la génération de règles d-association dans le cadre de la découverte de connaissances. Concernant les données numériques, une étape de discrétisation est généralement nécessaire, afin de découper les domaines des attributs en un certain nombre d-intervalles, maximisant certaines fonctions d-intérêt, comme le support ou la confiance. Nous proposons ici une méthode alternative se basant sur la notion de structures de patrons définies dans le cadre de l-analyse formelle de concepts FCA. Les structures de patrons peuvent être efficacement utilisées pour extraire des motifs fermés à partir de données numériques sans discrétisation préalable des données. Nous proposons alors deux algorithme originaux et efficaces pour caractériser et extraire les motifs fermés et générateurs dans les données numériques. Nous concluons sur l-utilité de tels motifs pour des tâches de classification, mais aussi d-anonymisation de données.

Keywords : formal concept analysis pattern mining numerical data





Autor: Mehdi Kaytoue - Sergei O. Kuznetsov - Amedeo Napoli -

Fuente: https://hal.archives-ouvertes.fr/



DESCARGAR PDF




Documentos relacionados