Estimation and Selection for the Latent Block Model on Categorical DataReportar como inadecuado




Estimation and Selection for the Latent Block Model on Categorical Data - Descarga este documento en PDF. Documentación en PDF para descargar gratis. Disponible también para leer online.

* Corresponding author 1 LM-Orsay - Laboratoire de Mathématiques d-Orsay 2 SELECT - Model selection in statistical learning Inria Saclay - Ile de France, LMO - Laboratoire de Mathématiques d-Orsay, CNRS - Centre National de la Recherche Scientifique : UMR 3 Heudiasyc - Heuristique et Diagnostic des Systèmes Complexes Compiègne

Abstract : This paper is dealing with estimation and model selection in the Latent Block Model LBM for categorical data. First, after providing sufficient conditions ensuring the identifiability of this model, it generalises estimation procedures and model selection criteria derived for binary data. Secondly, it develops Bayesian inference through Gibbs sampling. And, with a well calibrated non informative prior distribution, Bayesian estimation is proved to avoid the traps encountered by the LBM with the maximum likelihood methodology. Then model selection criteria are presented. In particular an exact expression of the ICL criterion requiring no asymptotic approximation is derived. Finally numerical experiments on both simulated and real data sets highlight the interest of the proposed estimation and model selection procedures.

Résumé : Cet article traite de l-estimation et de la sélection pour le modèle des blocs latents LBM avec données catégorielles. Nous commençons par donner des conditions suffisantes pour obtenir l-identifiabilité de ce modèle. Nous généralisons les procédures d-estimation et les critères de sélection obtenus dans le cadre binaire. Nous considérons l-inférence bayésienne à travers l-échantillonneur de Gibbs couplé avec une approche variationnelle~: avec une distribution a priori non informative correctement calibrée, ces algorithmes évitent mieux les extrema locaux que la méthodologie fréquentiste. Nous présentons des critères de sélection de modèle et nous donnons une forme exacte non asymptotique pour le critère ICL. Les résultats obtenus sur des données simulées et réelles illustrent l-intérêt de notre procédure d-estimation et de sélection de modèle.

Keywords : EM algorithm Variational Approximation Stochastic EM Bayesian Inference Gibbs Sampling BIC Criterion Integrated Completed Likelihood





Autor: Christine Keribin - Vincent Brault - Gilles Celeux - Gérard Govaert -

Fuente: https://hal.archives-ouvertes.fr/



DESCARGAR PDF




Documentos relacionados