IRISA at DeFT 2015: Supervised and Unsupervised Methods in Sentiment AnalysisReportar como inadecuado




IRISA at DeFT 2015: Supervised and Unsupervised Methods in Sentiment Analysis - Descarga este documento en PDF. Documentación en PDF para descargar gratis. Disponible también para leer online.

1 LinkMedia - Creating and exploiting explicit links between multimedia fragments Inria Rennes – Bretagne Atlantique , IRISA-D6 - MEDIA ET INTERACTIONS

Abstract : In this work, we present the participation of IRISA Linkmedia team at DeFT 2015. The team participated in two tasks: i valence classification of tweets and ii fine-grained classification of tweets which includes two sub-tasks: detection of the generic class of the information expressed in a tweet and detection of the specific class of the opinion-sentiment-emo-tion. For all three problems, we adopt a standard machine learning framework. More precisely, three main methods are proposed and their feasibility for the tasks is analyzed: i decision trees with boosting bonzaiboost, ii Naive Bayes with Okapi and iii Convolutional Neural Networks CNNs. Our approaches are voluntarily knowledge free and text-based only, we do not exploit external resources lexicons, corpora or tweet metadata. It allows us to evaluate the interest of each method and of traditional bag-of-words representations vs. word embeddings. Mots-clés : Fouille d-opinion, apprentissage artificiel, boosting, apprentissage bayésien, plongement de mots.

Résumé : Cet article décrit la participation de l-équipe LinkMedia de l-IRISA à DeFT 2015. Notre équipe particpé à deux tâches : la classification en valence des tweets tâche 1 et la classification à grain fin, elle même, décomposée en deux sous-tâches, à savoir la détection des classes génériques de l-information exprimée dans un tweet tâche 2.1 et la classification des classes spécifiques tâches 2.2 de l-émotion-sentiment-opinion exprimée. Pour ces trois tâches, nous adoptons une démarche d-apprentissage artificiel. Plus précisément, nous explorons l-intér de trois méthodes : i le boosting d-arbres de décision, ii l-apprentissage bayésien utilisant une technique issue de la recherche d-information, et iii les réseaux neuronnaux convolutionnels. Nos approches n-exploitent aucune ressource externe lexiques, corpus et sont uniquement fondées sur le contenu textuel des tweets. Cela nous permet d-évaluer l-intérêt de chacune de ces méthodes, mais aussi des représentations qu-elles exploitent, à savoir les sacs-de-mots pour les deux premières et le plongement de mots word embedding pour les réseaux neuronaux.

Keywords : Opinion mining machine learning boosting Bayesian learning word embedding





Autor: Vedran Vukotic - Vincent Claveau - Christian Raymond -

Fuente: https://hal.archives-ouvertes.fr/



DESCARGAR PDF




Documentos relacionados