Quel balisage du roman contemporainReportar como inadecuado




Quel balisage du roman contemporain - Descarga este documento en PDF. Documentación en PDF para descargar gratis. Disponible también para leer online.

1 MoDyCo - Modèles, Dynamiques, Corpus

Résumé : Travaillant depuis plusieurs années sur des romans contemporains annotés selon la philosophie XML-TEI, dans une perspective de caractérisation linguistique de sous-familles narratologiques du roman dit -sérieux-, je souhaite dégager les apports ainsi que les problèmes rencontrés dans cette méthodologie d-enrichissement du texte narratif, dans l-optique d-une réflexion collective sur l-enrichissement des balises TEI et le développement d-outils d-interrogation conviviaux. Je laisserai de côté les aspects juridiques liés au roman contemporain pour me centrer sur les progrès à accomplir concernant les points suivants :- 1- définition des unités textuelles et enrichissement des balises: a balisage de la structure -logique- du document, et des marques graphiques des polices. Mise à disposition d-une interface conviviale pour le balisage semi-automatique: headers prédéfinis minimaux, ce qui peut être automatisé : sémantiques de l-italique, balisage des séquences de discours direct etc.b balisage des séquences non graphiquement marquées : dans une perspective narratologique, nous avons élaboré des balises portant sur : niveaux de diégèse, type de narrateur, passages en 1S ou 3S, séquences de dialogues, de discours rapportés, descriptions, points de vue, psycho-récit, didascalies. Il s-agit donc d-établir des normes collectives d-écriture des balises concernant ces dimensions de description.- 2 - La caractérisation linguistique des différentes séquences implique de plus l-intégration des sorties d-analyseurs dans le texte balisé travail déjà avancé dans le projet BMF ou les travaux de S. Loiseau sur les textes philosophiques.- 3 - Le développement d-outils conviviaux pour l-interrogation : Le chercheur doit pouvoir caractériser la structure de l-arborescence du document nombre de niveaux, régularité de la structure, surfaces occupées par les différents niveaux et séquences; il doit pouvoir étudier les variations de certaines catégories tel lemme, telle catégorie morpho-syntaxique, tel patron syntaxique, telle liste de lemmes non seulement selon les sous-ensembles du corpus ou selon les parties pré-balisées du texte, mais aussi selon des balisages autres répondant à ses préoccupations en cours ex : séquences de discours direct, de discours rapportés, introductions, conclusions, dernier ou premier § d-un texte, etc. D-autre part, il faut pouvoir travailler aussi bien sur le texte contenu dans les balises, que sur les balises elles-mêmes et leurs propriétés topologiques. Il faut pouvoir disposer des positions absolues des balises dans le texte source, quelle que soit la richesse du balisage et pouvoir effectuer des calculs de cooccurrence, de distance etc.- fréquences de telles balises selon les parties du texte; fréquence de contiguïté de deux balises; types d-ordre d-occurrence de balises contiguës- niveaux de densité de tel ensemble de balises- rythmes d-apparition de tel patron syntaxique, de succession de tels patrons ou de telle succession de balises selon les parties du texte.Il faut donc prévoir de mettre à disposition du chercheur des calculs prototypiques de variables qui laissent le choix du type de contexte pris en compte et défini par les balises, des types de balises et de certains traits topologiques distance, ordre, succession, densité etc.Les aspects d-interfaces à développer concernant la visualisation globale de ces phénomènes sur le texte ou le corpus ne seront pas abordés ici.

en fr

Keywords : novels corpus linguistics

Mots-clés : TEI-XML balisage roman linguistique de corpus





Autor: Denise Malrieu -

Fuente: https://hal.archives-ouvertes.fr/



DESCARGAR PDF




Documentos relacionados