Text segmentation by language Reportar como inadecuado




Text segmentation by language - Descarga este documento en PDF. Documentación en PDF para descargar gratis. Disponible también para leer online.

Sistemas & Telemática 2016, 14 38

Autor: Robin Cabeza Ruiz

Fuente: http://www.redalyc.org/articulo.oa?id=411547493004


Introducción



Sistemas & Telemática ISSN: 1692-5238 EditorSyT@icesi.edu.co Universidad ICESI Colombia Cabeza Ruiz, Robin Text segmentation by language Sistemas & Telemática, vol.
14, núm.
38, 2016, pp.
63-72 Universidad ICESI Cali, Colombia Available in: http:--www.redalyc.org-articulo.oa?id=411547493004 How to cite Complete issue More information about this article Journals homepage in redalyc.org Scientific Information System Network of Scientific Journals from Latin America, the Caribbean, Spain and Portugal Non-profit academic project, developed under the open access initiative Cabeza, R.
(2016).
Text segmentation by language.
Sistemas & Telemática, 14(38), 63-72 Original Research - Artículo Original - Tipo 1 Text segmentation by language Robin Cabeza Ruiz - druizolivero@gmail.com Universidad de Holguín, Cuba ABSTRACT There are two approaches for text segmentation by language: first, assuming that language changes happen in the “border” between sentences (never within a sentence); second, assuming that language changes can happen anyplace in the text.
This work presents methods for both types of text’s segmentation by languages.
On the first proposal, the text is initially segmented by sentence, then the language of each sentence is obtained; the second proposal is an adaptation of hidden Markov model to this task.
Both cases, according to results obtained in experimental proofs, exceed the state of art. KEYWORDS Hidden Markov model; text segmentation by language; natural language processing. Segmentación de textos por idioma Segmentação de textos por idioma RESUMEN La segmentación de textos por idioma puede ser RESUMO A segmentação de textos por idioma pode ser abor- abordada de dos maneras: la primera, asumiendo que los cambios de idioma solo ocurren en los saltos entre oraciones; y la segunda, asumiendo que el idioma puede cambiar en cualquier lugar del texto.
En este trabajo se presentan métodos para segmentar ambos tipos de textos por i...





Documentos relacionados