Building an Anglo-Spanish translation lexicon for proper names form the WebReport as inadecuate




Building an Anglo-Spanish translation lexicon for proper names form the Web - Download this document for free, or read online. Document in PDF available to download.

Advisors: Gaizauskas, RobertBlasco Alís, Jorge

Contributor: University of Sheffield

Department-Institute: Universidad Carlos III de Madrid. Departamento de Informática

Degree: Ingeniería en Informática

Issued date: 2010-01-18

Defense date: 2010-06-09

Keywords: Lingüística computacional , Ingeniería del conocimiento , Recuperación de la información , Diccionarios electrónicos

Rights: Atribución-NoComercial-SinDerivadas 3.0 España

Abstract: 

The use of electronic dictionaries is common in tasks like Cross Language Information Retrieval CLIR and Machine Translation MT. There are many electronic dictionaries, but they do not include proper names. Furthermore, new names appear every day. Since naThe use of electronic dictionaries is common in tasks like Cross Language Information Retrieval CLIR and Machine Translation MT. There are many electronic dictionaries, but they do not include proper names. Furthermore, new names appear every day. Since names are an essential part in CLIR queries and in language in general, there is a need for a means to translate them from one language to another. The aim of this project has been to construct a translation lexicon for proper names obtaining the data from translated texts from the Web. Ideally, this lexicon would update continuously from the Web’s growing resources. This report contains a literature research and an analysis of the findings which has finally led to the design and development of a system that constructs a translation lexicon for proper names, from comparable news articles in English and Spanish downloaded from the Web. The lexicon contains almost 10,000 named entities recovered from more than 27,000 pairs of articles. It has the capability of updating its contents from new articles appearing every day on the Web. +- 

El uso de diccionarios electrónicos es una tarea común en sistemas de búsqueda translingüe delinglés Cross Language Information Retrieval CLIR y traducción automática TA. Existen muchosdiccionarios electrónicos, pero estos no incluyen nombres de entidaEl uso de diccionarios electrónicos es una tarea común en sistemas de búsqueda translingüe delinglés Cross Language Information Retrieval CLIR y traducción automática TA. Existen muchosdiccionarios electrónicos, pero estos no incluyen nombres de entidades. Además cada día aparecennuevos nombres. Dado que los nombres son una parte esencial en las búsquedas translingües y en ellenguaje en general es necesario buscar una forma de traducirlos de un idioma a otro. El objetivo deeste proyecto es construir un lexicón de nombres de entidades obteniendo los datos en textostraducidos publicados en la Web. En el caso perfecto el lexicón se actualizará constantementeutilizando los recursos en continuo crecimiento de la Web. Este documento es un resumen en español del proyecto original en inglés que contiene unestudio de campo que ha llevado al diseño e implementación de un sistema que construye unlexicón de nombres propios, utilizando artículos de noticias escritos en inglés y español ydescargados de la Web. El lexicón contiene más de 10000 nombres obtenidos en más de 27000parejas de artículos. El sistema tiene la capacidad de actualizar el contenido del lexicón utilizando losnuevos artículos que se publican cada día.+- 







Author: Lyubomirov Pavlov, Iván

Source: http://e-archivo.uc3m.es


Teaser



Universidad Carlos III de Madrid Repositorio institucional e-Archivo http:--e-archivo.uc3m.es Trabajos académicos Proyectos Fin de Carrera 2010-01-18 Building an Anglo-Spanish translation lexicon for proper names form the Web Lyubomirov Pavlov, Iván http:--hdl.handle.net-10016-11289 Descargado de e-Archivo, repositorio institucional de la Universidad Carlos III de Madrid Building an Anglo-Spanish Translation Lexicon for Proper Names form the Web Ivan Lyubomirov Pavlov Supervisor: Dr.
Robert Gaizauskas COM3010 November 2009 – January 2010 ¡Error! Utilice la ficha Inicio para aplicar Heading 1 al texto que desea que aparezca aquí. i Signed Declaration All sentences or passages quoted in this dissertation from other peoples work have been specifically acknowledged by clear cross-referencing to author, work and page(s). Any illustrations which are not the work of the author of this dissertation have been used with the explicit permission of the originator (where possible) and are specifically acknowledged.
I understand that failure to do this amounts to plagiarism and will be considered grounds for failure in this dissertation and the degree examination as a whole. Name: Ivan Lyubomirov Pavlov Signature: Date: 18-01-2010 i ¡Error! Utilice la ficha Inicio para aplicar Heading 1 al texto que desea que aparezca aquí. ii Abstract The use of electronic dictionaries is common in tasks like Cross Language Information Retrieval (CLIR) and Machine Translation (MT).
There are many electronic dictionaries, but they do not include proper names.
Furthermore, new names appear every day.
Since names are an essential part in CLIR queries and in language in general, there is a need for a means to translate them from one language to another. The aim of this project has been to construct a translation lexicon for proper names obtaining the data from translated texts from the Web.
Ideally, this lexicon would update continuously from the Web’s growing resources....





Related documents