Analizador morfológico de la lengua quechua basado en software libre helsinkifinite-statetransducer (hfst)
Date
2013-10
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Inca Garcilaso de la Vega
Abstract
En esta investigación, se presenta la creación de un analizador morfológico para la lengua quechua basado en software libre Helsinki Finite-StateTransducer (HFST). La tecnología HFST un transductor de estado finito ha sido usado como analizador morfológico en los idiomas del lado europeo: Inglés, Finlandés, Francés, Alemán, Italiano, Sueco, Turco, entre otros. Por otro lado, quechua es una lengua aglutinante, diferente a las lenguas europeas, por lo que en esta investigación se experimenta la adaptación de la tecnología HFST como herramienta de análisis morfológico, la misma que será un módulo y parte del sistema de traducción automática entre español y quechua en la plataforma Apertium. Para el experimento, se elige el Quechua del Este de Apurímac (qve), creando un diccionario
LEXC compatible con HFST, definiendo lexicones para cada categoría gramatical, lexicones para cada sufijo, insertando más de 2000 palabras, entre raíces, adjetivos, verbos, adverbios y otras categorías gramaticales. Se compila el diccionario monolingüe del quechua tanto para el analizador morfológico como para su generación de palabras. Finalmente, como resultado se tiene el analizador morfológico (qve), se realiza las pruebas con entradas de palabras aglutinadas, teniendo como salida la palabra raíz y una serie de <etiquetas> que representan categorías gramaticales de los sufijos que lo acompañan.
Description
Presentación que se llevó a cabo durante el V Congreso Internacional de Computación y Telecomunicaciones COMTEL 2013 del 22 al 25 de octubre de 2013 en Lima, Perú. COMTEL, es un certamen organizado por la Facultad de Ingeniería de Sistemas, Cómputo y Telecomunicaciones de la Universidad Inca Garcilaso de la Vega, que congrega a profesionales, investigadores y estudiantes de diversos países con el fin de difundir e intercambiar conocimientos, mostrar experiencias académicas-científicas y soluciones para empresas en las áreas de Computación, Telecomunicaciones y disciplinas afines.
Keywords
Ingeniería de Sistemas, Computación, Ingeniería de programas informáticos, Programas de computadora, Lengua Quechua, Análisis morfológico, Quechua, HFST, Traductor automático, Software libre, Computer sciences, Communication engineering and systems, Morphological analysis, Machine translator, Free software