Análisis sintáctico multilingüe de textos


Productos software que contemplen algún tipo de procesamiento inteligente de la información textual. La base de tales procesos la constituye la información sintáctica obtenida de las oraciones de dicho texto.

Technology’s Protection Status

Actualmente, tres registros de software:

  • Compiler for parsing schemata (COMPAS), solicitud C-40-09, asiento registral 03/2009/445. Titulares: Universidade da Coruña (Carlos Gómez Rodríguez y Miguel A. Alonso Pardo)
  • Transition-based dependency parser with buffered transitions, solicitud OU-18-2014, asiento registral 03/2014/437. Titulares: Universidade de Vigo (Daniel Fernández González) y Universidade da Coruña (Carlos Gómez Rodríguez)
  • Transition-based dependency parser with dependency graphs, solicitud OU-19-2014, asiento registral 03/2014/442. Titulares: Universidade de Vigo (Daniel Fernández González) y Universidade da Coruña (Carlos Gómez Rodríguez)

What are we looking for?

Se buscan empresas interesadas en la licencia de esta tecnología.

Facultad de Filología

Description

La popularización de las tecnologías de la información e Internet ha dado lugar a un crecimiento sin precedentes en la escala en la que individuos e instituciones generan, comunican y acceden a la información. Sin embargo, precisamente debido a tan vasta disponibilidad de datos e información, su aprovechamiento efectivo constituye uno los problemas fundamentales de las sociedades modernas. Dado que la mayor parte de esta información en circulación está en forma de lenguaje humano escrito, las tecnologías de Procesamiento del Lenguaje Natural son un activo clave para este objetivo crucial y, dentro de ellas, una tarea fundamental la constituye la realización de un análisis sintáctico preciso para así poder extraer y analizar el significado de las oraciones. En este contexto, el Grupo LYS ha desarrollado herramientas de análisis precisas y veloces capaces de obtener dicha información sintáctica operando tanto en el marco de las dependencias sintácticas, más flexibles, como en el de los más diversos formalismos gramaticales basados en constituyentes.

Added Value

En el marco del análisis de constituyentes, proporcionamos un compilador capaz de generar automáticamente analizadores sintácticos eficientes a partir de los llamados esquemas de análisis sintáctico. Dichos esquemas son representaciones abstractas e intuitivas, en forma de sistemas deductivos, de los algoritmos de análisis a implementar. Su utilización nos permite abstraernos de los detalles de implementación así como definir y comparar fácilmente diferentes algoritmos entre sí. Nuestro sistema permite generar automáticamente, a partir de uno de estos esquemas, el código correspondiente a una implementación eficiente de dicho algoritmo. El sistema acepta todo tipo de esquemas de analizadores para gramáticas independientes del contexto y gramáticas de adjunción de árboles y se puede extender fácilmente a otros formalismos gramaticales.
Asimismo, tanto en el marco del análisis sintáctico de dependencias como el de constituyentes, el Grupo LYS está en condiciones de proporcionar analizadores sintácticos entrenables para cualquier idioma, los cuales están a la par o superan a aquellos analizadores que constituyen el state-of-the-art y que, por su superior velocidad, permiten su utilización con grandes volúmenes de datos.

Applications according to Sector

Los sistemas y técnicas de análisis sintáctico son clave en toda aplicación dedicada al procesamiento y análisis automático de textos en lenguaje natural. Su abanico de aplicaciones es muy diverso, yendo desde romper las barreras del idioma (traducción automática), encontrar la información requerida (motores de búsqueda, respuesta automática a preguntas) o analizar la opinión pública (extracción de opiniones), hasta digerir grandes cantidades de texto no estructurado en formas más convenientes (extracción de información, resumen automático) o incluso servir como soporte a chatbots y asistentes virtuales, entre otras aplicaciones.


ICT

Research Group

    • Lengua y Sociedad de la Información
    • (LYS)

Person in Charge

  • Carlos Gómez Rodríguez
  • Miguel Ángel Alonso Pardo
  • Mark David Anderson
  • Daniel Fernández González
  • Michalina Maria Strzyz
  • David Vilares Calvo

Contact Us

Last Update

2019-06-18