Análisis sintáctico multilingüe de textos


Productos de software que integren algún tipo de procesamiento inteligente de la información textual. La base de tales procesos estará constituida por la información sintáctica obtenida de las oraciones de dicho texto.

Estado de protección de la tecnología

Tres registros de software:

  • Compiler for parsing schemata (COMPAS), solicitud C-40-09, asiento registral 03/2009/445. Titulares: Universidad de A Coruña (Carlos Gómez Rodríguez y Miguel A. Alonso Pardo).
  • Transition-based dependency parser with buffered transitions, solicitud OU-18-2014, asiento registral 03/2014/437. Titulares: Universidad de Vigo (Daniel Fernández González) y Universidad de A Coruña (Carlos Gómez Rodríguez).
  • Transition-based dependency parser with dependency graphs, solicitud OU-19-2014, asiento registral 03/2014/442. Titulares: Universidad de Vigo (Daniel Fernández González) y Universidad de A Coruña (Carlos Gómez Rodríguez).

¿Qué buscamos?

Se buscan empresas interesadas en la licencia de esta tecnología.

Facultad de Filología. CITIC

Descripción

La popularización de las tecnologías de la información e internet ha dado lugar a un crecimiento sin precedentes en la escala en que individuos e instituciones generan información, la comunican y acceden a ella. Sin embargo, precisamente debido a tan vasta disponibilidad, el aprovechamiento efectivo de datos e información constituye uno de los problemas fundamentales de las sociedades modernas.

Dado que el formato de la mayor parte de esta información corresponde al lenguaje humano escrito, las tecnologías de procesamiento del lenguaje natural son un activo clave para alcanzar dicho objetivo. En su seno, una tarea fundamental la constituye la realización de un análisis sintáctico preciso para así poder extraer y analizar el significado de las oraciones.

En este contexto, el grupo LYS ha desarrollado herramientas de análisis precisas y veloces, capaces de obtener dicha información sintáctica operando tanto en el marco de las dependencias sintácticas, más flexibles, como en el de los más diversos formalismos gramaticales basados en constituyentes.

Valores añadidos

En el marco del análisis de constituyentes, proporcionamos un compilador capaz de generar de forma automática analizadores sintácticos eficientes a partir de los llamados esquemas de análisis sintáctico. Tales esquemas son representaciones abstractas e intuitivas, en forma de sistemas deductivos, de los algoritmos de análisis para implementar. Su uso nos permite abstraernos de los detalles de implementación, así como definir y comparar fácilmente diferentes algoritmos entre sí.

Nuestro sistema permite generar automáticamente, a partir de uno de estos esquemas, el código correspondiente a una implementación eficiente del algoritmo. El sistema acepta todo tipo de esquemas de analizadores para gramáticas independientes del contexto y gramáticas de adjunción de árboles, y se puede extender de modo fácil a otros formalismos gramaticales.

Asimismo, en el marco del análisis sintáctico tanto de dependencias como de constituyentes, el grupo LYS está en condiciones de proporcionar analizadores sintácticos entrenables para cualquier idioma, los cuales bien están a la par de aquellos que constituyen el estado del arte, bien los superan, y que, por su superior velocidad, pueden ser usados con grandes volúmenes de datos.

Aplicaciones por sector

Los sistemas y las técnicas de análisis sintáctico son clave en toda aplicación dedicada al procesamiento y al análisis automático de textos de lenguaje natural. Su abanico de aplicaciones es muy diverso: va desde romper las barreras del idioma (traducción automática) y encontrar la información requerida (motores de búsqueda, respuesta automática a preguntas) a analizar la opinión pública (extracción de opiniones), pasando por digerir grandes cantidades de texto no estructurado en formas más convenientes (extracción de información, resumen automático) o incluso servir como soporte a chatbots y asistentes virtuales, entre otras aplicaciones.


TIC

Grupo de investigación

    • Lengua y Sociedad de la Información
    • (LYS)

Responsable

  • Carlos Gómez Rodríguez
  • Miguel Ángel Alonso Pardo
  • Mark David Anderson
  • Daniel Fernández González
  • Michalina Maria Strzyz
  • David Vilares Calvo

Contacta con nosotros

Última actualización

2019-07-16