Minería de textos.

La minería de textos (también conocida como text mining o text analytics) es el campo que agrupa las técnicas para extracción de información estructurada o conocimiento a partir de textos. Estas técnicas permiten analizar de manera fácil y eficaz la información codificada presente en los conjuntos de textos (en ocasiones, de tipo big data), lo que facilita considerablemente los procesos de toma de decisiones. Este amplio campo recoge diversas tareas, como son la clasificación de textos, su agrupamiento, la extracción de entidades nombradas y de opiniones, el resumen de documentos y la recuperación de información. En la actualidad las tecnologías de minería de textos se emplean con gran éxito en respuesta a las diferentes necesidades de los gobiernos, la investigación y los mercados.

Principales líneas de investigación

  • Recuperación translingüe de información
  • Identificación de idioma
  • Clasificación de polaridad de opiniones
  • Creación de etiquetas temáticas para noticias
  • Creación de cronologías

Proyectos de investigación en marcha

  • VIGICOVID: Vigilancia automatizada de cuestiones clave sobre la COVD19 en publicaciones científicas. Fondo Supera COVID-19 (2020-2021).
  • COGNOSCERE: Inteligencia y análitica avanzada multidominio basada en Big Data y Deep Learning. Cofinanciado por el Gobierno de España (Ministerio de Asuntos Económicos y Transformación Digital, Impulso a las Tecnologías Habilitadoras Digitales - TSI-100905-2019-15, 2019-2021) ministerio de asuntos económicos y transformación digital 
  • GEPSA: Gizarte-Erronkei erantzun eta Politika Eraginkorrak diseinatzeko prentsaren azterketa Semantikoan oinarritutako tresna Adimenduna. Programa Hazitek Gobierno Vasco (2019-2020)
  • HitZain: Plataforma de vigilancia en medios para seguimiento competitivo de mercado. Programa Hazitek, Gobierno Vasco (2016-2018)