Extraction de textes.

L'extraction de textes (également appelée text mining ou text analytics) est le domaine qui regroupe les techniques pour l’extraction d’informations structurées ou la connaissance à partir de textes. Ces techniques permettent d'analyser facilement et efficacement les informations codées présentes dans les ensembles de textes (parfois de type big data), ce qui facilite considérablement les processus de prise de décision. Ce vaste domaine englobe divers travaux, comme le classement de textes, leur regroupement, l'extraction d’organismes nommés et d’opinions, le résumé de documents et la récupération d’informations. Les technologies d’extraction de textes actuelles sont utilisées avec un grand succès en réponse aux divers besoins des gouvernements, de la recherche et des marchés.

Lignes de recherche principales

  • Récupération translingue d’informations
  • Identification de la langue
  • Classement de polarité d'opinions
  • Création d’étiquettes thématiques pour les informations
  • Création de chronologies

Ongoing research projects

  • VIGICOVID: Vigilancia automatizada de cuestiones clave sobre la COVD19 en publicaciones científicas. Fondo Supera COVID-19 (2020-2021).
  • COGNOSCERE: Inteligencia y análitica avanzada multidominio basada en Big Data y Deep Learning. Cofunded by the Spanish Government (Ministerio de economía y Transformación Digital del Goberno de España (Impulso a las Tecnologías Habilitadoras Digitales - TSI-100905-2019-15, 2019-2021)
  • GEPSA: Gizarte-Erronkei erantzun eta Politika Eraginkorrak diseinatzeko prentsaren azterketa Semantikoan oinarritutako tresna Adimenduna. Hazitek Program, Basque Government (2019-2020)
  • Elesight: Inteligencia y análitica avanzada multidominio basada en Big Data y Deep Learning. Hazitek Program, Basque Government (2018-2019)
  • HitZain: Plataforma de vigilancia en medios para seguimiento competitivo de mercado. Hazitek Program, Basque Government (2016-2018)