Extraction de textes.

L'extraction de textes (également appelée text mining ou text analytics) est le domaine qui regroupe les techniques pour l’extraction d’informations structurées ou la connaissance à partir de textes. Ces techniques permettent d'analyser facilement et efficacement les informations codées présentes dans les ensembles de textes (parfois de type big data), ce qui facilite considérablement les processus de prise de décision. Ce vaste domaine englobe divers travaux, comme le classement de textes, leur regroupement, l'extraction d’organismes nommés et d’opinions, le résumé de documents et la récupération d’informations. Les technologies d’extraction de textes actuelles sont utilisées avec un grand succès en réponse aux divers besoins des gouvernements, de la recherche et des marchés.

Lignes de recherche principales

  • Récupération translingue d’informations
  • Identification de la langue
  • Classement de polarité d'opinions
  • Création d’étiquettes thématiques pour les informations
  • Création de chronologies