Rescursos y herramientas lingüísticas.

Descargas

Extracción de Opiniones - Análisis de Sentimiento

ElhPolar_es

Diccionario de polaridad en Español.

ElhPolar_eu

Diccionario de polaridad en Euskera.

Basque Opinon Dataset

Collección de frases en Euskera con anotaciones de polaridad.

BEC2016 opinion dataset

Colección de tweets sobre la campaña electoral elecciones autonómicas CAV 2016.  -  BEC2016. 25.000 Tweets con anotaciones de polaridad (pos|neg) a nivel de entidades.

Dataset de opiniones Behagunea

Colección de tweets sobre la el proyecto de capitalidad cultural DSS2016. Tweets etiquetado con polaridad a nivel de mensaje (pos|neg|neu) en Euskera (3000) y Castellano (4754).

Modelos estadísticos de polaridad (EliXa 0.9.x)

Modelos de clasificación de polaridad, entrenados sobre tweets de dominio cultural (Behagunea).

EliXa resources (EliXa 0.9.x)

Recursos para idiomas específicos: léxicos de polaridad y recursos para normalización de textos. El paquete incluye recursos para 4 idiomas: Euskera (eu), Español (es), Inglés (en) y francés (fr).

Ixa-Pipes models for EliXa 0.9.x

Ixa-Pipes models used for lemmatization and POS tagging (1.5.0) by EliXa 0.9.x as default models.

Corpus

Corpus paralelo Euskera-Inglés

Corpus paralelo Euskera-Inglés, recopilado automáticamente utilizando la herramienta PaCo2.

Corpus paralelo Euskera-Castellano

Corpus paralelo Euskera - Castellano, recopilado automáticamente utilizando la herramienta PaCo2. Contiene 640K segmentos.

Web corpus Elhuyar

Corpus en Euskera que contiene 186M de palabras. Descargado de la web y limpiado automácticamente.
Ref: Leturia, I. 2014. The Web as a Corpus of Basque. Tesis doctoral. Facultad de Informatika. UPV/EHU, Donostia.

basic.softwarea