Ressources linguistiques.

Services web

  • Modela

    Traducteur de basque automatique intelligent.

  • Xuxen

    Correcteur orthographique et grammatical en basque

  • TermKate

    Plateforme en ligne pour la création de dictionnaires spécialisés.

  • Elhuyar Dictionnaires

    Dictionnaires en ligne : basque<>espagnol, basque<>français, basque<>anglais

  • Dictionnaires automatiques

    Site Web de consultation de dictionnaires bilingues créés automatiquement par techniques de pivotement.

  • Elhuyar web-corpusak

    Site Web de consultation de deux grands corpus automatiquement compilés à partir d’Internet, l'un en basque et l'autre parallèle espagnol-basque.

  • CorpEus

    Ce site Web vous permet de rechercher des mots ou des termes en basque sur Internet, mais les résultats s'affichent sous forme de requête de corpus avec les contextes du mot.

  • Elebila

    Moteur de recherche de langue basque, le seul qui vous permette de limiter les résultats à la langue basque.

Téléchargements

Opinion Mining - Sentiment Analysis

ElhPolar_es

Spanish polarity lexicon.

ElhPolar_eu

Basque polarity lexicon.

Basque Opinon Dataset

Polarity annotated Basque sentences.

BEC2016 opinion dataset

Basque Election Campaign 2016 Opinion Dataset - BEC2016. 25.000 Tweets with entity level binary polarity annotations.

Behagunea Opinion datasets

Tweet collection about the DSS2016 Cultural capital project. Tweets annotated with polarity at message level (pos|neg|neu) i Basque (3000) and Spanish (4754).

EliXa polarity classification models (EliXa 1.0.x)

Models for polarity classification, trained over cultural domain (Behagunea) tweets.
Previous versions: v 0.9.x

EliXa resources (EliXa 1.0.x <=)

language specific resources: polarity lexicons and other resources for text normalization. We currently provide such resources for 4 languages; Basque (eu), Spanish (es), English (en) and French (fr). Also includes pos tagging models for ixa-pipe-pos tool.
Previous versions: v 0.9.x ( Ixa-pipes pos models not  included)

Ixa-Pipes models for EliXa 0.9.x

Ixa-Pipes models used for lemmatization and POS tagging (1.5.0) by EliXa 0.9.x as default models.

Corpus

Basque-English Parallel corpus

Basque-English parallel corpus automatically gathered using the PaCo2 tool.

Basque-Spanish Parallel corpus

Basque-Spanish parallel corpus automatically gathered using the PaCo2 tool. It contains 640K segments.

Elhuyar web corpus

Corpus of 186M tokens in Basque. Automatically crawled and cleaned from the Web.
Ref: Leturia, I. 2014. The Web as a Corpus of Basque. PhD Thesis. Faculty of Informatics, UPV/EHU. Donostia.

basic.softwarea