Création de corpus.

Nous extrayons automatiquement des textes d’Internet et construisons un corpus grâce à des outils que nous développons nous-mêmes. Ces corpus peuvent être monolingues et parallèles.

webcorpusak.elhuyar.eus/

Caractéristiques techniques

Grâce aux outils développés par Elhuyar, nous sommes capables de détecter des documents bilingues sur Internet et de les aligner au niveau de la phrase.

Témoignage de succès

  • Corpus web d’Elhuyar