Creación de corpus.

Extraemos automáticamente textos de Internet y construimos corpus mediante herramientas desarrolladas para nosotros. Dichos corpus pueden ser tanto monolingües como paralelos.

webcorpusak.elhuyar.eus/

Características técnicas

Gracias a las herramientas desarrolladas en Elhuyar, somos capaces de detectar documentos bilingües en Internet y alinearlos a nivel de frase.

Casos de éxito

  • Corpus web de Elhuyar