Fiche Logiciel - TermSuite

logo-logiciel-termsuite-62543ea60bb5f.png

TermSuite

Apache License 2.0

TermSuite est outil libre sous licence Apache 2 dédié à l’extraction terminologique monolingue et à l’extraction terminologique bilingue à partir de corpus comparables. TermSuite traite les langues : anglais, français, allemand, espagnol, letton, chinois et russe. TermSuite adopte la plate-forme Apache UIMA conçue pour faciliter l’assemblage de composants, leur intégration au sein d’une chaîne de traitement ainsi que le passage à l’échelle. TermSuite effectue les traitements informatiques en 3 phases : - Analyses linguistiques : découpage du texte en mots, analyse morphosyntaxique et lemmatisation et conversion au format Multext à l’aide TreeTagger. - Extraction terminologique monolingue : détection d’occurrences de termes simples et complexes, normalisation et regroupement des termes en fonction de leurs variations, filtrage statistique ; listes de termes en format tsv et TBX. - Alignement terminologique bilingue : plusieurs types d’alignement par paires de langues sont proposés qui adoptent différentes approches : distributionnelle pour les termes simples, compositionnelle ou mixte pour les termes complexes et les composés savants.



Java

Discipline(s): traitement automatique des langues linguistique de corpus nlp
Domaine(s) d'application: Non renseigné
Mot(s)-clé(s): extraction terminologique alignement bilingue

Aucun développeur associé.

Contact : Contact non renseingé