Monday, December 3, 2018

Collatinus 11.1: Lemmatiseur et analyseur morphologique de textes latins

Collatinus 11.1: Lemmatiseur et analyseur morphologique de textes latins
Collatinus est une application libre, gratuite et multi-plateforme (Mac, Windows, Ubuntu et Debian GNU/Linux), simple à installer et facile à utiliser.
Collatinus est à la fois un lemmatiseur et un analyseur morphologique de textes latins : il est capable, si on lui donne une forme déclinée ou conjuguée, de trouver quel mot il faudra chercher dans le dictionnaire pour avoir sa traduction dans une autre langue, ses différents sens, et toutes les autres données que fournit habituellement un dictionnaire.
En pratique, il est utile surtout au professeur de latin, qui peut ainsi très rapidement, à partir d’un texte hors-manuel, distribuer à ses élèves un texte inédit avec son aide lexicale. Les élèves s’en servent souvent pour lire plus facilement le latin lorsque leurs connaissances lexicales et morphologiques sont encore insuffisantes.

Principales fonctionnalités

  • lemmatisation de mots latins ou d'un texte latin entier,
  • traduction des lemmes grâce aux dictionnaires de latin incorporés dans l'application,
  • affichage des quantités (durée longue ou brève des syllabes) et des flexions (déclinaison ou conjugaison).

Atouts de Collatinus

  • efficacité de la lemmatisation (~1000 mots/s. ; dépend bien sûr de la machine sur laquelle le programme tourne),
  • lemmes extraits du Lewis & Short 1879 et du Gaffiot 2016 (avec l'autorisation de l'auteur) avec les traductions en anglais et en français. Collation avec ceux issus du Georges 1913 et du Jeanneau 2017 (avec l'autorisation de l'auteur),
  • lexique de base de 24 155 lemmes (textes classiques du LASLA) et extension de 58 384 lemmes auxquels s'ajoutent quelques variantes graphiques et l'assimilation du préfixe,
  • classement des lemmatisations et des analyses morpho-syntaxiques en fonction du nombre d'occurrences observé dans les textes du LASLA,
  • traductions d'environ 11 000 lemmes dans 6 langues différentes, autres que le français et l'anglais (à améliorer)
  • possibilité de coloriser un texte en fonction d'une liste de mots connus,
  • scansion et accentuation d'un mot ou d'un texte,
  • tagueur probabiliste basé sur les statistiques faites sur les textes du LASLA (~1 800 000 mots)
  • consultation de dictionnaires en mode texte ou image (djvu). Facilité d'ajout de nouveaux dicos (djvu),
  • possibilité de consulter Collatinus depuis un autre programme (par exemple, LibreOffice) via un port interne,
  • possibilité d'interroger Collatinus à partir d'un client en mode console. Lemmatisation d'un texte à partir d'un fichier
  • code source du logiciel organisé en modules de manière à faciliter le développement d'applications plus spécifiques
Version complète (9 dictionnaires inclus)

  • Lewis & Short, 1879 (latin-anglais)
  • Gaffiot, 2016 (latin-français)
  • Du Cange, 1883 (glossaire de latin médiéval)
  • Georges, 1913 (latin-allemand)
  • Jeanneau, 2017 (latin-français)
  • Gaffiot, 1934 (latin-français)
  • Calonghi, 1898 (latin-italien)
  • Valbuena, 1819 (latin-italien)
  • Quicherat, 1836 (latin-français)


Version intermédiaire (5 dictionnaires inclus)
  • Lewis & Short, 1879 (latin-anglais)
  • Gaffiot, 2016 (latin-français)
  • Du Cange, 1883 (glossaire de latin médiéval)
  • Georges, 1913 (latin-allemand)
  • Jeanneau, 2017 (latin-français)


Version minimale (2 dictionnaires inclus)
  • Lewis & Short, 1879 (latin-anglais)
  • Gaffiot, 2016 (latin-français)


No comments:

Post a Comment