Coupure automatique de mots

Le module de coupure automatique de mots en fin de ligne est notre plus ancien outil linguistique, petit de taille, mais extrêmement utile. Il est indispensable pour la mise en colonnes dans des applications de PAO. De même, il est utilisé dans les lecteurs de livres numériques.

Aspect linguistique

Le module de coupure de mots n'est pas basé sur le travail avec un grand dictionnaire, mais sur un ensemble de modèles de coupure savamment choisis. Le module est de taille très réduite (l'ensemble de modèles de coupure de mots tchèques n'occupe que 30 kB), et pourtant son rendement est de 99,92 %. Cet ensemble de mots tchèque englobe également des mots empruntés à d'autres langues et de termes techniques (soft-ware, play-boy, Bre-tagne). Le module respecte les règles typographiques telle que la césure interdite (aujourd'hui).

Solutions logicielles

Le logiciel a été développé de manière à saisir toutes les possibilités de césure du mot. Comparé à des algorithmes plus simples, il ne se limite pas à des cas de coupure de mots qui sont absolument sûrs. Par contre, il est basé sur un algorithme de recherche de modèles de césure et d'autres informations morphologiques pertinentes. La vitesse de recherche du modèle de césure correspondant dépend de la longueur du mot, et non du nombre de modèles existants. Et pourtant, l'algorithme utilisé par notre module de coupude de mots est toujours plus ou moins simple et peut être incorporé dans n'importe quelle application.

Fonctions disponibles

  • Recherche de toutes les possibilités de césure du mot

Actuellement, nous offrons un module de coupure de mots pour de nombreuses langues et plateformes (voir la table).

Références

Le module de coupure de mots LINGEA est intégré dans des systèmes d'édition de plusieurs journaux tchèques. Or vous pouvez vérifier vous-mêmes ses qualités parce ce qu'il fait partie de toutes les applications de Microsoft Office ou de l'application Adobe InDesign.