User:Jpmague/Sandbox

Introduction
Ce document est une version textuelle de la carte conceptuelle ( [[Media:TXM MoC-Import Trameur-Xaira-Weblex.pdf|PDF]], [[Media:TXM MoC-Import Trameur-Xaira-Weblex.cxl|CMAP]]) mettant en parallèle les modèles conceptuels du Trameur, de Xaira et de Weblex, construite collectivement (Séverine Gedzelman, Serge Heiden, Jean-Philippe Magué, Bénédicte Pincemin et Céline Poudat) le lundi 24 novembre à la suite des interventions de Serge Fleury (le Trameur), Lou Burnard (Xaira) et Serge Heiden (Weblex).

La séquentialité
Le premier concept partagé par les 3 systèmes qui a été identifié lors de cette discussion est le Trameur:item (resp. Weblex:occ, Xaira:word) (ce document reprend les termes tels qu'ils apparaissent dans la carte conteptuelle ; il conserve en particulier la notation type namespace qui indique auquel des trois systèmes un terme s'applique). Un Trameur:item (resp. Weblex:occ, Xaira:word) est un vecteur de Trameur:annotation (resp. Weblex:prop, Xaira:key). Une Trameur:annotation (resp. Weblex:prop, Xaira:key) est définie sur un domaine et possède une valeur. Les vecteurs associés à chacun des Trameur:items (resp. Weblex:occ, Xaira:word) d'un corpus donné sont définis sur les mêmes domaines (tous les vecteurs appartiennent au même espace). Xaira offre par ailleurs de définir des combinaisons de Xaira:keys nommées Xaira:lemmes.

Les relations de séquentialité entre les Trameur:item, Weblex:occ, Xaira:word sont respectivement assurées par la Trameur:trame, Weblex:séquence_des_positions_globlale et la Xaira:Loc (ce dernier terme est a vérifier) dont le rôle est d'unir et ordonner les Trameur:item, Weblex:occ, Xaira:word. Le Trameur propose la notion de Trameur:segments, qui sont des successions de Trameur:items, i.e. des sous ensembles connexes de la Trameur:trame.

La source
Le Trameur, Xaira et Weblex peuvent prendre en entrée du texte brut ou du XML. Le trameur accepte par ailleurs des fichiers au format de Lexico 3. Pour traiter les fichiers source, les trois logiciels utilisent un segmenteur permettant de définir la Trameur:trame, Weblex:séquence_des_positions_globlale et la Xaira:Loc. Weblex et Xaira sont capables de tirer parti d'une segmentation explicitement donnée dans un XML source pour définir directemnent la Weblex:séquence_des_positions_globlale ou la Xaira:Loc.