Description de la rto





télécharger 19.49 Kb.
titreDescription de la rto
date de publication11.10.2019
taille19.49 Kb.
typeDocumentos
m.20-bal.com > documents > Documentos

Les entrées du logiciel @Web :

les fichiers CSV






Stéphane Dervaux

17/07/2012





Sommaire


I.Description de la RTO 2

II.Les concepts symboliques 4

III.Les concepts quantités 4

4

IV.Les concepts relations 5

V.Le fichier des hiérarchies 6


Le logiciel @Web propose un processus complet d'acquisition de données de tableaux, qui contiennent en général une synthèse des données publiées dans les documents scientifiques, pour enrichir des bases de données locales (cf. Figure 1). Il repose sur une Ressource Termino-Ontologique (RTO), qui donne une représentation, formalisée et structurée, du vocabulaire spécifique à un domaine d'application donné. La RTO est composée d'une partie générique contenant les concepts dédiés à la tâche d’annotation sémantique de tableaux de données et d'une partie spécifique ainsi que d'une terminologie, dédiés au domaine d'application étudié.

Figure 1 : Description du processus du logiciel @Web

Le logiciel @Web permet d’entrer une RTO au format OWL ou au format CSV. L’objectif de ce présent document est de détailler et d’expliquer les différents fichiers CSV utilisés pour saisir une RTO. Nous commençons par présenter succinctement la structure de la RTO, puis décrivons les différents fichiers CSV.
  1. Description de la RTO


Une RTO est composée des concepts génériques suivants (cf. Figure 2) : les concepts génériques Symbolic_Concept, Quantity, Relation (sous-concepts du concept T_concept) et un ensemble de concepts permettant de gérer les unités de mesures et leurs conversions, qui ont été définis à partir d’ontologies existantes.

Figure 2 : Les concepts génériques de la RTO

Le concept générique Relation, en particulier, permet de représenter des relations n-aires entre des concepts symboliques et des quantités. La signature d’une relation R(Ca1, Ca2, …, Can;Cr) est définie par un domaine et un co-domaine. Le co-domaine est limité à un seul concept Cr, le concept résultat de l’expérimentation, alors que le domaine peut être composé d’un ou plusieurs concepts (Ca1, Ca2, …, Can), les concepts d’accès représentant les conditions expérimentales de la relation. La Figure 3 donne un extrait de la partie spécifique d’une RTO dans le domaine du risque microbiologique où la relation O2Permeability_Relation a pour signature (Packaging, Thickness, Temperature, Partial_Pressure, Relative_Humidity;O2Permeability).

Figure 3 : Un extrait de la RTO dans le domaine du risque microbiologique

La partie terminologique de la RTO permet notamment d’associer à chaque concept T_Concept de l’ontologie un label préféré et des labels alternatifs (correspondant à des synonymes)dans plusieurs langues.

Nous présentons dans la suite les différents fichiers CSV permettant de saisir une RTO dans le logiciel @Web. Pour saisir une RTO, il suffit d’entrer les fichiers CSV correspondant aux concepts symboliques, aux quantités, aux relations et les éventuelles hiérarchies pouvant exister entre ces 3 types de concepts. Les unités de mesure et leurs conversions sont définies dans une autre ontologie spécifique que nous ne présenterons pas ici.Dans chacun des fichiers CSV décrits ci-dessous, la première ligne est un entête qui permet de décrire le format du document.
  1. Les concepts symboliques


37.png

La première colonne « prefLabel=en » représente le label préféré en anglais (Il s’agit de la seule colonne obligatoire) d’un concept symbolique, suivi par ses labels alternatifs en anglais (colonne « altLabel=en ») et ainsi de suite avec d’autres langues. Dans cet exemple, nous avons également la langueallemande (de) (partiellement disponible) et le français (fr).

Les colonnes du type « prefLabel=xx » ne peuvent contenir qu’un seul terme alors que les colonnes du type « altLabel=xx » peuvent en contenir plusieurs (possibilités de définir plusieurs synonymes). Si tel est la cas, alors les termes sont séparés par « :: » comme à la ligne 5 : « Couenne :: lard », « Couenne » et « lard » sont donc 2 synonymes français de « Bacon ».
  1. Les concepts quantités

03.png


Les colonnes « prefLabel=xx » et « altLabel=xx » fonctionnent de la même manière que pour les concepts symboliques.

La colonne « hasUnitConcept » permet d’indiquer les unités de mesure définies pourla quantité décrite. Il est possible d’utiliser plusieurs concepts unités en les séparant par : « :: ». Les concepts unités utilisés ici doivent obligatoirement être définis dans l’ontologie des unités. Le concept unité « One » correspond à l’absence d’unité.

On peut définir un intervalle de valeurs possibles pour une quantité, mais ce n’est pas obligatoire. La colonne « minimum value » permet de définir la borne inférieure de cet intervalle et la colonne « maximum value » sa borne supérieure.

La colonne « modality » permet de dire si les bornes (« minimum value » et « maximum value ») sont incluses (« inclusive ») ou exclues (« exclusive »). Si les deux bornes (min et max) sont définis alors il est obligatoire de mettre les deux modalités en les séparant toujours par « :: ».

La colonne « dimension » permet de définir la dimension d’une quantité (« length-dimension », «time-dimension »,…). Il est possible de définir ses propres dimensions.

 
  1. Les concepts relations


30.png

Les colonnes « prefLabel=xx » et « altLabel=xx » fonctionnent de la même manière que pour les concepts symboliques et les quantités.

La colonne « result_concept » permet de définir le concept résultat de la relation. Il est unique.

La colonne « important_access_concept » permet de définir les concepts d’accès importants de la relation (s’il y en a plusieurs, alors on les sépares par « :: ».

La colonne « optional_access_concept » permet de définir les concepts d’accès optionnels de la relation (s’il y en a plusieurs, alors on les sépares par « :: ».

Tous les concepts utilisés dans les 3 colonnes décrites précédemment doivent obligatoirement être décrits dans les fichiers CSV des concepts symbolique ou des concepts quantité (on utilise alors leur « prefLabel=en »).

Pour les 3 types de fichier permettant de décrire les concepts, la première colonne doit toujours être « prefLabel=en » et doit obligatoirement être remplie.

Il n’est pas obligatoire de créer un seul fichier par type de concept. Il peut très bien y avoir, par exemple, plusieurs fichiers permettant de décrire les différents concepts symboliques.
  1. Le fichier des hiérarchies


Pour chacun des fichiers CSV décrivant les concepts, il est possible mais pas obligatoire de définir une hiérarchie de ces concepts.

31.png

La première colonne contient le nom du concept parent, la seconde contient le nom du concept fils.

Ce fichier n’est pas obligatoire mais il ne peut y en avoir qu’un seul par fichier CSV décrivant les concepts.

Pour construire les fichiers de hiérarchie, on utilise le « prefLabel=en » utilisé dans les fichiers CSV.

similaire:

Description de la rto iconDescription

Description de la rto iconDescription

Description de la rto iconDescription de poste

Description de la rto iconDescription de poste

Description de la rto iconDescription de l’étude

Description de la rto iconDescription du conditionnement

Description de la rto iconSarcosporidiose description

Description de la rto iconRÉsumé Description

Description de la rto iconDescription de poste

Description de la rto iconDescription du stage – dmae n°





Tous droits réservés. Copyright © 2016
contacts
m.20-bal.com