<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sparna Blog &#187; skos testing tool</title>
	<atom:link href="https://blog.sparna.fr/tag/skos-testing-tool/feed/" rel="self" type="application/rss+xml" />
	<link>https://blog.sparna.fr</link>
	<description>Web de données &#124; Architecture de l&#039;information &#124; Accès aux connaissances</description>
	<lastBuildDate>Tue, 03 Jun 2025 10:30:27 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
	<item>
		<title>Vocabulaires dans le web de données : quels outils open-source ?</title>
		<link>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/</link>
		<comments>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/#comments</comments>
		<pubDate>Tue, 23 Jan 2018 10:43:08 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Editeurs]]></category>
		<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[OnAGUI]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Skosmos]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[ginco]]></category>
		<category><![CDATA[onagui]]></category>
		<category><![CDATA[opentheso]]></category>
		<category><![CDATA[skos play]]></category>
		<category><![CDATA[skos testing tool]]></category>
		<category><![CDATA[skosmos]]></category>
		<category><![CDATA[vocbench]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1157</guid>
		<description><![CDATA[<p>Je travaille régulièrement sur des projets de gestion et/ou de mise en ligne de vocabulaires (thesaurus, taxonomies) en SKOS : pour l&#8217;UNESCO &#8211; voir le précédent billet -, l&#8217;INED (thesaurus Popin), le Luxembourg, l&#8217;IRSTEA ou le Réseau Canopé (vocabulaire ScolomFr). Ces projets sont réalisés en utilisant de l&#8217;open-source sur toute la chaîne, depuis le back-office&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/">Vocabulaires dans le web de données : quels outils open-source ?</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">Je travaille régulièrement sur des <strong>projets de gestion et/ou de mise en ligne de vocabulaires (thesaurus, taxonomies)</strong> en <a href="http://www.sparna.fr/skos/SKOS-traduction-francais.html">SKOS</a> : pour l&rsquo;<a href="http://vocabularies.unesco.org">UNESCO</a> &#8211; voir le <a href="http://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/">précédent billet</a> -, l&rsquo;<a href="https://www.ined.fr/">INED</a> (thesaurus Popin), le <a href="http://data.legilux.public.lu/">Luxembourg</a>, l&rsquo;<a href="http://irstea.fr">IRSTEA</a> ou le <a href="https://www.reseau-canope.fr/">Réseau Canopé</a> (vocabulaire <a href="https://www.reseau-canope.fr/scolomfr/accueil.html">ScolomFr</a>). Ces projets sont réalisés en utilisant de l&rsquo;open-source sur toute la chaîne, depuis le back-office de gestion jusqu&rsquo;à la diffusion conforme aux standards du web de données, en passant par l&rsquo;alignement ou la conversion depuis des tableaux Excel.</p>
<p>&nbsp;</p>
<p style="text-align: justify;"><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees.jpg"><img class=" wp-image-1158 size-full aligncenter" src="http://blog.sparna.fr/wp-content/uploads/2018/01/Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees.jpg" alt="Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees" width="960" height="720" /></a></p>
<p style="text-align: justify;">Je vous propose un petit <strong>tour d&rsquo;horizon des outils open-source pour la gestion et la diffusion de vocabulaires contrôlés</strong>.</p>
<h1>Outils de gestion</h1>
<h2>Vocbench3</h2>
<p style="text-align: justify;"><a href="http://vocbench.uniroma2.it/">Vocbench3</a> est l&rsquo;outil de gestion de référentiels SKOS que je recommande. Il est développé par l&rsquo;Université de Rome Tor-Vergata, et financé pour 1 ou 2 année encore par le programme de financement européen ISA, ce qui lui donne une bonne visibilité à moyen terme. La <a href="http://vocbench.uniroma2.it/support/community.jsf">communauté d&rsquo;utilisateurs</a> est large avec beaucoup d&rsquo;organismes internationaux (FAO/<a href="http://aims.fao.org/vest-registry/vocabularies/agrovoc-multilingual-agricultural-thesaurus">Agrovoc</a>, INRA, Office des Publications de l&rsquo;UE/<a href="http://eurovoc.europa.eu/">Eurovoc</a>, etc.). Le support est bon, l&rsquo;équipe de développement répond rapidement aux questions.</p>
<p style="text-align: justify;">Coté technique, il est directement basé sur des données RDF, ce qui facilite son intégration dans des environnements techniques basés sur le web de données. Le modèle de données est extensible et permet de gérer des propriétés &laquo;&nbsp;customisées&nbsp;&raquo; sur les concepts. Vocbench permet également d&rsquo;éditer des ontologies OWL, sans arriver à concurrencer <a href="https://protege.stanford.edu/">Protégé</a>.</p>
<p style="text-align: justify;"><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/td_eurovoc_show.png"><img class="aligncenter wp-image-1166 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/td_eurovoc_show-1024x646.png" alt="td_eurovoc_show" width="650" height="410" /></a></p>
<h2 style="text-align: justify;">Ginco</h2>
<p style="text-align: justify;"><a href="https://github.com/culturecommunication/ginco">Ginco</a> est l&rsquo;outil de gestion de vocabulaires développé par le Ministère de la Culture pour la maintenance de ses référentiels. Il a été dès le départ spécifié pour être compatible avec la norme <a href="http://dossierdoc.typepad.com/descripteurs/2011/08/norme-iso-25964-1-thesaurus-publication-officielle.html">ISO-25964</a> sur la modélisation des thesaurus, et avec SKOS. Donc en particulier la gestion des facettes, des tableaux de concepts, etc. Il a un pendant &laquo;&nbsp;<a href="https://github.com/culturecommunication/ginco-diff">Ginco diffusion</a>&nbsp;&raquo; qui motorise le <a href="http://data.culture.fr/thesaurus/">site de diffusion des vocabulaires du MCC</a>.</p>
<h2 style="text-align: justify;">OpenTheso</h2>
<p style="text-align: justify;"><a href="https://github.com/miledrousset/opentheso">OpenTheso</a> est l&rsquo;outil de gestion SKOS <em>made in</em> CNRS. La communauté d&rsquo;utilisateurs est dans le monde de la recherche française/francophone (notamment le réseau <a href="https://www.frantiq.fr/">FRANTIQ</a>).<br />
On pourra consulter la <a href="http://semweb.pro/semwebpro-2017.html#p3">présentation d&rsquo;OpenTheso à semweb.pro 2017 par Miled Rousset</a>.</p>
<h1>Outils de Publication et Visualisation de vocabulaires</h1>
<h2>Skosmos</h2>
<p style="text-align: justify;">Vous voulez <strong>valoriser vos vocabulaires/thesaurus/taxonomies</strong> ? Vous avez besoin des les rendre visibles, navigables, interrogeables par les utilisateurs ? Vous voulez recevoir du feedback, faire participer une communauté ? <a href="http://skosmos.org/">Skosmos</a> est l&rsquo;outil de choix.<br />
Développé par la Bibliothèque Nationale de Finlande pour son portail &laquo;&nbsp;<a href="http://finto.fi">finto.fi</a>&nbsp;&raquo; (parlez-vous finnois ?), Skosmos propose une interface de rendu très propre avec toutes les fonctions de navigation dans des vocabulaires contrôlés : listes alphabétiques, arborescence hiérarchique, recherche plain-texte avec autocompletion, gestion des groupes/collections SKOS, affichage propre des alignements avec d&rsquo;autres vocabulaires. Il s&rsquo;adapte assez facilement pour le mettre aux couleurs de l&rsquo;institution. Il prend en charge la négociation de contenu pour l&rsquo;accès aux données brutes en RDF. L&rsquo;interface inclut également un formulaire permettant d&rsquo;envoyer du feedback à l&rsquo;équipe de maintenance du thesaurus.</p>
<p style="text-align: justify;">L&rsquo;équipe de développement répond très vite aux questions, le code PHP est de qualité, l&rsquo;outil est vivant et de nouvelles versions sont disponibles régulièrement.</p>
<p style="text-align: justify;">Skosmos est à mon sens <strong>LE meilleur outil pour la diffusion de vocabulaires en SKOS</strong>.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skosmos-finto.png"><img class="aligncenter wp-image-1168 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skosmos-finto-1024x597.png" alt="screenshot-skosmos-finto" width="650" height="379" /></a></p>
<h2>Skos Play</h2>
<p style="text-align: justify;"><a href="http://labs.sparna.fr/skos-play/">SKOS Play</a> est l&rsquo;outil que je développe depuis 2013 pour faire de la publication et de la visualisation de référentiels SKOS. Il permet de générer des documents PDF des vocabulaires, des sorties HTML dynamiques (arbres dépliables),des listings alphabétiques, des tableaux de traduction ou d&rsquo;alignement, ou des data visualisations. A titre d&rsquo;exemple on pourra consulter les <a href="http://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/">rendus du code Rome de Pôle Emploi en SKOS</a>.</p>
<p style="text-align: justify;">SKOS Play est intégré dans la plateforme de publication des vocabulaires du MCC, et dans celle de l&rsquo;UNESCO, pour la <a href="http://vocabularies.unesco.org/exports/thesaurus/latest/">génération des PDFs</a>. Le service en ligne est quant à lui utilisé plus de <strong>500 fois par mois</strong>.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/code-rome-visualisation-arbre.png"><img class="aligncenter wp-image-1164 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/code-rome-visualisation-arbre-1024x557.png" alt="code-rome-visualisation-arbre" width="650" height="354" /></a></p>
<h1>Conversion Excel, contrôle qualité, alignement</h1>
<h2>Skos Play convert</h2>
<p style="text-align: justify;">SKOS Play inclut un <a href="http://labs.sparna.fr/skos-play/convert">service de génération de données RDF/SKOS depuis des tableaux Excel</a> (voir <a href="http://blog.sparna.fr/2017/01/12/creer-des-referentiels-skosrdf-a-partir-dexcel/">précédent billet</a>).</p>
<p style="text-align: justify;">Soyons honnêtes : <strong>rien ne remplace Excel</strong> <img src="https://blog.sparna.fr/wp-includes/images/smilies/simple-smile.png" alt=":-)" class="wp-smiley" style="height: 1em; max-height: 1em;" /> ! pour de la saisie ou de l&rsquo;analyse de données en masse, avoir une vue globale sur ces données, faire des reporting, gérer facilement plusieurs vocabulaires&#8230; Pas de courbe d&rsquo;apprentissage, pas d&rsquo;outil à installer, grande efficacité de saisie. Et si on utilise un environnement en ligne type Google Sheets, on gagne l&rsquo;aspect collaboratif.<br />
Cette passerelle Excel-RDF-SKOS s&rsquo;est révélée très importante pour faire les reprises ou les créations initiales de vocabulaires, avant de les basculer dans des outils de gestion comme VocBench.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/convert-screenshot-body.png"><img class="aligncenter wp-image-1163 size-full" src="http://blog.sparna.fr/wp-content/uploads/2018/01/convert-screenshot-body.png" alt="convert-screenshot-body" width="1490" height="335" /></a></p>
<h2>Skos Testing Tool : contrôle qualité</h2>
<p style="text-align: justify;">Le <a href="http://labs.sparna.fr/skos-testing-tool/">SKOS Testing Tool</a> est une interface web permettant de valider la conformité de fichiers SKOS (voir <a href="http://blog.sparna.fr/2017/07/11/outil-de-test-de-vocabulaires-skos/">précédent billet</a>). L&rsquo;outil s&rsquo;appuie sur <a href="https://github.com/cmader/qSKOS">qSKOS</a>, qui fonctionne lui en ligne de commande. 27 vérifications peuvent être effectuées sur les données, comme :</p>
<ul style="text-align: justify;">
<li>vérification de l&rsquo;absence de cycle dans la hiérarchie des concepts</li>
<li>vérification que tous les concepts ont bien un prefLabel</li>
<li>vérification que tous les concepts sont traduits (dans le cas de thesaurus multilingues)</li>
<li>&#8230;</li>
</ul>
<p style="text-align: justify;">Combiné avec les sorties alphabétiques/hiérarchiques de SKOS Play, ces vérifications permettent de s&rsquo;assurer de la qualité des données soit en amont lors des comités de validation du vocabulaire, soit en aval avant la diffusion des données en ligne dans Skosmos.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skos-testing-tool.png"><img class="aligncenter wp-image-1172 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skos-testing-tool-1024x715.png" alt="screenshot-skos-testing-tool" width="650" height="454" /></a></p>
<h2>OnaGUI : Alignement semi-automatique</h2>
<p style="text-align: justify;"><a href="https://github.com/lmazuel/onagui">OnaGUI</a> (Ontology Alignment Graphical User Interface) a été développé à l&rsquo;origine à l&rsquo;INSERM dans l&rsquo;équipe de <a href="http://www.limics.fr/fr/annuaire/fiche-membre/voir/18-CHARLET-Jean">Jean Charlet</a> pour faire de l&rsquo;alignement d&rsquo;ontologies médicales, et il a depuis été adapté pour pouvoir aligner des données SKOS.</p>
<p style="text-align: justify;">C&rsquo;est l&rsquo;outil le plus accessible et le plus simple d&rsquo;utilisation pour aligner 2 vocabulaires : on charge un thesaurus à gauche, un thesaurus à droite, et on lance un algorithme d&rsquo;alignement qui va proposer des correspondances sur la base des proximités des libellés des concepts.</p>
<p style="text-align: justify;">On utilise régulièrement OnaGUI pour illustrer les alignements de thesaurus dans les <a href="https://www.adbs.fr/formations/formation-comprendre-web-semantique-et-ontologies-167">formations web de données à l&rsquo;ADBS</a>.</p>
<p style="text-align: justify;">Si on veut utiliser des algorithmes d&rsquo;alignement plus poussés, on se tournera vers l&rsquo;<a href="http://alignapi.gforge.inria.fr/">API d&rsquo;alignement de l&rsquo;INRIA</a>, mais qui demande du développement technique pour être intégrée dans un outil.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet.png"><img class="aligncenter wp-image-1170 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet-1024x582.png" alt="onagui-irstea-gemet" width="650" height="369" /></a></p>
<h2>Quels outils manquent ?</h2>
<p>Quels outils manquent dans l&rsquo;écosystème des vocabulaires dans le web de données ?</p>
<ul>
<li>Probablement des outils faciles à mettre en œuvre pour assister à la <strong>création de vocabulaires à partir d&rsquo;analyse de corpus</strong> (détection d&rsquo;entités, agrégation des mots en concepts, etc.); en connaissez-vous ? <a href="https://www.ibm.com/watson/products-services/">IBM Watson</a> ne ferait pas quelque chose comme ça ?</li>
<li>Des <strong>interfaces d&rsquo;alignement puissantes</strong> faciliteraient la mise en réseau des référentiels (des choses comme <a href="http://cultuurlink.beeldengeluid.nl">cultuurlink</a>, mais généralisées);</li>
<li>Une <strong>gestion des versions successives</strong> des vocabulaires, avec calcul de deltas, génération automatique de ce qui a changé entre 2 versions, etc;</li>
<li>Des <strong>plugins dans les CMS</strong> courants (WordPress, Drupal, etc&#8230;) permettant d&rsquo;importer directement des vocabulaires SKOS, et de les mettre à jour; ça doit bien exister, non ? également des ponts faciles et direct vers SolR et ElasticSearch;</li>
<li>Mon rêve : un <strong>outil d&rsquo;édition des vocabulaires en mode collaboratif et ouvert poussé</strong>, en mode SaaS, sans différence entre l&rsquo;environnement d&rsquo;édition et de publication, permettant de faire collaborer une communauté plus large que quelques éditeurs experts; ça viendra un jour ! <img src="https://blog.sparna.fr/wp-includes/images/smilies/simple-smile.png" alt=":-)" class="wp-smiley" style="height: 1em; max-height: 1em;" /></li>
</ul>
<p><em><strong>Et vous, quels outils vous manquent ?</strong></em></p>
<p><em>(Illustration de l&rsquo;article : &laquo;&nbsp;Atelier Heilmann Ducommun pour la construction de machines-outils&nbsp;&raquo; Gallica <a href="http://gallica.bnf.fr/ark:/12148/btv1b10201510v" target="_blank">http://gallica.bnf.fr/ark:/12148/btv1b10201510v</a>)</em></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/">Vocabulaires dans le web de données : quels outils open-source ?</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
	</channel>
</rss>
