<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sparna Blog &#187; Skosmos</title>
	<atom:link href="https://blog.sparna.fr/category/outils/skosmos/feed/" rel="self" type="application/rss+xml" />
	<link>https://blog.sparna.fr</link>
	<description>Web de données &#124; Architecture de l&#039;information &#124; Accès aux connaissances</description>
	<lastBuildDate>Tue, 03 Jun 2025 10:30:27 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
	<item>
		<title>Vocabulaires dans le web de données : quels outils open-source ?</title>
		<link>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/</link>
		<comments>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/#comments</comments>
		<pubDate>Tue, 23 Jan 2018 10:43:08 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Editeurs]]></category>
		<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[OnAGUI]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Skosmos]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[ginco]]></category>
		<category><![CDATA[onagui]]></category>
		<category><![CDATA[opentheso]]></category>
		<category><![CDATA[skos play]]></category>
		<category><![CDATA[skos testing tool]]></category>
		<category><![CDATA[skosmos]]></category>
		<category><![CDATA[vocbench]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1157</guid>
		<description><![CDATA[<p>Je travaille régulièrement sur des projets de gestion et/ou de mise en ligne de vocabulaires (thesaurus, taxonomies) en SKOS : pour l&#8217;UNESCO &#8211; voir le précédent billet -, l&#8217;INED (thesaurus Popin), le Luxembourg, l&#8217;IRSTEA ou le Réseau Canopé (vocabulaire ScolomFr). Ces projets sont réalisés en utilisant de l&#8217;open-source sur toute la chaîne, depuis le back-office&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/">Vocabulaires dans le web de données : quels outils open-source ?</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">Je travaille régulièrement sur des <strong>projets de gestion et/ou de mise en ligne de vocabulaires (thesaurus, taxonomies)</strong> en <a href="http://www.sparna.fr/skos/SKOS-traduction-francais.html">SKOS</a> : pour l&rsquo;<a href="http://vocabularies.unesco.org">UNESCO</a> &#8211; voir le <a href="http://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/">précédent billet</a> -, l&rsquo;<a href="https://www.ined.fr/">INED</a> (thesaurus Popin), le <a href="http://data.legilux.public.lu/">Luxembourg</a>, l&rsquo;<a href="http://irstea.fr">IRSTEA</a> ou le <a href="https://www.reseau-canope.fr/">Réseau Canopé</a> (vocabulaire <a href="https://www.reseau-canope.fr/scolomfr/accueil.html">ScolomFr</a>). Ces projets sont réalisés en utilisant de l&rsquo;open-source sur toute la chaîne, depuis le back-office de gestion jusqu&rsquo;à la diffusion conforme aux standards du web de données, en passant par l&rsquo;alignement ou la conversion depuis des tableaux Excel.</p>
<p>&nbsp;</p>
<p style="text-align: justify;"><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees.jpg"><img class=" wp-image-1158 size-full aligncenter" src="http://blog.sparna.fr/wp-content/uploads/2018/01/Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees.jpg" alt="Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees" width="960" height="720" /></a></p>
<p style="text-align: justify;">Je vous propose un petit <strong>tour d&rsquo;horizon des outils open-source pour la gestion et la diffusion de vocabulaires contrôlés</strong>.</p>
<h1>Outils de gestion</h1>
<h2>Vocbench3</h2>
<p style="text-align: justify;"><a href="http://vocbench.uniroma2.it/">Vocbench3</a> est l&rsquo;outil de gestion de référentiels SKOS que je recommande. Il est développé par l&rsquo;Université de Rome Tor-Vergata, et financé pour 1 ou 2 année encore par le programme de financement européen ISA, ce qui lui donne une bonne visibilité à moyen terme. La <a href="http://vocbench.uniroma2.it/support/community.jsf">communauté d&rsquo;utilisateurs</a> est large avec beaucoup d&rsquo;organismes internationaux (FAO/<a href="http://aims.fao.org/vest-registry/vocabularies/agrovoc-multilingual-agricultural-thesaurus">Agrovoc</a>, INRA, Office des Publications de l&rsquo;UE/<a href="http://eurovoc.europa.eu/">Eurovoc</a>, etc.). Le support est bon, l&rsquo;équipe de développement répond rapidement aux questions.</p>
<p style="text-align: justify;">Coté technique, il est directement basé sur des données RDF, ce qui facilite son intégration dans des environnements techniques basés sur le web de données. Le modèle de données est extensible et permet de gérer des propriétés &laquo;&nbsp;customisées&nbsp;&raquo; sur les concepts. Vocbench permet également d&rsquo;éditer des ontologies OWL, sans arriver à concurrencer <a href="https://protege.stanford.edu/">Protégé</a>.</p>
<p style="text-align: justify;"><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/td_eurovoc_show.png"><img class="aligncenter wp-image-1166 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/td_eurovoc_show-1024x646.png" alt="td_eurovoc_show" width="650" height="410" /></a></p>
<h2 style="text-align: justify;">Ginco</h2>
<p style="text-align: justify;"><a href="https://github.com/culturecommunication/ginco">Ginco</a> est l&rsquo;outil de gestion de vocabulaires développé par le Ministère de la Culture pour la maintenance de ses référentiels. Il a été dès le départ spécifié pour être compatible avec la norme <a href="http://dossierdoc.typepad.com/descripteurs/2011/08/norme-iso-25964-1-thesaurus-publication-officielle.html">ISO-25964</a> sur la modélisation des thesaurus, et avec SKOS. Donc en particulier la gestion des facettes, des tableaux de concepts, etc. Il a un pendant &laquo;&nbsp;<a href="https://github.com/culturecommunication/ginco-diff">Ginco diffusion</a>&nbsp;&raquo; qui motorise le <a href="http://data.culture.fr/thesaurus/">site de diffusion des vocabulaires du MCC</a>.</p>
<h2 style="text-align: justify;">OpenTheso</h2>
<p style="text-align: justify;"><a href="https://github.com/miledrousset/opentheso">OpenTheso</a> est l&rsquo;outil de gestion SKOS <em>made in</em> CNRS. La communauté d&rsquo;utilisateurs est dans le monde de la recherche française/francophone (notamment le réseau <a href="https://www.frantiq.fr/">FRANTIQ</a>).<br />
On pourra consulter la <a href="http://semweb.pro/semwebpro-2017.html#p3">présentation d&rsquo;OpenTheso à semweb.pro 2017 par Miled Rousset</a>.</p>
<h1>Outils de Publication et Visualisation de vocabulaires</h1>
<h2>Skosmos</h2>
<p style="text-align: justify;">Vous voulez <strong>valoriser vos vocabulaires/thesaurus/taxonomies</strong> ? Vous avez besoin des les rendre visibles, navigables, interrogeables par les utilisateurs ? Vous voulez recevoir du feedback, faire participer une communauté ? <a href="http://skosmos.org/">Skosmos</a> est l&rsquo;outil de choix.<br />
Développé par la Bibliothèque Nationale de Finlande pour son portail &laquo;&nbsp;<a href="http://finto.fi">finto.fi</a>&nbsp;&raquo; (parlez-vous finnois ?), Skosmos propose une interface de rendu très propre avec toutes les fonctions de navigation dans des vocabulaires contrôlés : listes alphabétiques, arborescence hiérarchique, recherche plain-texte avec autocompletion, gestion des groupes/collections SKOS, affichage propre des alignements avec d&rsquo;autres vocabulaires. Il s&rsquo;adapte assez facilement pour le mettre aux couleurs de l&rsquo;institution. Il prend en charge la négociation de contenu pour l&rsquo;accès aux données brutes en RDF. L&rsquo;interface inclut également un formulaire permettant d&rsquo;envoyer du feedback à l&rsquo;équipe de maintenance du thesaurus.</p>
<p style="text-align: justify;">L&rsquo;équipe de développement répond très vite aux questions, le code PHP est de qualité, l&rsquo;outil est vivant et de nouvelles versions sont disponibles régulièrement.</p>
<p style="text-align: justify;">Skosmos est à mon sens <strong>LE meilleur outil pour la diffusion de vocabulaires en SKOS</strong>.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skosmos-finto.png"><img class="aligncenter wp-image-1168 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skosmos-finto-1024x597.png" alt="screenshot-skosmos-finto" width="650" height="379" /></a></p>
<h2>Skos Play</h2>
<p style="text-align: justify;"><a href="http://labs.sparna.fr/skos-play/">SKOS Play</a> est l&rsquo;outil que je développe depuis 2013 pour faire de la publication et de la visualisation de référentiels SKOS. Il permet de générer des documents PDF des vocabulaires, des sorties HTML dynamiques (arbres dépliables),des listings alphabétiques, des tableaux de traduction ou d&rsquo;alignement, ou des data visualisations. A titre d&rsquo;exemple on pourra consulter les <a href="http://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/">rendus du code Rome de Pôle Emploi en SKOS</a>.</p>
<p style="text-align: justify;">SKOS Play est intégré dans la plateforme de publication des vocabulaires du MCC, et dans celle de l&rsquo;UNESCO, pour la <a href="http://vocabularies.unesco.org/exports/thesaurus/latest/">génération des PDFs</a>. Le service en ligne est quant à lui utilisé plus de <strong>500 fois par mois</strong>.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/code-rome-visualisation-arbre.png"><img class="aligncenter wp-image-1164 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/code-rome-visualisation-arbre-1024x557.png" alt="code-rome-visualisation-arbre" width="650" height="354" /></a></p>
<h1>Conversion Excel, contrôle qualité, alignement</h1>
<h2>Skos Play convert</h2>
<p style="text-align: justify;">SKOS Play inclut un <a href="http://labs.sparna.fr/skos-play/convert">service de génération de données RDF/SKOS depuis des tableaux Excel</a> (voir <a href="http://blog.sparna.fr/2017/01/12/creer-des-referentiels-skosrdf-a-partir-dexcel/">précédent billet</a>).</p>
<p style="text-align: justify;">Soyons honnêtes : <strong>rien ne remplace Excel</strong> <img src="https://blog.sparna.fr/wp-includes/images/smilies/simple-smile.png" alt=":-)" class="wp-smiley" style="height: 1em; max-height: 1em;" /> ! pour de la saisie ou de l&rsquo;analyse de données en masse, avoir une vue globale sur ces données, faire des reporting, gérer facilement plusieurs vocabulaires&#8230; Pas de courbe d&rsquo;apprentissage, pas d&rsquo;outil à installer, grande efficacité de saisie. Et si on utilise un environnement en ligne type Google Sheets, on gagne l&rsquo;aspect collaboratif.<br />
Cette passerelle Excel-RDF-SKOS s&rsquo;est révélée très importante pour faire les reprises ou les créations initiales de vocabulaires, avant de les basculer dans des outils de gestion comme VocBench.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/convert-screenshot-body.png"><img class="aligncenter wp-image-1163 size-full" src="http://blog.sparna.fr/wp-content/uploads/2018/01/convert-screenshot-body.png" alt="convert-screenshot-body" width="1490" height="335" /></a></p>
<h2>Skos Testing Tool : contrôle qualité</h2>
<p style="text-align: justify;">Le <a href="http://labs.sparna.fr/skos-testing-tool/">SKOS Testing Tool</a> est une interface web permettant de valider la conformité de fichiers SKOS (voir <a href="http://blog.sparna.fr/2017/07/11/outil-de-test-de-vocabulaires-skos/">précédent billet</a>). L&rsquo;outil s&rsquo;appuie sur <a href="https://github.com/cmader/qSKOS">qSKOS</a>, qui fonctionne lui en ligne de commande. 27 vérifications peuvent être effectuées sur les données, comme :</p>
<ul style="text-align: justify;">
<li>vérification de l&rsquo;absence de cycle dans la hiérarchie des concepts</li>
<li>vérification que tous les concepts ont bien un prefLabel</li>
<li>vérification que tous les concepts sont traduits (dans le cas de thesaurus multilingues)</li>
<li>&#8230;</li>
</ul>
<p style="text-align: justify;">Combiné avec les sorties alphabétiques/hiérarchiques de SKOS Play, ces vérifications permettent de s&rsquo;assurer de la qualité des données soit en amont lors des comités de validation du vocabulaire, soit en aval avant la diffusion des données en ligne dans Skosmos.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skos-testing-tool.png"><img class="aligncenter wp-image-1172 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skos-testing-tool-1024x715.png" alt="screenshot-skos-testing-tool" width="650" height="454" /></a></p>
<h2>OnaGUI : Alignement semi-automatique</h2>
<p style="text-align: justify;"><a href="https://github.com/lmazuel/onagui">OnaGUI</a> (Ontology Alignment Graphical User Interface) a été développé à l&rsquo;origine à l&rsquo;INSERM dans l&rsquo;équipe de <a href="http://www.limics.fr/fr/annuaire/fiche-membre/voir/18-CHARLET-Jean">Jean Charlet</a> pour faire de l&rsquo;alignement d&rsquo;ontologies médicales, et il a depuis été adapté pour pouvoir aligner des données SKOS.</p>
<p style="text-align: justify;">C&rsquo;est l&rsquo;outil le plus accessible et le plus simple d&rsquo;utilisation pour aligner 2 vocabulaires : on charge un thesaurus à gauche, un thesaurus à droite, et on lance un algorithme d&rsquo;alignement qui va proposer des correspondances sur la base des proximités des libellés des concepts.</p>
<p style="text-align: justify;">On utilise régulièrement OnaGUI pour illustrer les alignements de thesaurus dans les <a href="https://www.adbs.fr/formations/formation-comprendre-web-semantique-et-ontologies-167">formations web de données à l&rsquo;ADBS</a>.</p>
<p style="text-align: justify;">Si on veut utiliser des algorithmes d&rsquo;alignement plus poussés, on se tournera vers l&rsquo;<a href="http://alignapi.gforge.inria.fr/">API d&rsquo;alignement de l&rsquo;INRIA</a>, mais qui demande du développement technique pour être intégrée dans un outil.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet.png"><img class="aligncenter wp-image-1170 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet-1024x582.png" alt="onagui-irstea-gemet" width="650" height="369" /></a></p>
<h2>Quels outils manquent ?</h2>
<p>Quels outils manquent dans l&rsquo;écosystème des vocabulaires dans le web de données ?</p>
<ul>
<li>Probablement des outils faciles à mettre en œuvre pour assister à la <strong>création de vocabulaires à partir d&rsquo;analyse de corpus</strong> (détection d&rsquo;entités, agrégation des mots en concepts, etc.); en connaissez-vous ? <a href="https://www.ibm.com/watson/products-services/">IBM Watson</a> ne ferait pas quelque chose comme ça ?</li>
<li>Des <strong>interfaces d&rsquo;alignement puissantes</strong> faciliteraient la mise en réseau des référentiels (des choses comme <a href="http://cultuurlink.beeldengeluid.nl">cultuurlink</a>, mais généralisées);</li>
<li>Une <strong>gestion des versions successives</strong> des vocabulaires, avec calcul de deltas, génération automatique de ce qui a changé entre 2 versions, etc;</li>
<li>Des <strong>plugins dans les CMS</strong> courants (WordPress, Drupal, etc&#8230;) permettant d&rsquo;importer directement des vocabulaires SKOS, et de les mettre à jour; ça doit bien exister, non ? également des ponts faciles et direct vers SolR et ElasticSearch;</li>
<li>Mon rêve : un <strong>outil d&rsquo;édition des vocabulaires en mode collaboratif et ouvert poussé</strong>, en mode SaaS, sans différence entre l&rsquo;environnement d&rsquo;édition et de publication, permettant de faire collaborer une communauté plus large que quelques éditeurs experts; ça viendra un jour ! <img src="https://blog.sparna.fr/wp-includes/images/smilies/simple-smile.png" alt=":-)" class="wp-smiley" style="height: 1em; max-height: 1em;" /></li>
</ul>
<p><em><strong>Et vous, quels outils vous manquent ?</strong></em></p>
<p><em>(Illustration de l&rsquo;article : &laquo;&nbsp;Atelier Heilmann Ducommun pour la construction de machines-outils&nbsp;&raquo; Gallica <a href="http://gallica.bnf.fr/ark:/12148/btv1b10201510v" target="_blank">http://gallica.bnf.fr/ark:/12148/btv1b10201510v</a>)</em></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/">Vocabulaires dans le web de données : quels outils open-source ?</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
		<item>
		<title>UNESCO Thesaurus published with Semantic Web standards and Open-Source software</title>
		<link>https://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/</link>
		<comments>https://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/#comments</comments>
		<pubDate>Mon, 06 Feb 2017 08:03:10 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[Open Data]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Skosmos]]></category>
		<category><![CDATA[SPARQL]]></category>
		<category><![CDATA[Thesaurus]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1102</guid>
		<description><![CDATA[<p>Sparna conducted in 2016 the replacement of the Thesaurus Management Software and thesaurus publication platform for the UNESCO, with Open-Source tools all relying on Semantic Web technologies. The result is the new UNESCO vocabularies publication platform at http://vocabularies.unesco.org. The project was conducted in 2 phases : a new thesaurus publication platform based on Skosmos, SKOS&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/">UNESCO Thesaurus published with Semantic Web standards and Open-Source software</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;"><a href="http://sparna.fr">Sparna</a> conducted in 2016 the replacement of the Thesaurus Management Software and thesaurus publication platform for the <a href="http://uensco.org">UNESCO</a>, with Open-Source tools all relying on Semantic Web technologies. The result is the <strong>new UNESCO vocabularies publication platform at <a href="http://vocabularies.unesco.org">http://vocabularies.unesco.org</a></strong>. The project was conducted in 2 phases : a new thesaurus publication platform based on <a href="http://skosmos.org/">Skosmos</a>, <a href="http://labs.sparna.fr/skos-play/">SKOS Play</a> and <a href="https://jena.apache.org/documentation/fuseki2/">Fuseki</a>, and in a second phase the deployment of <a href="http://vocbench.uniroma2.it/">VocBench</a> as the new Thesaurus Management Software. The system leverages Semantic Web standards by relying on <a href="https://www.w3.org/TR/2009/REC-skos-reference-20090818/">SKOS</a> as the data exchange format, <a href="https://www.w3.org/TR/sparql11-query/">SPARQL</a> as the online thesaurus query language, and dereferancable URI identifiers.</p>
<h2 style="text-align: justify;"><strong>The new thesaurus browser</strong></h2>
<p style="text-align: justify;">The first objective was to replace the thesaurus publication platform, while maintaining existing backoffice tools for thesaurus management. This choice allowed to quickly demonstrate a publicly available interface for searching and browsing the vocabulary, without waiting for the deployment of the complete system.</p>
<p style="text-align: justify;"><a href="https://github.com/NatLibFi/Skosmos">Skosmos</a> was used as the thesaurus browser; it is easy to deploy, well documented, and the team behind it from the National Library of Finland is super-reactive for fixing bugs. It offers out-of-box features like alphabetical/hierarchical browsing, autocomplete search, URI-based content negociation, and a feedback form. Important aspects for UNESCO were the ability to have a multilingual interface (English, French, Spanish, Russian), the possibility to customize the stylesheets/logo/help page, or the order of the fields in a concept display page. We added a direct link to trigger a search in the UNESDOC database from a concept page in Skosmos, thus easily linking the new thesaurus browser to the existing resource center.</p>
<div id="attachment_1108" style="width: 660px" class="wp-caption aligncenter"><a href="http://blog.sparna.fr/wp-content/uploads/2017/01/screenshot-skosmos-small.png"><img class="wp-image-1108 size-large" src="http://blog.sparna.fr/wp-content/uploads/2017/01/screenshot-skosmos-small-1024x676.png" alt="unesco-skosmos" width="650" height="429" /></a><p class="wp-caption-text">UNESCO thesaurus published in Skosmos</p></div>
<p style="text-align: justify;">2 additionnal components were used for a complete vocabulary publishing solution; <a href="http://labs.sparna.fr/skos-play/">SKOS Play</a> was used to generate <a href="http://vocabularies.unesco.org/exports/thesaurus/latest/">downloadable PDF documents generated from the SKOS thesaurus</a> : complete editions of the thesaurus with alphabetical index, hierarchical tree and translation tables, and KWIC indexes, each in French, English, Spanish and Russian. The documents are regenerated automatically each time a new version of the thesaurus is published. <a href="https://jena.apache.org/documentation/fuseki2/">Fuseki</a> with a customized SPARLQ form is used as the frontend for <a href="http://vocabularies.unesco.org/sparql">public SPARQL querying of the thesaurus</a>.</p>
<p style="text-align: justify;">Meron Ewketu, responsible for the UNESCO thesaurus, describes the benefits of the new publication platform : <em>&laquo;&nbsp;The obvious benefit is the enhanced user interface : a nice hierarchical display, a powerful search, an easy navigation between the different language versions. Thanks to these features <strong>the platform was immediately endorsed by our user community</strong>. </em><em>What is also very much appreciated is the possibility of responding to various user needs in terms of format and content. Being able to extract part of the thesaurus as per our users’ requirements, and being able to deliver the content in a variety of formats, including PDF, using the SPARQL endpoint and SKOS Play. </em><em>We have also noticed an <strong>increase in user participation</strong>. The feedback form enabled us to engage with our users more easily.</em>&laquo;&nbsp;</p>
<h2 style="text-align: justify;">The Collaborative Thesaurus Management Software</h2>
<p style="text-align: justify;">The second phase of the project aimed at replacing the old thesaurus management software, and integrating it with the new thesaurus browser. UNESCO and Sparna chose to deploy <a href="http://vocbench.uniroma2.it/">VocBench</a>, an open-source SKOS-based thesaurus management solution from the Tor Vergata University in Rome. We also considered <a href="https://github.com/culturecommunication/ginco">Ginco</a> as a possible alternative; VocBench was chosen mainly for its ability to properly handle collaborative multi-user maintenance of the thesaurus; this was an important aspect for UNESCO, having remote contributors to the thesaurus in Russia, and translations in Chinese and Arabic coming in the future; the ability to work remotely and to have a validation workflow of the modifications was essential. In addition, <a href="http://vocbench.uniroma2.it/support/community.jsf">Vocbench is already deployed by other international organizations</a>, and the <a href="https://groups.google.com/d/msg/vocbench-user/S2Nn05osD24/onVn30AhBgAJ">upcoming v3 of Vocbench</a> is funded by the ISA2 program of the European Union, thus giving garantees as to the maintenance of the application in the next few years.</p>
<div id="attachment_1109" style="width: 660px" class="wp-caption aligncenter"><a href="http://blog.sparna.fr/wp-content/uploads/2017/01/screenshot-vocbench.png"><img class="wp-image-1109 size-large" src="http://blog.sparna.fr/wp-content/uploads/2017/01/screenshot-vocbench-1024x510.png" alt="unesco-vocbench" width="650" height="324" /></a><p class="wp-caption-text">UNESCO Thesaurus managed in VocBench</p></div>
<p style="text-align: justify;">VocBench is SKOS-XL from the bottom up and stores the thesaurus data in an RDF triplestore. We chose to deploy <a href="http://graphdb.ontotext.com/">GraphDB from Ontotext</a> as the backend for VocBench. VocBench offers user profile management and edition workflow management, multilingual thesaurus editing, and the possibility to add custom attributes to the thesaurus concepts and terms. We used this to capture corresponding country codes and language codes for certain concepts in the UNESCO thesaurus with a small <a href="http://vocabularies.unesco.org/ontology/">UNESCO vocabulary publishing ontology</a> describing these 2 properties.</p>
<p style="text-align: justify;">The deployment in production of Vocbench is fairly complex, essentially due to the middleware component on which it relies, called <a href="http://semanticturkey.uniroma2.it/">SemanticTurkey</a>; VocBench requires a total of 4 pieces of software (relationnal database, RDF triplestore, SemanticTurkey server, VocBench application server). But, once you are familiar with the procedure, and again with the precious help of the community on th <a href="https://groups.google.com/forum/#!forum/vocbench-user">mailing-list</a>, everything works fine. Another limitation of VocBench v2 is that it does not support SKOS Collections, only ConceptSchemes.</p>
<p style="text-align: justify;">Ms Ewketu explains the benefits of VocBench : &laquo;&nbsp;A<em>part from the obvious functionalities of collaborative and distributed maintenance, other important aspects for us were the ability to <strong>manage several vocabularies</strong> and the ability to <strong>make alignments with other thesauri</strong>. </em><em>Being able to document changes through history notes is something very interesting, which I am sure we will exploit in the future. This is quite interesting for researchers who study the evolution of terminology, within an organization.</em>&laquo;&nbsp;</p>
<h2 style="text-align: justify;"><em>&laquo;&nbsp;<strong>leverage the thesaurus to achieve interoperability</strong>&laquo;&nbsp;</em></h2>
<p style="text-align: justify;">The project clearly is a success story for Semantic Web technologies : with URIs, RDF and SKOS as W3C standards, the <strong>UNESCO has achieved its mission of transforming its thesaurus into open, reusable data</strong>. The thesaurus is now available for browsing by humans and in machine-readable formats. URIs makes it open for linking from/to other knowledge organization systems on the web, thus enabling interoperability between document databases of multiple organizations.</p>
<p style="text-align: justify;">The project is also a great success story for Open Source; the support from the community and the maintainers of both Skosmos and VocBench was essential for such a quality achievement, and Sparna and UNESCO contributed to both communities by providing translations, filing bug reports and testing new versions. It shows how these tools have enabled the UNESCO to replace an entire thesaurus management platform with <strong>no licensing cost, no vendor or data lock-in</strong>.</p>
<p style="text-align: justify;">&laquo;&nbsp;<em><strong>The main benefit of this project for us will be to leverage the thesaurus to achieve interoperability</strong> between our different repositories, as well as with external datasets.&nbsp;&raquo; c</em>oncludes Ms Ewketu from UNESCO.<em> &laquo;&nbsp;We are currently working on integrating the new thesaurus within the various information systems. Next phase will be mapping our thesaurus with vocabularies such as the <a href="https://lib-thesaurus.un.org/LIB/DHLUNBISThesaurus.nsf/zHelpDocuments/English+About+Help?OpenDocument">UN Thesaurus</a> and <a href="http://eurovoc.europa.eu/">Eurovoc</a>.&nbsp;&raquo;</em></p>
<hr />
<p style="text-align: justify;"><em>Want to learn more ? reach me at thomas /dot/ francart /at/ sparna /dot/ fr. </em></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/">UNESCO Thesaurus published with Semantic Web standards and Open-Source software</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/feed/</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
	</channel>
</rss>
