<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sparna Blog &#187; onagui</title>
	<atom:link href="https://blog.sparna.fr/tag/onagui/feed/" rel="self" type="application/rss+xml" />
	<link>https://blog.sparna.fr</link>
	<description>Web de données &#124; Architecture de l&#039;information &#124; Accès aux connaissances</description>
	<lastBuildDate>Tue, 03 Jun 2025 10:30:27 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
	<item>
		<title>Aligner son thesaurus avec RAMEAU en utilisant OnAGUI</title>
		<link>https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/</link>
		<comments>https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/#comments</comments>
		<pubDate>Tue, 17 Jul 2018 08:56:09 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Editeurs]]></category>
		<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[OnAGUI]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[alignement]]></category>
		<category><![CDATA[bnf]]></category>
		<category><![CDATA[data.bnf.fr]]></category>
		<category><![CDATA[mapping]]></category>
		<category><![CDATA[onagui]]></category>
		<category><![CDATA[Rameau]]></category>
		<category><![CDATA[thesaurus]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1212</guid>
		<description><![CDATA[<p>La BNF organisait le 10 juillet 2018 un atelier &#171;&#160;Données liées et données à lier : quels outils pour quels alignements ?&#171;&#160;, avec plein de bonnes choses dedans : RobotDonnées, le module développé par Logilab pour data.bnf.fr qui permet le regroupement semi-automatique des éditions en œuvres; où l&#8217;on apprend que data.bnf.fr ne comporte &#171;&#160;que&#160;&#187; 300&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/">Aligner son thesaurus avec RAMEAU en utilisant OnAGUI</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">La BNF organisait le 10 juillet 2018 un <a href="https://bnf.hypotheses.org/3077">atelier &laquo;&nbsp;<em>Données liées et données à lier : quels outils pour quels alignements ?</em>&laquo;&nbsp;</a>, avec plein de bonnes choses dedans :</p>
<ul>
<li style="text-align: justify;">RobotDonnées, le module développé par Logilab pour data.bnf.fr qui permet le regroupement semi-automatique des éditions en œuvres;
<ul>
<li>où l&rsquo;on apprend que <a href="http://data.bnf.fr">data.bnf.fr</a> ne comporte &laquo;&nbsp;que&nbsp;&raquo; 300 000 œuvres, alors que la cible théorique serait à plusieurs millions; par exemple on voit bien en regardant <a href="http://data.bnf.fr/12249911/michel_houellebecq/#rdt70-12249911">les oeuvres dont Michel Houellebecq est auteur dans data.bnf.fr</a> que &laquo;&nbsp;<em>La carte et le territoire</em>&nbsp;&raquo; n’apparaît pas comme œuvre, mais que toutes les éditions de cet ouvrage sont bien listées quand on regarde <a href="http://data.bnf.fr/documents-by-rdt/12249911/70/page1">tous les documents dont Houellebecq est l&rsquo;auteur</a>.</li>
<li>où l&rsquo;on apprend également que ce regroupement en œuvre est progressivement réintroduit dans le catalogue général de la BNF;</li>
</ul>
</li>
<li style="text-align: justify;">BiblioStratus, pour aligner un catalogue externe avec celui de la BNF sur la base de plusieurs heuristiques (ISBN, EAN ou bien titre+auteur+date ou titre+auteur); où l&rsquo;on apprend que la transition n&rsquo;est pas qu&rsquo;écologique mais qu&rsquo;il existe également une <a href="https://www.transition-bibliographique.fr/17-06-20-notice-bibliographique-manifestation-notice-autorite-titre-oeuvre/">transition bibliographique</a>;</li>
<li style="text-align: justify;">l&rsquo;ANR <a href="https://project.inria.fr/elker/">ELKER</a> pour &laquo;&nbsp;Enhancing Link Keys: Extraction and Reasoning&nbsp;&raquo;, porté notamment par l&rsquo;INRIA Grenoble pour la détection automatique des attributs permettant de trouver des correspondances dans 2 jeux de données RDF arbitraires; très impressionnant;</li>
<li style="text-align: justify;"><a href="http://cultuurlink.beeldengeluid.nl">CultuurLink</a>, à tester pour tous ceux qui s&rsquo;intéressent aux processus d&rsquo;alignement de vocabulaires, bien que l&rsquo;outil soit restreint aux vocabulaires patrimoniaux des Pays-Bas;</li>
<li style="text-align: justify;"><em>et encore plein d&rsquo;autres choses (cf les liens sur la page de l&rsquo;atelier);</em></li>
</ul>
<h2 style="text-align: justify;">OnAGUI pour aligner 2 thesaurus SKOS</h2>
<p style="text-align: justify;">Je voulais profiter de cette thématique des alignements pour parler d&rsquo;un autre outil d&rsquo;alignement de thesaurus SKOS : <strong><a href="https://github.com/lmazuel/onagui">OnAGUI</a> </strong>pour &laquo;&nbsp;<em>Ontology Alignment Graphical Interface</em>&laquo;&nbsp;. OnAGUI est le genre d&rsquo;outil qui ne paie pas de mine au premier abord mais qui est à mon avis<strong> l&rsquo;outil dont la prise en main est la plus immédiate pour qui veut aligner 2 thesaurus en SKOS, </strong>tout en permettant d&rsquo;<strong>outiller le processus depuis l&rsquo;alignement linguistique automatique jusqu&rsquo;à la validation manuelle de l&rsquo;alignement produit</strong>.</p>
<div id="attachment_1170" style="width: 660px" class="wp-caption aligncenter"><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet.png"><img class="size-large wp-image-1170" src="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet-1024x582.png" alt="L'interface d'OnAGUI pour aligner 2 thesaurus" width="650" height="369" /></a><p class="wp-caption-text">L&rsquo;interface d&rsquo;OnAGUI pour aligner 2 thesaurus</p></div>
<p style="text-align: justify;">Quelques considérations générales : d&rsquo;abord l&rsquo;acronyme parle d&rsquo;alignement d&rsquo; &laquo;&nbsp;ontologies&nbsp;&raquo;, mais pas de panique, ça marche pour des <strong>thesaurus en SKOS</strong>; surtout pour des thesaurus en SKOS, d&rsquo;ailleurs. Ensuite, c&rsquo;est <strong>open-source</strong>; ça s&rsquo;installe facilement sur n&rsquo;importe quel poste équipé de Java, c&rsquo;est une <strong>application &laquo;&nbsp;de bureau&nbsp;&raquo;</strong>, qui ne nécessite pas d&rsquo;infrastructure client-serveur, etc. l&rsquo;interface est en <strong>français</strong> (et anglais) puisque le développement à été fait par <a href="https://github.com/lmazuel">Laurent Mazuel</a> à l&rsquo;époque où il travaillait avec <a href="http://www.limics.fr/fr/annuaire/fiche-membre/voir/18-CHARLET-Jean">Jean Charlet</a> au <a href="http://www.limics.fr/fr/">LIMICS</a> (INSERM). L&rsquo;outil est maintenu, notamment par votre serviteur.</p>
<p style="text-align: justify;">Vous pouvez consulter la <a href="https://github.com/lmazuel/onagui/wiki">documentation d&rsquo;OnAGUI</a> où vous trouverez des informations plus détaillées sur le logiciel.</p>
<h2 style="text-align: justify;">Alignement avec RAMEAU</h2>
<p style="text-align: justify;">Maintenant, le cas d&rsquo;usage : il m&rsquo;ait arrivé de rencontrer des personnes qui avaient besoin d&rsquo;<strong>aligner un vocabulaire vers le <a href="http://rameau.bnf.fr/">langage d&rsquo;indexation RAMEAU de la BNF</a></strong>. Comment faire ?</p>
<ol>
<li style="text-align: justify;">Je ne détaille pas ici la structure de RAMEAU et son mécanisme de &laquo;&nbsp;vedettes-matières pré-coordonnées&nbsp;&raquo; que je ne connais pas bien d&rsquo;ailleurs, mais je pars (naïvement) de ce qui existe : le fichier des Thèmes Rameau que l&rsquo;on télécharge depuis le site des <a href="http://api.bnf.fr/dumps-de-databnffr">dumps de données de la BNF</a>. Il s&rsquo;agit du fichier intitulé &laquo;&nbsp;<a href="ftp://databnf:databnf@pef.bnf.fr/DATA/databnf_rameau_xml.tar.gz">[RDF/XML] Thèmes RAMEAU</a>&laquo;&nbsp;.</li>
<li style="text-align: justify;">A ce stade il faut l&rsquo;avouer : <em>la BNF a encore des efforts à faire sur diffusion des données de RAMEAU</em>; les données telles qu&rsquo;on les télécharge sont inutilisables telles qu&rsquo;elles, et nécessitent : 1/ un nettoyage et 2/ une fusion en un seul fichier; je ne m&rsquo;étends pas sur cette étape que j&rsquo;ai réalisé à l&rsquo;aide de scripts <a href="http://rdf4j.org">RDF4J</a> dont je me sers régulièrement, mais on se ramène au final à un seul fichier RDF contenant tout RAMEAU en SKOS; si vous voulez tester OnAGUI sur un autre vocabulaire ne nécessitant pas cette étape de &laquo;&nbsp;magie noire&nbsp;&raquo;, essayez avec <a href="http://vocabularies.unesco.org/browser/en/about">le thesaurus de l&rsquo;UNESCO</a> ou <a href="http://data.europa.eu/euodp/fr/data/dataset/eurovoc">Eurovoc</a>;</li>
<li style="text-align: justify;">Il faut ensuite avoir son propre thesaurus en SKOS; on peut utiliser pour cela l&rsquo;<a href="http://labs.sparna.fr/skos-play/convert">outil de conversion Excel vers SKOS disponible dans SKOS Play</a>;</li>
<li style="text-align: justify;">Il faut <a href="https://github.com/lmazuel/onagui/releases">télécharger OnAGUI</a> en prenant soin de prendre une version postérieure à 0.3.2, version pour laquelle des améliorations ont été apportées pour fonctionner avec RAMEAU;</li>
<li>Muni donc de votre vocabulaire en SKOS d&rsquo;un côté, de RAMEAU (nettoyé) de l&rsquo;autre, et d&rsquo;OnAGUI entre les deux, vous pouvez ensuite :
<ol>
<li style="text-align: justify;">Charger votre thesaurus dans OnaGUI (Menu &laquo;&nbsp;Fichier &gt; Charger vocabulaire 1 &gt; Charger en SKOS&nbsp;&raquo;);</li>
<li style="text-align: justify;">Charger RAMEAU dans OnaGUI (Menu &laquo;&nbsp;Fichier &gt; Charger vocabulaire 2 &gt; Charger en SKOS&nbsp;&raquo;), qui va vaillamment charger 160000+ concepts;</li>
<li style="text-align: justify;">Lancer un alignement linguistique (Menu &laquo;&nbsp;Alignement &gt; I-Sub distance&nbsp;&raquo;) en prenant soin de :
<ol>
<li>sélectionner la langue &laquo;&nbsp;fr&nbsp;&raquo; dans les 2 thesaurus;</li>
<li>abaisser légèrement le seuil de tolérance de l&rsquo;algorithme, en le mettant à 0.85 par exemple; ne le mettez pas trop bas sinon vous aurez trop de correspondances qui ne veulent rien dire, ni trop haut sinon vous allez rater des choses;</li>
</ol>
</li>
<li style="text-align: justify;">Aller prendre un petit café, ou deux, ou trois&#8230; en fonction de la taille du vocabulaire que vous avez besoin d&rsquo;aligner; patientez entre quelques secondes et une nuit entière;</li>
<li style="text-align: justify;">Analyser le tableau de résultat fourni et soit :
<ol>
<li>supprimer des lignes de correspondances fausses; regardez le score de chaque correspondance : plus le score tend vers 1, meilleure est la correspondance linguisitique, plus le score diminue, plus les libellés sont éloignés;</li>
<li>ajouter des nouvelles correspondances qui auraient été ratées;</li>
</ol>
</li>
<li style="text-align: justify;">Puis exporter l&rsquo;alignement (Menu &laquo;&nbsp;Fichier &gt; Exporter l&rsquo;alignemenr&nbsp;&raquo;) soit dans un format RDF <a href="http://alignapi.gforge.inria.fr/edoal.html">EDOAL</a>, le plus expressif, soit avec les <a href="https://www.w3.org/TR/2009/REC-skos-reference-20090818/#mapping">propriétés d&rsquo;alignement SKOS</a>, soit en CSV pour une analyse dans un tableur;</li>
</ol>
</li>
</ol>
<div id="attachment_1216" style="width: 537px" class="wp-caption aligncenter"><a href="http://blog.sparna.fr/wp-content/uploads/2018/07/onagui-rameau.png"><img class="wp-image-1216 size-full" src="http://blog.sparna.fr/wp-content/uploads/2018/07/onagui-rameau.png" alt="Vocabulaire Rameau dans OnaGUI" width="527" height="903" /></a><p class="wp-caption-text">Vocabulaire Rameau chargé dans OnaGUI</p></div>
<p>&nbsp;</p>
<p style="text-align: justify;">OnAGUI est un outil perfectible sur bien des aspects mais qui permet de valider &laquo;&nbsp;pour de vrai&nbsp;&raquo; des alignements sur des vrais projets, sans besoin d&rsquo;infrastructure compliquée ou d&rsquo;outil commercial. J&rsquo;ai pu le mettre en œuvre à 2 reprises : pour l&rsquo;alignement du <a href="https://vocabulaires.irstea.fr/">thesaurus de l&rsquo;IRSTEA</a> vers le <a href="http://www.eionet.europa.eu/gemet/en/themes/">GEMET</a> et <a href="http://aims.fao.org/vest-registry/vocabularies/agrovoc">Agrovoc</a>, et plus récemment pour un essai d&rsquo;alignement du <a href="http://data.legilux.public.lu/vocabulaires/legal-subject-theme/fr/">vocabulaire thématique d&rsquo;indexation de la loi Luxembourgeoise</a> avec le <a href="http://eurovoc.europa.eu/">thesaurus Eurovoc</a> utilisé au niveau européen, sur la base de l&rsquo;analyse des <a href="https://fr.wikipedia.org/wiki/Transposition_(droit)">transpositions des directives européennes</a> dans la loi nationale. Il peut également prendre en charger des cas d&rsquo;usage d&rsquo;<em>alignement partiel</em>, en alignant seulement les concepts créés ou modifiés après une certaine date, de façon à ne pas à avoir à refaire l&rsquo;intégralité de l&rsquo;alignement à chaque nouvelle version du thesaurus.</p>
<p style="text-align: justify;">Si vous avez des questions, des cas d&rsquo;usage ou des retours d&rsquo;expérience sur OnAGUI, n&rsquo;hésitez pas à <a href="https://github.com/lmazuel/onagui/issues">soumettre des tickets dans le site du projet</a>.</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/">Aligner son thesaurus avec RAMEAU en utilisant OnAGUI</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Vocabulaires dans le web de données : quels outils open-source ?</title>
		<link>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/</link>
		<comments>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/#comments</comments>
		<pubDate>Tue, 23 Jan 2018 10:43:08 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Editeurs]]></category>
		<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[OnAGUI]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Skosmos]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[ginco]]></category>
		<category><![CDATA[onagui]]></category>
		<category><![CDATA[opentheso]]></category>
		<category><![CDATA[skos play]]></category>
		<category><![CDATA[skos testing tool]]></category>
		<category><![CDATA[skosmos]]></category>
		<category><![CDATA[vocbench]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1157</guid>
		<description><![CDATA[<p>Je travaille régulièrement sur des projets de gestion et/ou de mise en ligne de vocabulaires (thesaurus, taxonomies) en SKOS : pour l&#8217;UNESCO &#8211; voir le précédent billet -, l&#8217;INED (thesaurus Popin), le Luxembourg, l&#8217;IRSTEA ou le Réseau Canopé (vocabulaire ScolomFr). Ces projets sont réalisés en utilisant de l&#8217;open-source sur toute la chaîne, depuis le back-office&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/">Vocabulaires dans le web de données : quels outils open-source ?</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">Je travaille régulièrement sur des <strong>projets de gestion et/ou de mise en ligne de vocabulaires (thesaurus, taxonomies)</strong> en <a href="http://www.sparna.fr/skos/SKOS-traduction-francais.html">SKOS</a> : pour l&rsquo;<a href="http://vocabularies.unesco.org">UNESCO</a> &#8211; voir le <a href="http://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/">précédent billet</a> -, l&rsquo;<a href="https://www.ined.fr/">INED</a> (thesaurus Popin), le <a href="http://data.legilux.public.lu/">Luxembourg</a>, l&rsquo;<a href="http://irstea.fr">IRSTEA</a> ou le <a href="https://www.reseau-canope.fr/">Réseau Canopé</a> (vocabulaire <a href="https://www.reseau-canope.fr/scolomfr/accueil.html">ScolomFr</a>). Ces projets sont réalisés en utilisant de l&rsquo;open-source sur toute la chaîne, depuis le back-office de gestion jusqu&rsquo;à la diffusion conforme aux standards du web de données, en passant par l&rsquo;alignement ou la conversion depuis des tableaux Excel.</p>
<p>&nbsp;</p>
<p style="text-align: justify;"><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees.jpg"><img class=" wp-image-1158 size-full aligncenter" src="http://blog.sparna.fr/wp-content/uploads/2018/01/Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees.jpg" alt="Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees" width="960" height="720" /></a></p>
<p style="text-align: justify;">Je vous propose un petit <strong>tour d&rsquo;horizon des outils open-source pour la gestion et la diffusion de vocabulaires contrôlés</strong>.</p>
<h1>Outils de gestion</h1>
<h2>Vocbench3</h2>
<p style="text-align: justify;"><a href="http://vocbench.uniroma2.it/">Vocbench3</a> est l&rsquo;outil de gestion de référentiels SKOS que je recommande. Il est développé par l&rsquo;Université de Rome Tor-Vergata, et financé pour 1 ou 2 année encore par le programme de financement européen ISA, ce qui lui donne une bonne visibilité à moyen terme. La <a href="http://vocbench.uniroma2.it/support/community.jsf">communauté d&rsquo;utilisateurs</a> est large avec beaucoup d&rsquo;organismes internationaux (FAO/<a href="http://aims.fao.org/vest-registry/vocabularies/agrovoc-multilingual-agricultural-thesaurus">Agrovoc</a>, INRA, Office des Publications de l&rsquo;UE/<a href="http://eurovoc.europa.eu/">Eurovoc</a>, etc.). Le support est bon, l&rsquo;équipe de développement répond rapidement aux questions.</p>
<p style="text-align: justify;">Coté technique, il est directement basé sur des données RDF, ce qui facilite son intégration dans des environnements techniques basés sur le web de données. Le modèle de données est extensible et permet de gérer des propriétés &laquo;&nbsp;customisées&nbsp;&raquo; sur les concepts. Vocbench permet également d&rsquo;éditer des ontologies OWL, sans arriver à concurrencer <a href="https://protege.stanford.edu/">Protégé</a>.</p>
<p style="text-align: justify;"><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/td_eurovoc_show.png"><img class="aligncenter wp-image-1166 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/td_eurovoc_show-1024x646.png" alt="td_eurovoc_show" width="650" height="410" /></a></p>
<h2 style="text-align: justify;">Ginco</h2>
<p style="text-align: justify;"><a href="https://github.com/culturecommunication/ginco">Ginco</a> est l&rsquo;outil de gestion de vocabulaires développé par le Ministère de la Culture pour la maintenance de ses référentiels. Il a été dès le départ spécifié pour être compatible avec la norme <a href="http://dossierdoc.typepad.com/descripteurs/2011/08/norme-iso-25964-1-thesaurus-publication-officielle.html">ISO-25964</a> sur la modélisation des thesaurus, et avec SKOS. Donc en particulier la gestion des facettes, des tableaux de concepts, etc. Il a un pendant &laquo;&nbsp;<a href="https://github.com/culturecommunication/ginco-diff">Ginco diffusion</a>&nbsp;&raquo; qui motorise le <a href="http://data.culture.fr/thesaurus/">site de diffusion des vocabulaires du MCC</a>.</p>
<h2 style="text-align: justify;">OpenTheso</h2>
<p style="text-align: justify;"><a href="https://github.com/miledrousset/opentheso">OpenTheso</a> est l&rsquo;outil de gestion SKOS <em>made in</em> CNRS. La communauté d&rsquo;utilisateurs est dans le monde de la recherche française/francophone (notamment le réseau <a href="https://www.frantiq.fr/">FRANTIQ</a>).<br />
On pourra consulter la <a href="http://semweb.pro/semwebpro-2017.html#p3">présentation d&rsquo;OpenTheso à semweb.pro 2017 par Miled Rousset</a>.</p>
<h1>Outils de Publication et Visualisation de vocabulaires</h1>
<h2>Skosmos</h2>
<p style="text-align: justify;">Vous voulez <strong>valoriser vos vocabulaires/thesaurus/taxonomies</strong> ? Vous avez besoin des les rendre visibles, navigables, interrogeables par les utilisateurs ? Vous voulez recevoir du feedback, faire participer une communauté ? <a href="http://skosmos.org/">Skosmos</a> est l&rsquo;outil de choix.<br />
Développé par la Bibliothèque Nationale de Finlande pour son portail &laquo;&nbsp;<a href="http://finto.fi">finto.fi</a>&nbsp;&raquo; (parlez-vous finnois ?), Skosmos propose une interface de rendu très propre avec toutes les fonctions de navigation dans des vocabulaires contrôlés : listes alphabétiques, arborescence hiérarchique, recherche plain-texte avec autocompletion, gestion des groupes/collections SKOS, affichage propre des alignements avec d&rsquo;autres vocabulaires. Il s&rsquo;adapte assez facilement pour le mettre aux couleurs de l&rsquo;institution. Il prend en charge la négociation de contenu pour l&rsquo;accès aux données brutes en RDF. L&rsquo;interface inclut également un formulaire permettant d&rsquo;envoyer du feedback à l&rsquo;équipe de maintenance du thesaurus.</p>
<p style="text-align: justify;">L&rsquo;équipe de développement répond très vite aux questions, le code PHP est de qualité, l&rsquo;outil est vivant et de nouvelles versions sont disponibles régulièrement.</p>
<p style="text-align: justify;">Skosmos est à mon sens <strong>LE meilleur outil pour la diffusion de vocabulaires en SKOS</strong>.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skosmos-finto.png"><img class="aligncenter wp-image-1168 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skosmos-finto-1024x597.png" alt="screenshot-skosmos-finto" width="650" height="379" /></a></p>
<h2>Skos Play</h2>
<p style="text-align: justify;"><a href="http://labs.sparna.fr/skos-play/">SKOS Play</a> est l&rsquo;outil que je développe depuis 2013 pour faire de la publication et de la visualisation de référentiels SKOS. Il permet de générer des documents PDF des vocabulaires, des sorties HTML dynamiques (arbres dépliables),des listings alphabétiques, des tableaux de traduction ou d&rsquo;alignement, ou des data visualisations. A titre d&rsquo;exemple on pourra consulter les <a href="http://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/">rendus du code Rome de Pôle Emploi en SKOS</a>.</p>
<p style="text-align: justify;">SKOS Play est intégré dans la plateforme de publication des vocabulaires du MCC, et dans celle de l&rsquo;UNESCO, pour la <a href="http://vocabularies.unesco.org/exports/thesaurus/latest/">génération des PDFs</a>. Le service en ligne est quant à lui utilisé plus de <strong>500 fois par mois</strong>.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/code-rome-visualisation-arbre.png"><img class="aligncenter wp-image-1164 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/code-rome-visualisation-arbre-1024x557.png" alt="code-rome-visualisation-arbre" width="650" height="354" /></a></p>
<h1>Conversion Excel, contrôle qualité, alignement</h1>
<h2>Skos Play convert</h2>
<p style="text-align: justify;">SKOS Play inclut un <a href="http://labs.sparna.fr/skos-play/convert">service de génération de données RDF/SKOS depuis des tableaux Excel</a> (voir <a href="http://blog.sparna.fr/2017/01/12/creer-des-referentiels-skosrdf-a-partir-dexcel/">précédent billet</a>).</p>
<p style="text-align: justify;">Soyons honnêtes : <strong>rien ne remplace Excel</strong> <img src="https://blog.sparna.fr/wp-includes/images/smilies/simple-smile.png" alt=":-)" class="wp-smiley" style="height: 1em; max-height: 1em;" /> ! pour de la saisie ou de l&rsquo;analyse de données en masse, avoir une vue globale sur ces données, faire des reporting, gérer facilement plusieurs vocabulaires&#8230; Pas de courbe d&rsquo;apprentissage, pas d&rsquo;outil à installer, grande efficacité de saisie. Et si on utilise un environnement en ligne type Google Sheets, on gagne l&rsquo;aspect collaboratif.<br />
Cette passerelle Excel-RDF-SKOS s&rsquo;est révélée très importante pour faire les reprises ou les créations initiales de vocabulaires, avant de les basculer dans des outils de gestion comme VocBench.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/convert-screenshot-body.png"><img class="aligncenter wp-image-1163 size-full" src="http://blog.sparna.fr/wp-content/uploads/2018/01/convert-screenshot-body.png" alt="convert-screenshot-body" width="1490" height="335" /></a></p>
<h2>Skos Testing Tool : contrôle qualité</h2>
<p style="text-align: justify;">Le <a href="http://labs.sparna.fr/skos-testing-tool/">SKOS Testing Tool</a> est une interface web permettant de valider la conformité de fichiers SKOS (voir <a href="http://blog.sparna.fr/2017/07/11/outil-de-test-de-vocabulaires-skos/">précédent billet</a>). L&rsquo;outil s&rsquo;appuie sur <a href="https://github.com/cmader/qSKOS">qSKOS</a>, qui fonctionne lui en ligne de commande. 27 vérifications peuvent être effectuées sur les données, comme :</p>
<ul style="text-align: justify;">
<li>vérification de l&rsquo;absence de cycle dans la hiérarchie des concepts</li>
<li>vérification que tous les concepts ont bien un prefLabel</li>
<li>vérification que tous les concepts sont traduits (dans le cas de thesaurus multilingues)</li>
<li>&#8230;</li>
</ul>
<p style="text-align: justify;">Combiné avec les sorties alphabétiques/hiérarchiques de SKOS Play, ces vérifications permettent de s&rsquo;assurer de la qualité des données soit en amont lors des comités de validation du vocabulaire, soit en aval avant la diffusion des données en ligne dans Skosmos.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skos-testing-tool.png"><img class="aligncenter wp-image-1172 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skos-testing-tool-1024x715.png" alt="screenshot-skos-testing-tool" width="650" height="454" /></a></p>
<h2>OnaGUI : Alignement semi-automatique</h2>
<p style="text-align: justify;"><a href="https://github.com/lmazuel/onagui">OnaGUI</a> (Ontology Alignment Graphical User Interface) a été développé à l&rsquo;origine à l&rsquo;INSERM dans l&rsquo;équipe de <a href="http://www.limics.fr/fr/annuaire/fiche-membre/voir/18-CHARLET-Jean">Jean Charlet</a> pour faire de l&rsquo;alignement d&rsquo;ontologies médicales, et il a depuis été adapté pour pouvoir aligner des données SKOS.</p>
<p style="text-align: justify;">C&rsquo;est l&rsquo;outil le plus accessible et le plus simple d&rsquo;utilisation pour aligner 2 vocabulaires : on charge un thesaurus à gauche, un thesaurus à droite, et on lance un algorithme d&rsquo;alignement qui va proposer des correspondances sur la base des proximités des libellés des concepts.</p>
<p style="text-align: justify;">On utilise régulièrement OnaGUI pour illustrer les alignements de thesaurus dans les <a href="https://www.adbs.fr/formations/formation-comprendre-web-semantique-et-ontologies-167">formations web de données à l&rsquo;ADBS</a>.</p>
<p style="text-align: justify;">Si on veut utiliser des algorithmes d&rsquo;alignement plus poussés, on se tournera vers l&rsquo;<a href="http://alignapi.gforge.inria.fr/">API d&rsquo;alignement de l&rsquo;INRIA</a>, mais qui demande du développement technique pour être intégrée dans un outil.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet.png"><img class="aligncenter wp-image-1170 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet-1024x582.png" alt="onagui-irstea-gemet" width="650" height="369" /></a></p>
<h2>Quels outils manquent ?</h2>
<p>Quels outils manquent dans l&rsquo;écosystème des vocabulaires dans le web de données ?</p>
<ul>
<li>Probablement des outils faciles à mettre en œuvre pour assister à la <strong>création de vocabulaires à partir d&rsquo;analyse de corpus</strong> (détection d&rsquo;entités, agrégation des mots en concepts, etc.); en connaissez-vous ? <a href="https://www.ibm.com/watson/products-services/">IBM Watson</a> ne ferait pas quelque chose comme ça ?</li>
<li>Des <strong>interfaces d&rsquo;alignement puissantes</strong> faciliteraient la mise en réseau des référentiels (des choses comme <a href="http://cultuurlink.beeldengeluid.nl">cultuurlink</a>, mais généralisées);</li>
<li>Une <strong>gestion des versions successives</strong> des vocabulaires, avec calcul de deltas, génération automatique de ce qui a changé entre 2 versions, etc;</li>
<li>Des <strong>plugins dans les CMS</strong> courants (WordPress, Drupal, etc&#8230;) permettant d&rsquo;importer directement des vocabulaires SKOS, et de les mettre à jour; ça doit bien exister, non ? également des ponts faciles et direct vers SolR et ElasticSearch;</li>
<li>Mon rêve : un <strong>outil d&rsquo;édition des vocabulaires en mode collaboratif et ouvert poussé</strong>, en mode SaaS, sans différence entre l&rsquo;environnement d&rsquo;édition et de publication, permettant de faire collaborer une communauté plus large que quelques éditeurs experts; ça viendra un jour ! <img src="https://blog.sparna.fr/wp-includes/images/smilies/simple-smile.png" alt=":-)" class="wp-smiley" style="height: 1em; max-height: 1em;" /></li>
</ul>
<p><em><strong>Et vous, quels outils vous manquent ?</strong></em></p>
<p><em>(Illustration de l&rsquo;article : &laquo;&nbsp;Atelier Heilmann Ducommun pour la construction de machines-outils&nbsp;&raquo; Gallica <a href="http://gallica.bnf.fr/ark:/12148/btv1b10201510v" target="_blank">http://gallica.bnf.fr/ark:/12148/btv1b10201510v</a>)</em></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/">Vocabulaires dans le web de données : quels outils open-source ?</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
	</channel>
</rss>
