<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sparna Blog &#187; Rameau</title>
	<atom:link href="https://blog.sparna.fr/tag/rameau/feed/" rel="self" type="application/rss+xml" />
	<link>https://blog.sparna.fr</link>
	<description>Web de données &#124; Architecture de l&#039;information &#124; Accès aux connaissances</description>
	<lastBuildDate>Tue, 03 Jun 2025 10:30:27 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
	<item>
		<title>Aligner son thesaurus avec RAMEAU en utilisant OnAGUI</title>
		<link>https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/</link>
		<comments>https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/#comments</comments>
		<pubDate>Tue, 17 Jul 2018 08:56:09 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Editeurs]]></category>
		<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[OnAGUI]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[alignement]]></category>
		<category><![CDATA[bnf]]></category>
		<category><![CDATA[data.bnf.fr]]></category>
		<category><![CDATA[mapping]]></category>
		<category><![CDATA[onagui]]></category>
		<category><![CDATA[Rameau]]></category>
		<category><![CDATA[thesaurus]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1212</guid>
		<description><![CDATA[<p>La BNF organisait le 10 juillet 2018 un atelier &#171;&#160;Données liées et données à lier : quels outils pour quels alignements ?&#171;&#160;, avec plein de bonnes choses dedans : RobotDonnées, le module développé par Logilab pour data.bnf.fr qui permet le regroupement semi-automatique des éditions en œuvres; où l&#8217;on apprend que data.bnf.fr ne comporte &#171;&#160;que&#160;&#187; 300&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/">Aligner son thesaurus avec RAMEAU en utilisant OnAGUI</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">La BNF organisait le 10 juillet 2018 un <a href="https://bnf.hypotheses.org/3077">atelier &laquo;&nbsp;<em>Données liées et données à lier : quels outils pour quels alignements ?</em>&laquo;&nbsp;</a>, avec plein de bonnes choses dedans :</p>
<ul>
<li style="text-align: justify;">RobotDonnées, le module développé par Logilab pour data.bnf.fr qui permet le regroupement semi-automatique des éditions en œuvres;
<ul>
<li>où l&rsquo;on apprend que <a href="http://data.bnf.fr">data.bnf.fr</a> ne comporte &laquo;&nbsp;que&nbsp;&raquo; 300 000 œuvres, alors que la cible théorique serait à plusieurs millions; par exemple on voit bien en regardant <a href="http://data.bnf.fr/12249911/michel_houellebecq/#rdt70-12249911">les oeuvres dont Michel Houellebecq est auteur dans data.bnf.fr</a> que &laquo;&nbsp;<em>La carte et le territoire</em>&nbsp;&raquo; n’apparaît pas comme œuvre, mais que toutes les éditions de cet ouvrage sont bien listées quand on regarde <a href="http://data.bnf.fr/documents-by-rdt/12249911/70/page1">tous les documents dont Houellebecq est l&rsquo;auteur</a>.</li>
<li>où l&rsquo;on apprend également que ce regroupement en œuvre est progressivement réintroduit dans le catalogue général de la BNF;</li>
</ul>
</li>
<li style="text-align: justify;">BiblioStratus, pour aligner un catalogue externe avec celui de la BNF sur la base de plusieurs heuristiques (ISBN, EAN ou bien titre+auteur+date ou titre+auteur); où l&rsquo;on apprend que la transition n&rsquo;est pas qu&rsquo;écologique mais qu&rsquo;il existe également une <a href="https://www.transition-bibliographique.fr/17-06-20-notice-bibliographique-manifestation-notice-autorite-titre-oeuvre/">transition bibliographique</a>;</li>
<li style="text-align: justify;">l&rsquo;ANR <a href="https://project.inria.fr/elker/">ELKER</a> pour &laquo;&nbsp;Enhancing Link Keys: Extraction and Reasoning&nbsp;&raquo;, porté notamment par l&rsquo;INRIA Grenoble pour la détection automatique des attributs permettant de trouver des correspondances dans 2 jeux de données RDF arbitraires; très impressionnant;</li>
<li style="text-align: justify;"><a href="http://cultuurlink.beeldengeluid.nl">CultuurLink</a>, à tester pour tous ceux qui s&rsquo;intéressent aux processus d&rsquo;alignement de vocabulaires, bien que l&rsquo;outil soit restreint aux vocabulaires patrimoniaux des Pays-Bas;</li>
<li style="text-align: justify;"><em>et encore plein d&rsquo;autres choses (cf les liens sur la page de l&rsquo;atelier);</em></li>
</ul>
<h2 style="text-align: justify;">OnAGUI pour aligner 2 thesaurus SKOS</h2>
<p style="text-align: justify;">Je voulais profiter de cette thématique des alignements pour parler d&rsquo;un autre outil d&rsquo;alignement de thesaurus SKOS : <strong><a href="https://github.com/lmazuel/onagui">OnAGUI</a> </strong>pour &laquo;&nbsp;<em>Ontology Alignment Graphical Interface</em>&laquo;&nbsp;. OnAGUI est le genre d&rsquo;outil qui ne paie pas de mine au premier abord mais qui est à mon avis<strong> l&rsquo;outil dont la prise en main est la plus immédiate pour qui veut aligner 2 thesaurus en SKOS, </strong>tout en permettant d&rsquo;<strong>outiller le processus depuis l&rsquo;alignement linguistique automatique jusqu&rsquo;à la validation manuelle de l&rsquo;alignement produit</strong>.</p>
<div id="attachment_1170" style="width: 660px" class="wp-caption aligncenter"><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet.png"><img class="size-large wp-image-1170" src="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet-1024x582.png" alt="L'interface d'OnAGUI pour aligner 2 thesaurus" width="650" height="369" /></a><p class="wp-caption-text">L&rsquo;interface d&rsquo;OnAGUI pour aligner 2 thesaurus</p></div>
<p style="text-align: justify;">Quelques considérations générales : d&rsquo;abord l&rsquo;acronyme parle d&rsquo;alignement d&rsquo; &laquo;&nbsp;ontologies&nbsp;&raquo;, mais pas de panique, ça marche pour des <strong>thesaurus en SKOS</strong>; surtout pour des thesaurus en SKOS, d&rsquo;ailleurs. Ensuite, c&rsquo;est <strong>open-source</strong>; ça s&rsquo;installe facilement sur n&rsquo;importe quel poste équipé de Java, c&rsquo;est une <strong>application &laquo;&nbsp;de bureau&nbsp;&raquo;</strong>, qui ne nécessite pas d&rsquo;infrastructure client-serveur, etc. l&rsquo;interface est en <strong>français</strong> (et anglais) puisque le développement à été fait par <a href="https://github.com/lmazuel">Laurent Mazuel</a> à l&rsquo;époque où il travaillait avec <a href="http://www.limics.fr/fr/annuaire/fiche-membre/voir/18-CHARLET-Jean">Jean Charlet</a> au <a href="http://www.limics.fr/fr/">LIMICS</a> (INSERM). L&rsquo;outil est maintenu, notamment par votre serviteur.</p>
<p style="text-align: justify;">Vous pouvez consulter la <a href="https://github.com/lmazuel/onagui/wiki">documentation d&rsquo;OnAGUI</a> où vous trouverez des informations plus détaillées sur le logiciel.</p>
<h2 style="text-align: justify;">Alignement avec RAMEAU</h2>
<p style="text-align: justify;">Maintenant, le cas d&rsquo;usage : il m&rsquo;ait arrivé de rencontrer des personnes qui avaient besoin d&rsquo;<strong>aligner un vocabulaire vers le <a href="http://rameau.bnf.fr/">langage d&rsquo;indexation RAMEAU de la BNF</a></strong>. Comment faire ?</p>
<ol>
<li style="text-align: justify;">Je ne détaille pas ici la structure de RAMEAU et son mécanisme de &laquo;&nbsp;vedettes-matières pré-coordonnées&nbsp;&raquo; que je ne connais pas bien d&rsquo;ailleurs, mais je pars (naïvement) de ce qui existe : le fichier des Thèmes Rameau que l&rsquo;on télécharge depuis le site des <a href="http://api.bnf.fr/dumps-de-databnffr">dumps de données de la BNF</a>. Il s&rsquo;agit du fichier intitulé &laquo;&nbsp;<a href="ftp://databnf:databnf@pef.bnf.fr/DATA/databnf_rameau_xml.tar.gz">[RDF/XML] Thèmes RAMEAU</a>&laquo;&nbsp;.</li>
<li style="text-align: justify;">A ce stade il faut l&rsquo;avouer : <em>la BNF a encore des efforts à faire sur diffusion des données de RAMEAU</em>; les données telles qu&rsquo;on les télécharge sont inutilisables telles qu&rsquo;elles, et nécessitent : 1/ un nettoyage et 2/ une fusion en un seul fichier; je ne m&rsquo;étends pas sur cette étape que j&rsquo;ai réalisé à l&rsquo;aide de scripts <a href="http://rdf4j.org">RDF4J</a> dont je me sers régulièrement, mais on se ramène au final à un seul fichier RDF contenant tout RAMEAU en SKOS; si vous voulez tester OnAGUI sur un autre vocabulaire ne nécessitant pas cette étape de &laquo;&nbsp;magie noire&nbsp;&raquo;, essayez avec <a href="http://vocabularies.unesco.org/browser/en/about">le thesaurus de l&rsquo;UNESCO</a> ou <a href="http://data.europa.eu/euodp/fr/data/dataset/eurovoc">Eurovoc</a>;</li>
<li style="text-align: justify;">Il faut ensuite avoir son propre thesaurus en SKOS; on peut utiliser pour cela l&rsquo;<a href="http://labs.sparna.fr/skos-play/convert">outil de conversion Excel vers SKOS disponible dans SKOS Play</a>;</li>
<li style="text-align: justify;">Il faut <a href="https://github.com/lmazuel/onagui/releases">télécharger OnAGUI</a> en prenant soin de prendre une version postérieure à 0.3.2, version pour laquelle des améliorations ont été apportées pour fonctionner avec RAMEAU;</li>
<li>Muni donc de votre vocabulaire en SKOS d&rsquo;un côté, de RAMEAU (nettoyé) de l&rsquo;autre, et d&rsquo;OnAGUI entre les deux, vous pouvez ensuite :
<ol>
<li style="text-align: justify;">Charger votre thesaurus dans OnaGUI (Menu &laquo;&nbsp;Fichier &gt; Charger vocabulaire 1 &gt; Charger en SKOS&nbsp;&raquo;);</li>
<li style="text-align: justify;">Charger RAMEAU dans OnaGUI (Menu &laquo;&nbsp;Fichier &gt; Charger vocabulaire 2 &gt; Charger en SKOS&nbsp;&raquo;), qui va vaillamment charger 160000+ concepts;</li>
<li style="text-align: justify;">Lancer un alignement linguistique (Menu &laquo;&nbsp;Alignement &gt; I-Sub distance&nbsp;&raquo;) en prenant soin de :
<ol>
<li>sélectionner la langue &laquo;&nbsp;fr&nbsp;&raquo; dans les 2 thesaurus;</li>
<li>abaisser légèrement le seuil de tolérance de l&rsquo;algorithme, en le mettant à 0.85 par exemple; ne le mettez pas trop bas sinon vous aurez trop de correspondances qui ne veulent rien dire, ni trop haut sinon vous allez rater des choses;</li>
</ol>
</li>
<li style="text-align: justify;">Aller prendre un petit café, ou deux, ou trois&#8230; en fonction de la taille du vocabulaire que vous avez besoin d&rsquo;aligner; patientez entre quelques secondes et une nuit entière;</li>
<li style="text-align: justify;">Analyser le tableau de résultat fourni et soit :
<ol>
<li>supprimer des lignes de correspondances fausses; regardez le score de chaque correspondance : plus le score tend vers 1, meilleure est la correspondance linguisitique, plus le score diminue, plus les libellés sont éloignés;</li>
<li>ajouter des nouvelles correspondances qui auraient été ratées;</li>
</ol>
</li>
<li style="text-align: justify;">Puis exporter l&rsquo;alignement (Menu &laquo;&nbsp;Fichier &gt; Exporter l&rsquo;alignemenr&nbsp;&raquo;) soit dans un format RDF <a href="http://alignapi.gforge.inria.fr/edoal.html">EDOAL</a>, le plus expressif, soit avec les <a href="https://www.w3.org/TR/2009/REC-skos-reference-20090818/#mapping">propriétés d&rsquo;alignement SKOS</a>, soit en CSV pour une analyse dans un tableur;</li>
</ol>
</li>
</ol>
<div id="attachment_1216" style="width: 537px" class="wp-caption aligncenter"><a href="http://blog.sparna.fr/wp-content/uploads/2018/07/onagui-rameau.png"><img class="wp-image-1216 size-full" src="http://blog.sparna.fr/wp-content/uploads/2018/07/onagui-rameau.png" alt="Vocabulaire Rameau dans OnaGUI" width="527" height="903" /></a><p class="wp-caption-text">Vocabulaire Rameau chargé dans OnaGUI</p></div>
<p>&nbsp;</p>
<p style="text-align: justify;">OnAGUI est un outil perfectible sur bien des aspects mais qui permet de valider &laquo;&nbsp;pour de vrai&nbsp;&raquo; des alignements sur des vrais projets, sans besoin d&rsquo;infrastructure compliquée ou d&rsquo;outil commercial. J&rsquo;ai pu le mettre en œuvre à 2 reprises : pour l&rsquo;alignement du <a href="https://vocabulaires.irstea.fr/">thesaurus de l&rsquo;IRSTEA</a> vers le <a href="http://www.eionet.europa.eu/gemet/en/themes/">GEMET</a> et <a href="http://aims.fao.org/vest-registry/vocabularies/agrovoc">Agrovoc</a>, et plus récemment pour un essai d&rsquo;alignement du <a href="http://data.legilux.public.lu/vocabulaires/legal-subject-theme/fr/">vocabulaire thématique d&rsquo;indexation de la loi Luxembourgeoise</a> avec le <a href="http://eurovoc.europa.eu/">thesaurus Eurovoc</a> utilisé au niveau européen, sur la base de l&rsquo;analyse des <a href="https://fr.wikipedia.org/wiki/Transposition_(droit)">transpositions des directives européennes</a> dans la loi nationale. Il peut également prendre en charger des cas d&rsquo;usage d&rsquo;<em>alignement partiel</em>, en alignant seulement les concepts créés ou modifiés après une certaine date, de façon à ne pas à avoir à refaire l&rsquo;intégralité de l&rsquo;alignement à chaque nouvelle version du thesaurus.</p>
<p style="text-align: justify;">Si vous avez des questions, des cas d&rsquo;usage ou des retours d&rsquo;expérience sur OnAGUI, n&rsquo;hésitez pas à <a href="https://github.com/lmazuel/onagui/issues">soumettre des tickets dans le site du projet</a>.</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/">Aligner son thesaurus avec RAMEAU en utilisant OnAGUI</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>SPARQL sur les données de data.bnf.fr : un exercice guidé dans les Fables</title>
		<link>https://blog.sparna.fr/2018/03/07/data-bnf-fr-sparql-exercice/</link>
		<comments>https://blog.sparna.fr/2018/03/07/data-bnf-fr-sparql-exercice/#comments</comments>
		<pubDate>Wed, 07 Mar 2018 14:27:41 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SPARQL]]></category>
		<category><![CDATA[data.bnf.fr]]></category>
		<category><![CDATA[FRBR]]></category>
		<category><![CDATA[Rameau]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1182</guid>
		<description><![CDATA[<p>Appréhender les données de data.bnf.fr n&#8217;est pas forcément facile. Je vais expérimenter ce nouveau TP pour expliquer comment partir à la découverte des données de la BNF en utilisant SPARQL. L&#8217;énoncé permet de comprendre : Comment trouver un auteur par son nom Comment trouver une oeuvre par son nom Comment chercher un mot-clé dans Rameau&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/03/07/data-bnf-fr-sparql-exercice/">SPARQL sur les données de data.bnf.fr : un exercice guidé dans les Fables</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Appréhender les données de data.bnf.fr n&rsquo;est pas forcément facile. Je vais expérimenter ce nouveau TP pour expliquer comment partir à la découverte des données de la BNF en utilisant SPARQL. L&rsquo;énoncé permet de comprendre :</p>
<ul>
<li>Comment trouver un auteur par son nom</li>
<li>Comment trouver une oeuvre par son nom</li>
<li>Comment chercher un mot-clé dans Rameau</li>
<li>Comment faire une recherche combinée sur l&rsquo;auteur de l&rsquo;oeuvre et un mot-clé Rameau</li>
</ul>
<blockquote class="embedly-card"><h4><a href="https://www.slideshare.net/thomasfrancart/dcouvrir-les-donnes-de-databnffr-en-utilisant-sparql/thomasfrancart/dcouvrir-les-donnes-de-databnffr-en-utilisant-sparql">Découvrir les données de data.bnf.fr en utilisant SPARQL</a></h4>
<p>Travaux pratiques pour explorer les oeuvres, les auteurs et les mots-clés de data.bnf.fr en utilisant des requêtes SPARQL.</p>
</blockquote>
<p><script async src="//cdn.embedly.com/widgets/platform.js" charset="UTF-8"></script></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/03/07/data-bnf-fr-sparql-exercice/">SPARQL sur les données de data.bnf.fr : un exercice guidé dans les Fables</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2018/03/07/data-bnf-fr-sparql-exercice/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>
