<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sparna Blog &#187; Thesaurus</title>
	<atom:link href="https://blog.sparna.fr/category/theme/thesaurus-theme/feed/" rel="self" type="application/rss+xml" />
	<link>https://blog.sparna.fr</link>
	<description>Web de données &#124; Architecture de l&#039;information &#124; Accès aux connaissances</description>
	<lastBuildDate>Tue, 03 Jun 2025 10:30:27 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
	<item>
		<title>CORDIS : a SPARQL endpoint is born !</title>
		<link>https://blog.sparna.fr/2024/01/15/cordis-a-sparql-endpoint-is-born/</link>
		<comments>https://blog.sparna.fr/2024/01/15/cordis-a-sparql-endpoint-is-born/#comments</comments>
		<pubDate>Mon, 15 Jan 2024 08:55:41 +0000</pubDate>
		<dc:creator><![CDATA[Marie Muller]]></dc:creator>
				<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[Ontologies]]></category>
		<category><![CDATA[Open Data]]></category>
		<category><![CDATA[SPARQL]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[Triplestores]]></category>
		<category><![CDATA[Visualisation de données]]></category>
		<category><![CDATA[endpoint]]></category>
		<category><![CDATA[Europe]]></category>
		<category><![CDATA[Linked Open Data]]></category>
		<category><![CDATA[ontologie]]></category>
		<category><![CDATA[ontologies]]></category>
		<category><![CDATA[thesaurus]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1615</guid>
		<description><![CDATA[<p>Another star to light on EU&#8217;s linked open data maturity flag ! 🌟 Not talking about 2024 exceptional Northern Lights to come, but this one&#8217;s also good news for science ! ➡️ Late 2023, the Publications Office of the European Union announced on social media the public release of the new CORDIS SPARQL endpoint. CORDIS, aka « the Community&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2024/01/15/cordis-a-sparql-endpoint-is-born/">CORDIS : a SPARQL endpoint is born !</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p><span style="font-weight: 400;">Another star to light on EU&rsquo;s linked open data maturity flag ! <img src="https://s.w.org/images/core/emoji/72x72/1f31f.png" alt="🌟" class="wp-smiley" style="height: 1em; max-height: 1em;" /></span></p>
<p><span style="font-weight: 400;">Not talking about 2024 exceptional <a href="https://www.nationalgeographic.com/science/article/auroras-solar-maximum-2024">Northern Lights to come,</a> </span><span style="font-weight: 400;">but this one&rsquo;s also good news for science !</span></p>
<p><span style="font-weight: 400;">➡️ Late 2023, </span><span style="font-weight: 400;">the Publications Office of the European Union</span><span style="font-weight: 400;"> <a href="https://twitter.com/CORDIS_EU/status/1726865540143276079">announced on social media</a> </span><span style="font-weight: 400;">the public release of </span><strong><a href="https://cordis.europa.eu/datalab/sparql-endpoint">the new CORDIS SPARQL endpoint</a></strong><span style="font-weight: 400;">.</span></p>
<p><span style="font-weight: 400;">CORDIS, aka « </span><span style="font-weight: 400;">t</span><span style="font-weight: 400;">he Community Research and Development Information Service </span><span style="font-weight: 400;">of</span><span style="font-weight: 400;"> the European Commission</span><span style="font-weight: 400;"> », is « </span><em><a href="https://cordis.europa.eu/about"><span style="font-weight: 400;">the [&#8230;] primary source of results from the projects funded by the EU&rsquo;s framework programmes for research and innovation, from FP1 to Horizon Europe</span></a></em><span style="font-weight: 400;"> ». Described as a « <em>rich and structured public repository with all project information held by the European Commission such as project factsheets, participants, reports, deliverables and links to open-access publications</em> », the CORDIS catalog has also been made available in 6 European languages by Publications Office&rsquo;s editorial team.</span></p>
<p><span style="font-weight: 400;">Cherry on top <img src="https://s.w.org/images/core/emoji/72x72/1f352.png" alt="🍒" class="wp-smiley" style="height: 1em; max-height: 1em;" /> of a whole process, the CORDIS SPARQL endpoint release comes to crown a long-term linked open data project. The aim identifying, acquiring, preserving and providing access to knowledge in a common will to share with the widest public possible a trust-worthy, qualified and structured information (see </span><a href="https://op.europa.eu/webpub/op/annual-management-report-2021/en/"><span style="font-weight: 400;">Publications Office 2021 Annual Management Report</span></a><span style="font-weight: 400;">).</span></p>
<p><span style="font-weight: 400;">In the context of the pandemic (and recent opening of <a href="https://data.europa.eu/en">data.europa.eu</a>, the official portal for European data, as defined in 2017–2025 European Open Data Space strategy), </span><a href="https://data.europa.eu/data/datasets/euroscivoc-the-european-science-vocabulary?locale=en"><span style="font-weight: 400;">the EuroSciVoc taxonomy of fields of science</span></a><span style="font-weight: 400;"> was released April 2020, followed December 2021 by the publishing of </span><a href="https://data.europa.eu/data/datasets/european-research-information-ontology?locale=en"><span style="font-weight: 400;">European research information ontology (EURIO)</span></a><span style="font-weight: 400;"> on the EU Vocabularies website <img src="https://s.w.org/images/core/emoji/72x72/1f310.png" alt="🌐" class="wp-smiley" style="height: 1em; max-height: 1em;" />.</span></p>
<p><span style="font-weight: 400;">As presented at </span><a href="https://op.europa.eu/en/web/endorse-2021/conference"><span style="font-weight: 400;">ENDORSE conference March 2021</span></a><span style="font-weight: 400;">, the redesign of CORDIS data-model in accordance with Semantic Web standards contributed to bring the platform « <strong><em>from acting as a data repository to finally playing an active role as data provider</em></strong> », where EuroSciVoc taxonomy &amp; EURIO ontology both played key roles in the creation of future CORDIS knowledge graph and SPARQL endpoint :</span></p>
<p><span style="font-weight: 400;"><img src="https://s.w.org/images/core/emoji/72x72/1f538.png" alt="🔸" class="wp-smiley" style="height: 1em; max-height: 1em;" /></span><em><span style="font-weight: 400;"> <a href="https://data.europa.eu/data/datasets/euroscivoc-the-european-science-vocabulary?locale=en">EuroSciVoc</a> [&#8230;] is a multilingual, SKOS-XL based taxonomy that represents all the main fields of science that were discovered from the CORDIS content, e.g., project abstracts. It was built starting from the hierarchy of the OECD&rsquo;s Fields of R&amp;D classification (FoRD) as root and extended through a semi-automatic process based on NLP techniques. It contains almost 1 000 categories in 6 languages (English, French, German, Italian, Polish and Spanish) and each category is enriched with relevant keywords extracted from the textual description of CORDIS projects. It is constantly evolving and is available on EU Vocabularies website [&#8230;].</span></em></p>
<p><span style="font-weight: 400;"><img src="https://s.w.org/images/core/emoji/72x72/1f538.png" alt="🔸" class="wp-smiley" style="height: 1em; max-height: 1em;" /></span><em><span style="font-weight: 400;"> In order to transform CORDIS data into Linked Open Data, thus aligning with Semantic Web standards, best practices and tools in industry and public organizations, the need for an ontology emerged. CORDIS created the <a href="https://data.europa.eu/data/datasets/european-research-information-ontology?locale=en">EURIO</a> (European Research Information Ontology) based on data about research projects funded by the EU&rsquo;s framework programmes for research and innovation. EURIO is aligned with EU ontologies such as <a href="https://dcodings.github.io/DINGO/">DINGO</a> and <a href="https://github.com/SPAROntologies/frapo">FRAPO</a> and de facto standard ontologies such as schema.org and the Organization Ontology from W3C. It models projects, their results and actors such as people and organizations, and includes administrative information like funding schemes and grants.</span></em></p>
<p><span style="font-weight: 400;"><img src="https://s.w.org/images/core/emoji/72x72/1f449.png" alt="👉" class="wp-smiley" style="height: 1em; max-height: 1em;" /></span><em> EURIO, which is available on EU Vocabularies website, was <strong>the starting point to develop a Knowledge Graph of CORDIS data that will be publicly available via a dedicated SPARQL endpoint</strong>.</em> <em>»</em></p>
<p>(Enrico Bignotti &amp; Baya Remaoun, &laquo;&nbsp;<a href="https://op.europa.eu/en/web/endorse-2021/programme">EuroSciVoc taxonomy and EURIO ontology: CORDIS as (semantic) data provider</a> &nbsp;&raquo; , ENDORSE March 16, 2021. <a href="https://op.europa.eu/documents/10120270/10133951/BIGNOTTI_REMAOUN_presentation_EuroSciVoc+taxonomy+and+EURIO+ontology+CORDIS+as+%28semantic%29+data+provider.pdf/3303e7b9-967d-65f2-23a3-96b3e2bd2856?t=1616568751644"><span style="font-weight: 400;">PDF</span></a><span style="font-weight: 400;"> </span><a href="https://www.youtube.com/watch?v=vIBC_PO5aoM&amp;t=3689s"><span style="font-weight: 400;">VIDEO</span></a>)</p>
<p><span style="font-weight: 400;">&#8230; A Knowledge graph <a href="https://upcommons.upc.edu/bitstream/handle/2117/378291/2022-ISWC.pdf?sequence=1&amp;isAllowed=y">that was soon released in 2022-2023</a></span><span style="font-weight: 400;"> (see INDUSTRY TRACK 1 on Tuesday, 25 October of <a href="http://iswc2022.semanticweb.org/index.php/conference/">ISWC 2022 Conference</a> for more detail), until final opening of a </span><a href="https://cordis.europa.eu/datalab"><span style="font-weight: 400;">CORDIS SPARQL endpoint</span></a><span style="font-weight: 400;"> late november 2023.</span></p>
<p><span style="font-weight: 400;">Now fancy a few SPARQL queries in there ?</span></p>
<p><strong>Follow the SPARQL <img src="https://s.w.org/images/core/emoji/72x72/1f4ab.png" alt="💫" class="wp-smiley" style="height: 1em; max-height: 1em;" /></strong></p>
<p><span style="font-weight: 400;">CORDIS SPARQL endpoint is </span><a href="https://cordis.europa.eu/datalab"><span style="font-weight: 400;">actually made available on CORDIS Datalab</span></a><span style="font-weight: 400;"> (and already referenced in <a href="https://linkedopendata.eu/wiki/The_EU_Knowledge_Graph">EU Knowledge Graph</a> among other European SPARQL endpoints ! <a href="http://tinyurl.com/yn5fsylk">see the query</a> / <a href="http://tinyurl.com/2e8z6y5e">see the results</a>)</span></p>
<p><span style="font-weight: 400;">Here you can access a quick documentation guide to CORDIS Linked Open Data : </span><a href="https://cordis.europa.eu/about/sparql"><span style="font-weight: 400;">https://cordis.europa.eu/about/sparql</span></a><span style="font-weight: 400;">.</span></p>
<p><span style="font-weight: 400;">Let’s have a look at EURIO ontology first : we need to understand it to query CORDIS knowledge graph.</span></p>
<p><span style="font-weight: 400;">As we are told in the guide, the latest version can be downloaded </span><a href="https://op.europa.eu/en/web/eu-vocabularies/dataset/-/resource?uri=http://publications.europa.eu/resource/dataset/eurio"><span style="font-weight: 400;">on EU Vocabularies website</span></a><span style="font-weight: 400;">. When we unzip</span><span style="font-weight: 400;"> the archive we access the whole documentation about EURIO Classes &amp; properties that we need to write our SPARQL queries – and a diagram of </span><span style="font-weight: 400;">main classes and properties</span><span style="font-weight: 400;"> of CORDIS data model : </span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2024/01/EURIO_v2.4.png"><img class="aligncenter size-large wp-image-1669" src="http://blog.sparna.fr/wp-content/uploads/2024/01/EURIO_v2.4-1024x812.png" alt="EURIO_v2.4" width="650" height="515" /></a></p>
<p><span style="font-weight: 400;">At first sight we can observe on the schema 3 main groups of entities :</span></p>
<ul>
<li style="font-weight: 400;"><span style="font-weight: 400;">On the top right, the projects &amp; publications associated, key ressources of CORDIS ;</span></li>
<li style="font-weight: 400;"><span style="font-weight: 400;">On the top left, the fundings &amp; grants materials, on « monetary » side of the project ;</span></li>
<li style="font-weight: 400;"><span style="font-weight: 400;">On the bottom, the organisations &amp; persons implied, with references &amp; coordinates.</span></li>
</ul>
<p><span style="font-weight: 400;">Let’s open </span><a href="https://cordis.europa.eu/datalab/sparql-endpoint"><span style="font-weight: 400;">CORDIS SPARQL endpoint</span></a><span style="font-weight: 400;"> – some easy queries can be run to begin exploring CORDIS knowledge graph.</span></p>
<p><span style="font-weight: 400;">Nb : the data on SPARQL endpoint is a snapshot, but freshest dumps can be found </span><a href="https://data.europa.eu/data/datasets/named-graphs-from-eurio-knowledge-graph?locale=en"><span style="font-weight: 400;">on European data portal</span></a><span style="font-weight: 400;"> !</span></p>
<p><span style="font-weight: 400;">Here a simple one to </span><b>find a list of FundingSchemes with their titles and IDs corresponding to « Horizon 2020 » programme</b><span style="font-weight: 400;"> :</span></p>
<table>
<tbody>
<tr>
<td><strong>FundingSchemes with their titles and IDs corresponding to « Horizon 2020 » programme</strong></p>
<p>PREFIX xsd: &lt;http://www.w3.org/2001/XMLSchema#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
SELECT ?fs ?title ?id<br />
WHERE {<br />
# select all funding schemes …<br />
?fs a eurio:FundingScheme.<br />
# … with their title …<br />
?fs eurio:title ?title.<br />
# … and identifier …<br />
?fs eurio:identifier ?id.<br />
# where the identifier contains the regular expression “H2020”<br />
FILTER (REGEX (?id, &lsquo;H2020&prime;))<br />
} LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20FundingSchemes%20with%20their%20titles%20and%20IDs%20corresponding%20to%20%C2%AB%20Horizon%202020%20%C2%BB%20programme%0A%0APREFIX%20xsd%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2001%2FXMLSchema%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%20%3Ffs%20%3Ftitle%20%3Fid%0AWHERE%20%7B%0A%23%20select%20all%20funding%20schemes%20%E2%80%A6%0A%3Ffs%20a%20eurio%3AFundingScheme.%0A%23%20%E2%80%A6%20with%20their%20title%20%E2%80%A6%0A%3Ffs%20eurio%3Atitle%20%3Ftitle.%0A%23%20%E2%80%A6%20and%20identifier%20%E2%80%A6%0A%3Ffs%20eurio%3Aidentifier%20%3Fid.%0A%23%20where%20the%20identifier%20contains%20the%20regular%20expression%20%E2%80%9CH2020%E2%80%9D%0AFILTER%20(REGEX%20(%3Fid%2C%20'H2020'))%0A%7D%20LIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p><span style="font-weight: 400;">The FILTER REGEX enables us to display the IDs corresponding to H2020 Funding Schemes.</span></p>
<p><span style="font-weight: 400;">We can make another query to get the projects with the Funding Scheme Programme they are related to (note that, in EURIO a eurio:</span><span style="font-weight: 400;">hasFundingSchemeProgramme</span><span style="font-weight: 400;"> is a sub-property of eurio:fundingScheme) :</span></p>
<table>
<tbody>
<tr>
<td><strong>Projects with the Funding Scheme Programme they are related to</strong></p>
<p><span style="font-weight: 400;">PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;</span><br />
<span style="font-weight: 400;">SELECT ?project ?acronym ?fundingscheme</span><br />
<span style="font-weight: 400;">WHERE {</span><br />
# select the projects &#8230;<br />
<span style="font-weight: 400;">?project a eurio:Project.</span><br />
# … with acronyms &#8230;<br />
<span style="font-weight: 400;">?project eurio:hasAcronym/eurio:shortForm ?acronym.</span><br />
# … and corresponding funding scheme programmes<br />
<span style="font-weight: 400;">?project eurio:isFundedBy/eurio:hasFundingSchemeProgramme/eurio:code ?fundingscheme.</span><br />
<span style="font-weight: 400;">} LIMIT 100</span></td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Projects%20with%20the%20Funding%20Scheme%20Programme%20they%20are%20related%20to%0A%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%20%3Fproject%20%3Facronym%20%3Ffundingscheme%0AWHERE%20%7B%0A%23%20select%20the%20projects%20...%0A%3Fproject%20a%20eurio%3AProject.%0A%23%20%E2%80%A6%20with%20acronyms%20...%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%23%20%E2%80%A6%20and%20corresponding%20funding%20scheme%20programmes%0A%3Fproject%20eurio%3AisFundedBy%2Feurio%3AhasFundingSchemeProgramme%2Feurio%3Acode%20%3Ffundingscheme.%0A%7D%20LIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%201&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p><span style="font-weight: 400;">(Here we used a property path with a « / » to shorten the query to get the acronyms of projects &amp; Funding Scheme Programmes codes).</span></p>
<p><span style="font-weight: 400;">&#8230; and combining with the first query we can find the projects depending on H2020 Funding Scheme Programme in particular :</span></p>
<table>
<tbody>
<tr>
<td><strong>Projects depending on H2020 Funding Scheme Programme in particular</strong></p>
<p><span style="font-weight: 400;">PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;</span><br />
<span style="font-weight: 400;">SELECT ?project ?acronym ?fundingscheme</span><br />
<span style="font-weight: 400;">WHERE {</span><br />
# select the projects &#8230;<br />
<span style="font-weight: 400;">?project a eurio:Project.</span><br />
# … with acronyms &#8230;<br />
<span style="font-weight: 400;">?project eurio:hasAcronym/eurio:shortForm ?acronym.</span><br />
# … and corresponding funding scheme programmes codes &#8230;<br />
<span style="font-weight: 400;">?project eurio:isFundedBy/eurio:hasFundingSchemeProgramme/eurio:code ?fundingscheme.</span><br />
# … with a filter on funding scheme codes &lsquo;H2020&prime;<br />
<span style="font-weight: 400;">FILTER REGEX (?fundingscheme, &lsquo;H2020&prime;)</span><br />
<span style="font-weight: 400;">} LIMIT 100</span></td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Projects%20depending%20on%20H2020%20Funding%20Scheme%20Programme%20in%20particular%0A%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%20%3Fproject%20%3Facronym%20%3Ffundingscheme%0AWHERE%20%7B%0A%23%20select%20the%20projects%20...%0A%3Fproject%20a%20eurio%3AProject.%0A%23%20%E2%80%A6%20with%20acronyms%20...%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%23%20%E2%80%A6%20and%20corresponding%20funding%20scheme%20programmes%20codes%20...%0A%3Fproject%20eurio%3AisFundedBy%2Feurio%3AhasFundingSchemeProgramme%2Feurio%3Acode%20%3Ffundingscheme.%0A%23%20%E2%80%A6%20with%20a%20filter%20on%20funding%20scheme%20codes%20'H2020'%0AFILTER%20REGEX%20(%3Ffundingscheme%2C%20'H2020')%0A%7D%20LIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p><span style="font-weight: 400;">It is also possible to get the list of all existing Funding Scheme Programmes CORDIS projects have been funded by – we observe 27 of them here (from the SPARQL endpoint) – while adding a count function to know how many projects per FundingSchemeProgramme :</span></p>
<table>
<tbody>
<tr>
<td><strong>All existing Funding Scheme Programmes CORDIS projects have been funded by</strong></p>
<p><span style="font-weight: 400;">PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;</span><br />
# count the number of projects by funding scheme programme &#8230;<br />
<span style="font-weight: 400;">SELECT (COUNT (?project) as ?count) ?fundingscheme</span><br />
<span style="font-weight: 400;">WHERE {</span><br />
# select the projects with corresponding funding scheme programmes codes &#8230;<br />
<span style="font-weight: 400;">?project eurio:isFundedBy/eurio:hasFundingSchemeProgramme/eurio:code ?fundingscheme.</span><br />
# &#8230; counting projects per funding scheme programme<br />
<span style="font-weight: 400;">} GROUP BY ?fundingscheme</span><br />
<span style="font-weight: 400;">LIMIT 100</span></td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20All%20existing%20Funding%20Scheme%20Programmes%20CORDIS%20projects%20have%20been%20funded%20by%0A%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0A%23%20count%20the%20number%20of%20projects%20by%20funding%20scheme%20programme%20...%0ASELECT%20(COUNT%20(%3Fproject)%20as%20%3Fcount)%20%3Ffundingscheme%0AWHERE%20%7B%0A%23%20select%20the%20projects%20with%20corresponding%20funding%20scheme%20programmes%20codes%20...%0A%3Fproject%20eurio%3AisFundedBy%2Feurio%3AhasFundingSchemeProgramme%2Feurio%3Acode%20%3Ffundingscheme.%0A%23%20...%20counting%20projects%20per%20funding%20scheme%20programme%0A%7D%20GROUP%20BY%20%3Ffundingscheme%0ALIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%201&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p>Querying the organisations properties will return other kind of useful informations about geographical location of the projects stakeholders. Let’s figure out we want to find the projects whose coordinating organisations have sites located in France :</p>
<table>
<tbody>
<tr>
<td><strong>Projects whose coordinating organisations have sites located in France <img src="https://s.w.org/images/core/emoji/72x72/1f413.png" alt="🐓" class="wp-smiley" style="height: 1em; max-height: 1em;" /></strong></p>
<p>PREFIX skos: &lt;http://www.w3.org/2004/02/skos/core#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
SELECT ?project ?acronym ?role ?organisation ?country<br />
WHERE {<br />
# select the projects with their acronyms &#8230;<br />
?project a eurio:Project.<br />
?project eurio:hasAcronym/eurio:shortForm ?acronym.<br />
# &#8230; and organisations with &lsquo;coordinator&rsquo; role and name &#8230;<br />
?project eurio:hasInvolvedParty ?organisationrole.<br />
?organisationrole eurio:roleLabel ?role.<br />
?organisationrole eurio:roleLabel &laquo;&nbsp;coordinator&nbsp;&raquo;.<br />
?organisationrole eurio:isRoleOf/eurio:legalName ?organisation.<br />
# &#8230; with address country for the sites defined at &lsquo;FR&rsquo;<br />
?organisationrole eurio:isRoleOf/eurio:hasSite/eurio:hasAddress/eurio:addressCountry ?country.<br />
VALUES ?country { &lsquo;FR&rsquo; }<br />
} LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Projects%20whose%20coordinating%20organisations%20have%20sites%20located%20in%20France%20%F0%9F%90%93%0A%0APREFIX%20skos%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%20%3Fproject%20%3Facronym%20%3Frole%20%3Forganisation%20%3Fcountry%0AWHERE%20%7B%0A%23%20select%20the%20projects%20with%20their%20acronyms%20...%0A%3Fproject%20a%20eurio%3AProject.%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%23%20...%20and%20organisations%20with%20'coordinator'%20role%20and%20name%20...%0A%3Fproject%20eurio%3AhasInvolvedParty%20%3Forganisationrole.%0A%3Forganisationrole%20eurio%3AroleLabel%20%3Frole.%0A%3Forganisationrole%20eurio%3AroleLabel%20%22coordinator%22.%0A%3Forganisationrole%20eurio%3AisRoleOf%2Feurio%3AlegalName%20%3Forganisation.%0A%23%20...%20with%20address%20country%20for%20the%20sites%20defined%20at%20'FR'%0A%3Forganisationrole%20eurio%3AisRoleOf%2Feurio%3AhasSite%2Feurio%3AhasAddress%2Feurio%3AaddressCountry%20%3Fcountry.%0AVALUES%20%3Fcountry%20%7B%20'FR'%20%7D%0A%7D%20LIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p>Depending on available data, you can either query via PostalAddress info (eurio:addressCountry &lsquo;FR&rsquo;) or AdministrativeArea (eurio:hasGeographicalLocation) &#8230; Here we&rsquo;re lucky as both fields are mandatory ones.</p>
<p>Last but not least, we can also play with CORDIS vocabularies : here you&rsquo;ll have the choice to investigate via plain keywords of Projects or Publications items, querying titles, abstracts or other types of literals&#8230;</p>
<p>An example of projects with abstracts containing string ❄ &lsquo;winter&rsquo; ❄ &#8211; the URL giving the exact link to the project online :</p>
<table>
<tbody>
<tr>
<td><strong>Looking for ❄ &lsquo;winter&rsquo; ❄ in CORDIS projects abstracts (with nice URL to go)</strong></p>
<p>PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
SELECT?project ?acronym ?abstract ?url<br />
WHERE {<br />
# select the projects with their acronyms and abstracts &#8230;<br />
?project rdf:type eurio:Project.<br />
?project eurio:hasAcronym/eurio:shortForm ?acronym.<br />
?project eurio:abstract ?abstract.<br />
# &#8230; with a filter on abstracts containing string &lsquo;winter&rsquo; case insensitive &#8230;<br />
FILTER (regex(str(?abstract), &lsquo;winter&rsquo;, &lsquo;i&rsquo;))<br />
# &#8230; generating proper CORDIS website URLs based on RCN project code<br />
?project eurio:rcn ?rcn.<br />
BIND(IRI(CONCAT(&lsquo;https://cordis.europa.eu/project/rcn/&rsquo;, ?rcn)) AS ?url)<br />
} LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Looking%20for%20%E2%9D%84%20'winter'%20%E2%9D%84%20in%20CORDIS%20projects%20abstracts%20(with%20nice%20URL%20to%20go)%0A%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%3Fproject%20%3Facronym%20%3Fabstract%20%3Furl%0AWHERE%20%7B%0A%23%20select%20the%20projects%20with%20their%20acronyms%20and%20abstracts%20...%0A%3Fproject%20rdf%3Atype%20eurio%3AProject.%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%3Fproject%20eurio%3Aabstract%20%3Fabstract.%0A%23%20...%20with%20a%20filter%20on%20abstracts%20containing%20string%20'winter'%20case%20insensitive%20...%0AFILTER%20(regex(str(%3Fabstract)%2C%20'winter'%2C%20'i'))%0A%23%20...%20generating%20proper%20CORDIS%20website%20URLs%20based%20on%20RCN%20project%20code%0A%3Fproject%20eurio%3Arcn%20%3Frcn.%0ABIND(IRI(CONCAT('https%3A%2F%2Fcordis.europa.eu%2Fproject%2Frcn%2F'%2C%20%3Frcn))%20AS%20%3Furl)%0A%7D%20LIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%201&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p>But funniest way will be using EuroSciVoc taxonomy (and navigating through thesaurus hierarchy) : to do so we need to navigate through property &laquo;&nbsp;eurio:hasEuroSciVocClassification&nbsp;&raquo; to get the Concepts skosxl:prefLabel property &#8230; to finally obtain the thesaurus labels (don&rsquo;t forget to choose a prefered language with a FILTER (lang parameter) :</p>
<table>
<tbody>
<tr>
<td><strong>Projects with their associated EuroSciVoc keywords (English prefLabels <img src="https://s.w.org/images/core/emoji/72x72/1f482.png" alt="💂" class="wp-smiley" style="height: 1em; max-height: 1em;" />)</strong></p>
<p>PREFIX skosxl: &lt;http://www.w3.org/2008/05/skos-xl#&gt;<br />
PREFIX skos: &lt;http://www.w3.org/2004/02/skos/core#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
SELECT ?project ?acronym ?ESV<br />
WHERE {<br />
# select the projects with their acronyms &#8230;<br />
?project eurio:hasAcronym/eurio:shortForm ?acronym.<br />
# &#8230; with EuroSciVoc Classification prefLabels &#8230;<br />
?project eurio:hasEuroSciVocClassification/skosxl:prefLabel/skosxl:literalForm ?ESV.<br />
# &#8230; only returning &lsquo;English&rsquo; prefLabels<br />
FILTER (lang(?ESV) = &lsquo;en&rsquo;)<br />
} LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Projects%20with%20their%20associated%20EuroSciVoc%20keywords%20(English%20prefLabels%20%F0%9F%92%82)%0A%0APREFIX%20skosxl%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2008%2F05%2Fskos-xl%23%3E%0APREFIX%20skos%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%20%3Fproject%20%3Facronym%20%3FESV%0AWHERE%20%7B%0A%23%20select%20the%20projects%20with%20their%20acronyms%20...%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%23%20...%20with%20EuroSciVoc%20Classification%20prefLabels%20...%0A%3Fproject%20eurio%3AhasEuroSciVocClassification%2Fskosxl%3AprefLabel%2Fskosxl%3AliteralForm%20%3FESV.%0A%23%20...%20only%20returning%20'English'%20prefLabels%0AFILTER%20(lang(%3FESV)%20%3D%20'en')%0A%7D%20LIMIT%20100%0A&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%203&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p><span style="font-weight: 400;">A bit more complex one using first level of hierarchy of the taxonomy : here we are searching for all skos:broader concepts &laquo;&nbsp;with no other broader concept&nbsp;&raquo; (the FILTER NOT EXISTS formula), aka the top concepts or root concepts of the vocabulary used to describe the projects. Then counting the projects by each category :</span></p>
<table>
<tbody>
<tr>
<td><strong>All root categories of EuroSciVoc used to describe the projects</strong></p>
<p>PREFIX skosxl: &lt;http://www.w3.org/2008/05/skos-xl#&gt;<br />
PREFIX skos: &lt;http://www.w3.org/2004/02/skos/core#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
# count the number of projects by EuroSciVoc top categories &#8230;<br />
SELECT (COUNT(?project) AS ?nbProject) ?ESV_root_label<br />
WHERE {<br />
# &#8230; the top categories are Concepts &#8230;<br />
?ESV_root a skos:Concept .<br />
# &#8230; with no broader Concept &#8230;<br />
FILTER NOT EXISTS { ?ESV_root skos:broader ?anything }<br />
# &#8230; list with corresponding projects &#8230;<br />
?ESV_root ^skos:broader*/^eurio:hasEuroSciVocClassification ?project .<br />
# &#8230; and EuroSciVoc corresponding skos-xl prefLabels &#8230;<br />
?ESV_root skosxl:prefLabel/skosxl:literalForm ?ESV_root_label.<br />
# &#8230; sorting by EuroSciVoc category, with English prefLabels<br />
FILTER (lang(?ESV_root_label) = &lsquo;en&rsquo;)<br />
} GROUP BY ?ESV_root_label<br />
LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20All%20root%20categories%20of%20EuroSciVoc%20used%20to%20describe%20the%20projects%0A%0APREFIX%20skosxl%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2008%2F05%2Fskos-xl%23%3E%0APREFIX%20skos%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0A%23%20count%20the%20number%20of%20projects%20by%20EuroSciVoc%20top%20categories%20...%0ASELECT%20(COUNT(%3Fproject)%20AS%20%3FnbProject)%20%3FESV_root_label%0AWHERE%20%7B%0A%23%20...%20the%20top%20categories%20are%20Concepts%20...%0A%3FESV_root%20a%20skos%3AConcept%20.%0A%23%20...%20with%20no%20broader%20Concept%20...%0AFILTER%20NOT%20EXISTS%20%7B%20%3FESV_root%20skos%3Abroader%20%3Fanything%20%7D%0A%23%20...%20list%20with%20corresponding%20projects%20...%0A%3FESV_root%20%5Eskos%3Abroader*%2F%5Eeurio%3AhasEuroSciVocClassification%20%3Fproject%20.%0A%23%20...%20and%20EuroSciVoc%20corresponding%20skos-xl%20prefLabels%20...%0A%3FESV_root%20skosxl%3AprefLabel%2Fskosxl%3AliteralForm%20%3FESV_root_label.%0A%23%20...%20sorting%20by%20EuroSciVoc%20category%2C%20with%20English%20prefLabels%0AFILTER%20(lang(%3FESV_root_label)%20%3D%20'en')%0A%7D%20GROUP%20BY%20%3FESV_root_label%0ALIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%201&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p>&#8230; and maybe again more explicit results if refined to level 2 of hierarchy <img src="https://s.w.org/images/core/emoji/72x72/1f440.png" alt="👀" class="wp-smiley" style="height: 1em; max-height: 1em;" /> :</p>
<table>
<tbody>
<tr>
<td><strong>All &lsquo;level 2&prime; root categories of EuroSciVoc used to describe the projects</strong></p>
<p>PREFIX skosxl: &lt;http://www.w3.org/2008/05/skos-xl#&gt;<br />
PREFIX skos: &lt;http://www.w3.org/2004/02/skos/core#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
# count the number of projects by EuroSciVoc level 2 top categories &#8230;<br />
SELECT (COUNT(?project) AS ?nbProject) ?ESV_root_label ?ESV_level2_label<br />
WHERE {<br />
# &#8230; the top categories are Concepts &#8230;<br />
?ESV_root a skos:Concept .<br />
# &#8230; with no broader Concept &#8230;<br />
FILTER NOT EXISTS { ?ESV_root skos:broader ?anything }<br />
# &#8230; list level 2 category below level 1 with corresponding projects &#8230;<br />
?ESV_root ^skos:broader ?ESV_level2 .<br />
?ESV_level2 ^skos:broader*/^eurio:hasEuroSciVocClassification ?project .<br />
# &#8230; and EuroSciVoc corresponding skos-xl prefLabels &#8230;<br />
?ESV_root skosxl:prefLabel/skosxl:literalForm ?ESV_root_label.<br />
?ESV_level2 skosxl:prefLabel/skosxl:literalForm ?ESV_level2_label.<br />
# &#8230; sorting by EuroSciVoc category, with English prefLabels<br />
FILTER (lang(?ESV_root_label) = &lsquo;en&rsquo;)<br />
FILTER (lang(?ESV_level2_label) = &lsquo;en&rsquo;)<br />
} GROUP BY ?ESV_root_label ?ESV_level2_label<br />
ORDER BY ?ESV_root_label<br />
LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20All%20'level%202'%20root%20categories%20of%20EuroSciVoc%20used%20to%20describe%20the%20projects%0A%0APREFIX%20skosxl%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2008%2F05%2Fskos-xl%23%3E%0APREFIX%20skos%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0A%23%20count%20the%20number%20of%20projects%20by%20EuroSciVoc%20level%202%20top%20categories%20...%0ASELECT%20(COUNT(%3Fproject)%20AS%20%3FnbProject)%20%3FESV_root_label%20%3FESV_level2_label%0AWHERE%20%7B%0A%23%20...%20the%20top%20categories%20are%20Concepts%20...%0A%3FESV_root%20a%20skos%3AConcept%20.%0A%23%20...%20with%20no%20broader%20Concept%20...%0AFILTER%20NOT%20EXISTS%20%7B%20%3FESV_root%20skos%3Abroader%20%3Fanything%20%7D%0A%23%20...%20list%20level%202%20category%20below%20level%201%20with%20corresponding%20projects%20...%0A%3FESV_root%20%5Eskos%3Abroader%20%3FESV_level2%20.%0A%3FESV_level2%20%5Eskos%3Abroader*%2F%5Eeurio%3AhasEuroSciVocClassification%20%3Fproject%20.%0A%23%20...%20and%20EuroSciVoc%20corresponding%20skos-xl%20prefLabels%20...%0A%3FESV_root%20skosxl%3AprefLabel%2Fskosxl%3AliteralForm%20%3FESV_root_label.%0A%3FESV_level2%20skosxl%3AprefLabel%2Fskosxl%3AliteralForm%20%3FESV_level2_label.%0A%23%20...%20sorting%20by%20EuroSciVoc%20category%2C%20with%20English%20prefLabels%0AFILTER%20(lang(%3FESV_root_label)%20%3D%20'en')%0AFILTER%20(lang(%3FESV_level2_label)%20%3D%20'en')%0A%7D%20GROUP%20BY%20%3FESV_root_label%20%3FESV_level2_label%0AORDER%20BY%20%3FESV_root_label%0ALIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p>And a little last one with a count, to enumerate most used EuroSciVoc Concepts for indexing projects :</p>
<table>
<tbody>
<tr>
<td><strong>Most used EuroSciVoc Concepts for indexing projects</strong></p>
<p>PREFIX skosxl: &lt;http://www.w3.org/2008/05/skos-xl#&gt;<br />
PREFIX skos: &lt;http://www.w3.org/2004/02/skos/core#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
# count the number of projects by EuroSciVoc Concept &#8230;<br />
SELECT (COUNT (?project) as ?count) ?ESV<br />
WHERE {<br />
#  &#8230; select the projects with their acronyms &#8230;<br />
?project eurio:hasAcronym/eurio:shortForm ?acronym.<br />
# &#8230; with EuroSciVoc Classification prefLabels &#8230;<br />
?project eurio:hasEuroSciVocClassification/skosxl:prefLabel/skosxl:literalForm ?ESV.<br />
# &#8230; sorting by EuroSciVoc Concept, with English prefLabels<br />
FILTER (lang(?ESV) = &lsquo;en&rsquo;)<br />
} GROUP BY ?ESV<br />
ORDER BY DESC(?count)<br />
LIMIT 3000</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Most%20used%20EuroSciVoc%20Concepts%20for%20indexing%20projects%0A%0APREFIX%20skosxl%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2008%2F05%2Fskos-xl%23%3E%0APREFIX%20skos%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0A%23%20count%20the%20number%20of%20projects%20by%20EuroSciVoc%20Concept%20...%0ASELECT%20(COUNT%20(%3Fproject)%20as%20%3Fcount)%20%3FESV%0AWHERE%20%7B%0A%23%20%20...%20select%20the%20projects%20with%20their%20acronyms%20...%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%23%20...%20with%20EuroSciVoc%20Classification%20prefLabels%20...%0A%3Fproject%20eurio%3AhasEuroSciVocClassification%2Fskosxl%3AprefLabel%2Fskosxl%3AliteralForm%20%3FESV.%0A%23%20...%20sorting%20by%20EuroSciVoc%20Concept%2C%20with%20English%20prefLabels%0AFILTER%20(lang(%3FESV)%20%3D%20'en')%0A%7D%20GROUP%20BY%20%3FESV%0AORDER%20BY%20DESC(%3Fcount)%0ALIMIT%203000&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%201&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p><img src="https://s.w.org/images/core/emoji/72x72/1f4a1.png" alt="💡" class="wp-smiley" style="height: 1em; max-height: 1em;" />This one an ideal one to generate a word cloud maybe ?</p>
<p>What if we send the CSV data to <a href="https://wordart.com/create">some nice online word cloud generator</a> then ?</p>
<p><a href="https://wordart.com/r8zsokkk7ghu/untitled"><img class="aligncenter size-full wp-image-1710" src="http://blog.sparna.fr/wp-content/uploads/2024/01/Cordis-Taxo-Cloud.png" alt="Cordis Taxo Cloud" width="660" height="757" /></a></p>
<p>(OMG <a href="https://wordart.com/create">they also have a shooting star shape</a> <img src="https://s.w.org/images/core/emoji/72x72/1f320.png" alt="🌠" class="wp-smiley" style="height: 1em; max-height: 1em;" /> in there 🤩)</p>
<p><strong>As a conclusion&#8230;</strong></p>
<p><span style="font-weight: 400;">According to Science (CORDIS saying !), <a href="https://europa.eu/!vYVHXD">New Year’s resolutions appear difficult to be held</a></span><span style="font-weight: 400;">&#8230; because most of time too ambitious, restrictive or unprecisely formulated : indeed, « </span><span style="font-weight: 400;">the </span><a href="https://cordis.europa.eu/article/id/428767-trending-science-do-this-one-thing-to-keep-your-new-year-s-resolutions-research-says"><span style="font-weight: 400;">effectiveness of resolutions depends on how they are </span><b>framed</b></a><span style="font-weight: 400;">.</span><span style="font-weight: 400;"> »</span></p>
<p><span style="font-weight: 400;">Horizon 2024, let’s suggest a(n RDF ?) well-framed one : may CORDIS SPARQL endpoint initiative be an example for other structures who want to share Linked Open Data !</span></p>
<p><span style="font-weight: 400;"><strong>Wishing you Best Interoperability and a Very Merry ✨ Sparqling New Year !</strong> ✨</span></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2024/01/15/cordis-a-sparql-endpoint-is-born/">CORDIS : a SPARQL endpoint is born !</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2024/01/15/cordis-a-sparql-endpoint-is-born/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>2013-2023 : ‘Tis SKOSPlay!’s Birthday !</title>
		<link>https://blog.sparna.fr/2023/03/13/2013-2023-tis-skosplays-birthday/</link>
		<comments>https://blog.sparna.fr/2023/03/13/2013-2023-tis-skosplays-birthday/#comments</comments>
		<pubDate>Mon, 13 Mar 2023 14:28:53 +0000</pubDate>
		<dc:creator><![CDATA[Marie Muller]]></dc:creator>
				<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[Ontologies]]></category>
		<category><![CDATA[OWL]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[SHACL]]></category>
		<category><![CDATA[SHACL Play]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[Visualisation de données]]></category>
		<category><![CDATA[ontologie]]></category>
		<category><![CDATA[skos play]]></category>
		<category><![CDATA[thesaurus]]></category>
		<category><![CDATA[web sémantique]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1540</guid>
		<description><![CDATA[<p>Hi, it’s Marie (aka chutjetweet here). To be short I’m a documentalist, terminologist, old (linked &#8211; open) data maniac &#38; lil’ onto-Padawan and… just came to join Sparna’s team this early January ! To inaugurate my first article on Sparna’s blog, let’s share a little feedback of mine today about Sparna’s well-known SKOSPlay! whose 10 years’ birthday&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2023/03/13/2013-2023-tis-skosplays-birthday/">2013-2023 : ‘Tis SKOSPlay!’s Birthday !</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p><span style="font-weight: 400;">Hi, it’s Marie (aka chutjetweet </span><a href="https://twitter.com/chutjetweet"><span style="font-weight: 400;">here</span></a><span style="font-weight: 400;">). To be short I’m a documentalist, terminologist, old (linked &#8211; open) data maniac &amp; lil’ onto-Padawan and… just came to join Sparna’s team this early January !</span></p>
<p><span style="font-weight: 400;">To inaugurate my first article on Sparna’s blog, let’s share a little feedback of mine today about Sparna’s well-known </span><a href="https://skos-play.sparna.fr/play/"><span style="font-weight: 400;">SKOSPlay!</span></a><span style="font-weight: 400;"> whose 10 years’ birthday is to celebrate this year !</span></p>
<p><span style="font-weight: 400;">10 yo, quite a historic tool ! but more than ever actual in a context where the semantic technologies get front of the scene anew due to growing interest shown by the digital humanities movement to data interoperability projects via the standardized knowledge structuration (Wikipedia-Wikidata projects e.g., as semantic wiki devices), and also due to the last progress of artificial intelligence, now able to processing large amount of data and </span><a href="https://www.epimorphics.com/writing-ontologies-with-chatgpt/"><span style="font-weight: 400;">soon fully leveraging the potential of ontologies and knowledge graphs</span></a><span style="font-weight: 400;">.</span></p>
<table>
<tbody>
<tr>
<td><i><span style="font-weight: 400;"><a href="https://twitter.com/taxobob/status/1615594349512851456"><img class="alignnone wp-image-1561 size-full" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image5.png" alt="image5" width="878" height="321" /></a></span></i><em><span style="font-weight: 400;">From asking for a taxonomy </span><a href="https://twitter.com/mommi84/status/1631027355987656706"><span style="font-weight: 400;">to querying RDF files with an API</span></a><span style="font-weight: 400;">…</span></em></td>
</tr>
</tbody>
</table>
<p><span style="font-weight: 400;">This said, in a more practical way, semantic web standards are not always easy to manipulate as a professional &#8211; if non-initiate to SPARQL and nor confirmed data scientist, and even when you have got to deal with a simple structured list of terms !</span></p>
<p><span style="font-weight: 400;">Either your data is already SKOS-standardized (great !), there sometimes come to have a gap between normalization step and visualization step that requires a bit more technical IT skills. Either &#8211; most of time &#8211; the common muggle-born is to start with a plain Excel spreadsheet, create a list, add some hierarchy, maybe other scope notes or definitions and&#8230; end far puzzled wondering how to </span><span style="font-weight: 400;">get </span><a href="https://www.w3.org/DesignIssues/diagrams/lod/597992118v2_350x350_Back.jpg"><span style="font-weight: 400;">a 5-star data vocabulary</span></a><span style="font-weight: 400;"> ⭐ !</span></p>
<p>&nbsp;</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2023/03/image14.gif"><img class="alignnone size-full wp-image-1577" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image14.gif" alt="image14" width="500" height="208" /></a></p>
<p>&nbsp;</p>
<p><strong>A SKOSPlay!-within-a-SKOSPlay!</strong></p>
<table>
<tbody>
<tr>
<td><a href="https://twitter.com/belett/status/1583128873877008384"><img class="alignnone wp-image-1565 size-full" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image3.png" alt="image3" width="886" height="359" /></a><em><span style="font-weight: 400;">Wink to <a href="https://twitter.com/belett">@belett</a>, anything possible now with SKOSPlay!</span></em></td>
</tr>
</tbody>
</table>
<p><span style="font-weight: 400;">Aiming at visualizing (and printing !) SKOS thesauri, taxonomies and vocabularies at the very beginning, SKOSPlay! is a full online free and open source tool leveraging semantic technologies (RDF, SPARQL, inference, Linked Data) to generate downloadable HTML or PDF documents. More and more new features have been added since then : alignments display, OWL and SKOS-XL files processing, autocomplete fields and permuted indexes generating …</span></p>
<table>
<tbody>
<tr>
<td><a href="https://twitter.com/veronikaheim/status/1612375648948846592"><img class="alignnone size-full wp-image-1566" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image7.png" alt="image7" width="884" height="237" /></a><em><span style="font-weight: 400;">Hello <a href="https://twitter.com/veronikaheim">@veronikaheim</a>, maybe SKOSPlay! could match your need ?</span></em></td>
</tr>
</tbody>
</table>
<p><span style="font-weight: 400;">… among other nice and useful developments.</span></p>
<p><span style="font-weight: 400;">But as an Excel aficionada, the one that I prefer is </span><a href="https://skos-play.sparna.fr/play/convert?lang=en"><span style="font-weight: 400;">the Excel-to-RDF converter tool</span></a><span style="font-weight: 400;">.</span></p>
<p><span style="font-weight: 400;">One sheet. One import. One result. Easy-peasy, happy terminologist :))</span></p>
<p><span style="font-weight: 400;">(And you can even keep your custom colors templates and formats !!! </span><span style="font-weight: 400;">🦄</span><span style="font-weight: 400;"> )</span></p>
<p>&nbsp;</p>
<p><strong>Come on &amp; let’s SKOSPlay!</strong></p>
<p><span style="font-weight: 400;">Let&rsquo;s figure out you want to display or construct a small vocabulary you could quickly visualize in a standardized SKOS-structured way :</span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2023/03/image10-2.png"><img class="alignnone size-full wp-image-1607" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image10-2.png" alt="image10-2" width="1657" height="1079" /></a></p>
<p><span style="font-weight: 400;">Now to fit in the SKOS model your data has to follow </span><a href="https://skos-play.sparna.fr/play/excel_test/excel2skos-exemple-1.xlsx"><span style="font-weight: 400;">a particular template</span></a><span style="font-weight: 400;"> you can fullfill by downloading on SKOSPlay! website.</span></p>
<p><span style="font-weight: 400;">First you have to define </span><a href="https://skos-play.sparna.fr/play/convert#excel-file-structure"><span style="font-weight: 400;">the header of the template</span></a><span style="font-weight: 400;"> : the global scheme of your vocabulary, its URI, title and description :</span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2023/03/image12.png"><img class="alignnone size-full wp-image-1575" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image12.png" alt="image12" width="1347" height="189" /></a></p>
<p><span style="font-weight: 400;">Adding the terms of your list (with the URIs)… Here with the “@en” language indication on top of the column </span><a href="https://skos-play.sparna.fr/play/convert#languages"><span style="font-weight: 400;">as I am to create an English-French multilingual vocabulary</span></a><span style="font-weight: 400;"> :</span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2023/03/image15.png"><img class="alignnone size-full wp-image-1578" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image15.png" alt="image15" width="1509" height="1021" /></a></p>
<p><span style="font-weight: 400;">Recreating the arborescent structure through the Excel template (don’t mind my color palette, I always like colouring my Excel sheets to better visualize the info at a glance !).</span></p>
<p><span style="font-weight: 400;">The hierarchical broader-narrower structure is to be recreated </span><a href="https://skos-play.sparna.fr/play/convert#sheet-body"><span style="font-weight: 400;">by adding a “skos:narrower” column</span></a><span style="font-weight: 400;"> (or skos:broader, as you want, with only 1 broader value per line) where you will list the different specific values front of the more generic one (separated by comas). Here I used a PREFIX too in order to shorten my http:// URIs, SKOSPlay! can process them anyway !</span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2023/03/image9.png"><img class="alignnone size-full wp-image-1572" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image9.png" alt="image9" width="1943" height="1431" /></a></p>
<p><span style="font-weight: 400;">Then adding a few notes and other information (multilingual values, skos:notation, any other default properties known in the converter (</span><a href="https://skos-play.sparna.fr/play/convert#prefixes"><span style="font-weight: 400;">see the documentation</span></a><span style="font-weight: 400;">) or different custom elements of yours by adding other PREFIXes :</span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2023/03/image4.png"><img class="alignnone size-full wp-image-1569" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image4.png" alt="image4" width="1999" height="1269" /></a></p>
<p><span style="font-weight: 400;">Your Excel template is ready to go ! quite an easy configuration in my demo here, but SKOSPlay! can also deal with skos:Collections, SKOS-XL and other </span><a href="https://skos-play.sparna.fr/play/convert#advanced-features"><span style="font-weight: 400;">advanced RDF structures</span></a><span style="font-weight: 400;"> : blank nodes, RDF lists, named graphs. And now possible to generate OWL and SHACL files with the converter too !</span></p>
<p><span style="font-weight: 400;">Now it’s time to turn your (finally-not-so-dirty-<img src="https://s.w.org/images/core/emoji/72x72/1f438.png" alt="🐸" class="wp-smiley" style="height: 1em; max-height: 1em;" />) data into a SKOS-charming file. Take your favorite </span><del><span style="font-weight: 400;">magic wand</span></del><span style="font-weight: 400;"> SKOSPlay! </span><a href="https://skos-play.sparna.fr/play/convert"><span style="font-weight: 400;">Excel-to-RDF converter tool</span></a><span style="font-weight: 400;"> and load your Excel file in it (adding some optional parameters if needed).</span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2023/03/image8.png"><img class="alignnone size-full wp-image-1571" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image8.png" alt="image8" width="1601" height="885" /></a></p>
<p><span style="font-weight: 400;">Well done, it’s a wonderful RDF-ized vocabulary file (here in a Turtle format but you have also RDF/XML, N-Triples, N-Quads, N3 and TriG available) :</span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2023/03/image1.png"><img class="alignnone size-full wp-image-1567" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image1.png" alt="image1" width="1617" height="1029" /></a></p>
<p>&nbsp;</p>
<p><strong>Wingardium Visualiza !</strong></p>
<p>We&rsquo;re almost done. <span style="font-weight: 400;">Go back to the website, </span><a href="https://skos-play.sparna.fr/play/upload"><span style="font-weight: 400;">tab “Play!”</span></a><span style="font-weight: 400;">, load your last RDF-serialized file and go to the next step to chose the kind of display you want to get, endly press (SKOS)Play! and … abracadataaaaaaa !</span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2023/03/image2.png"><img class="alignnone size-full wp-image-1568" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image2.png" alt="image2" width="1657" height="1197" /></a></p>
<p><span style="font-weight: 400;">Many different options to visualize your arborescent data. Tree, static and dynamic, but also more « professional » and printable sorts of displays like alphabetical, hierarchical or permuted views :</span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2023/03/image6.png"><img class="alignnone size-full wp-image-1570" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image6.png" alt="image6" width="1999" height="1361" /></a></p>
<p><span style="font-weight: 400;">And KWIC (as for « </span><span style="font-weight: 400;">KeyWord In Context ») :</span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2023/03/image13.png"><img class="alignnone size-full wp-image-1576" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image13.png" alt="image13" width="1999" height="937" /></a></p>
<p>&nbsp;</p>
<p><span style="font-weight: 400;">Even possible to load an online Google spreadsheet (</span><a href="https://docs.google.com/spreadsheets/d/1MpN4tzd7S7m7Dnr7IFOz43YoWcSYqUG1/edit?usp=share_link&amp;ouid=118425122592371390359&amp;rtpof=true&amp;sd=true"><span style="font-weight: 400;">mine is shared here</span></a><span style="font-weight: 400;">), just by adapting a little its URL for the converter’s need. Interesting feature in a collaborative purpose when you are team-building a vocabulary !</span></p>
<p><span style="font-weight: 400;">The whole pack </span><a href="https://skos-play.sparna.fr/play/convert#documentation"><span style="font-weight: 400;">fully documented</span></a><span style="font-weight: 400;"> and findable on Sparna’s </span><a href="https://skos-play.sparna.fr/play/"><span style="font-weight: 400;">website</span></a><span style="font-weight: 400;"> &amp; </span><a href="https://github.com/sparna-git/skos-play"><span style="font-weight: 400;">Git</span></a><span style="font-weight: 400;">. Some recent users even produced a </span><a href="http://blog.sparna.fr/2021/06/30/fair-data-collective-is-doing-cool-things-with-skos-play-and-xls2rdf/"><span style="font-weight: 400;">short video tutorial</span></a><span style="font-weight: 400;"> to show what they managed to do with different SKOSPlay! visualization tools.</span></p>
<p><span style="font-weight: 400;">Already knew about SKOSPlay! ? go see his little brother, </span><a href="https://shacl-play.sparna.fr/play/home;jsessionid=40BBB04DA1F3DCC1EBFB084A08EE2924?lang=en"><span style="font-weight: 400;">SHACLPlay!</span></a><span style="font-weight: 400;"> and feel free to give us some feedback in the comments <img src="https://blog.sparna.fr/wp-includes/images/smilies/simple-smile.png" alt=":)" class="wp-smiley" style="height: 1em; max-height: 1em;" /></span></p>
<p><span style="font-weight: 400;">Happy Birthday SKOSPlay! &amp; Long live Semantic Web !</span></p>
<p><span style="font-weight: 400;">A bit more Vouvray with your nougat de Tours ?</span></p>
<p><a href="https://www.my-loire-valley.com/2018/06/top-10-des-specialites-gourmandes-de-touraine/"><img class="alignnone size-full wp-image-1574" src="http://blog.sparna.fr/wp-content/uploads/2023/03/image11.png" alt="image11" width="1280" height="939" /></a></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2023/03/13/2013-2023-tis-skosplays-birthday/">2013-2023 : ‘Tis SKOSPlay!’s Birthday !</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2023/03/13/2013-2023-tis-skosplays-birthday/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Thesaurus in time : publishing versions of ScoLOMFR vocabulary</title>
		<link>https://blog.sparna.fr/2018/09/25/thesaurus-versions-of-scolomfr-skos/</link>
		<comments>https://blog.sparna.fr/2018/09/25/thesaurus-versions-of-scolomfr-skos/#comments</comments>
		<pubDate>Tue, 25 Sep 2018 10:42:58 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[SKOS]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[scolomfr]]></category>
		<category><![CDATA[skosmos]]></category>
		<category><![CDATA[version]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1227</guid>
		<description><![CDATA[<p>In last May 2018, the controlled vocabularies of ScoLOMFR were published using Skosmos : https://www.reseau-canope.fr/scolomfr/data/fr/ (In French). ScoLOMFR is composed of 40 vocabularies (40 ConceptScheme) used to describe pedagogical resources by public and private organisations in France. This ensures the interoperability of the resource descriptions. it contains, amongst other thing, the official nomenclature of the&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/09/25/thesaurus-versions-of-scolomfr-skos/">Thesaurus in time : publishing versions of ScoLOMFR vocabulary</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">In last May 2018, the controlled vocabularies of <strong>ScoLOMFR</strong> were published using Skosmos : <strong><a href="https://www.reseau-canope.fr/scolomfr/data/fr/" target="_blank">https://www.reseau-canope.fr/scolomfr/data/fr/</a></strong> (In French).</p>
<p style="text-align: justify;">ScoLOMFR is composed of 40 vocabularies (40 ConceptScheme) used to describe pedagogical resources by public and private organisations in France. This ensures the interoperability of the resource descriptions. it contains, amongst other thing, the official nomenclature of the school programs in France.</p>
<p style="text-align: justify;">ScoLOMFR is maintained by <a href="https://www.reseau-canope.fr/">Réseau Canopé</a>; more information on ScoLOMFR can be found at <a href="https://www.reseau-canope.fr/scolomfr" target="_blank">https://www.reseau-canope.fr/scolomfr</a> (in French), and the announcement for this new version including the vocabulary browser is <a href="https://www.reseau-canope.fr/scolomfr/toutes-les-actualites/actualite.html?tx_news_pi1%5Bnews%5D=31&amp;tx_news_pi1%5Bcontroller%5D=News&amp;tx_news_pi1%5Baction%5D=detail&amp;cHash=2cceef10a2846926e04669c2f73e90bb">here</a>.</p>
<p style="text-align: justify;">A significant feature of this deployment is <strong>vocabulary versioning</strong>. The 6 successive versions of ScoLOMFR are available for browsing (each in a separate space), so that a resource indexer relying on a specific version can browse it. The URIs always dereference to the latest version (4.0 at the time of this writing) (try <a href="http://data.education.fr/voc/scolomfr/concept/scolomfr-voc-015-num-671" target="_blank">http://data.education.fr/<wbr />voc/scolomfr/concept/scolomfr-voc-015-num-671</a> for instance).</p>
<p style="text-align: justify;">The same concept thus exists in multiple vocabularies at the same time, with the same URI. It becomes then possible to display a <b>timeline of a concept</b> across versions :</p>
<p style="text-align: justify;"><a href="http://blog.sparna.fr/wp-content/uploads/2018/09/screenshot-concept-with-timeline.png"><img class="aligncenter wp-image-1230 size-full" title="SKOS concept timeline in Skosmos" src="http://blog.sparna.fr/wp-content/uploads/2018/09/screenshot-concept-with-timeline.png" alt="screenshot-concept-with-timeline" width="828" height="543" /></a>The timeline is clickable to <em><strong>jump in time</strong></em> and display the same concept in a different version.</p>
<p style="text-align: justify;">It also shows in which version a concept was deprecated and finally removed (e.g. <a href="http://data.education.fr/voc/scolomfr/concept/scolomfr-voc-045-num-001" target="_blank">http://data.education.fr/voc/scolomfr/concept/scolomfr-voc-045-num-001</a>) :</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/09/screenshot-timeline-deprecated.png"><img class="aligncenter size-full wp-image-1231" src="http://blog.sparna.fr/wp-content/uploads/2018/09/screenshot-timeline-deprecated.png" alt="Deprecated concept version timeline" width="814" height="203" /></a></p>
<p style="text-align: justify;">Note that all this does not require additionnal provenance or history data; it is a simple lookup of the Concept URI in all the versions loaded in Skosmos.</p>
<p style="text-align: justify;">Anyone interested can engage discussion on vocabulary versioning at <a href="https://github.com/NatLibFi/Skosmos/issues/677" target="_blank">https://github.com/NatLibFi/Skosmos/issues/677</a>, or <a href="http://sparna.fr/contact" target="_blank">get in touch</a> for any further information.</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/09/25/thesaurus-versions-of-scolomfr-skos/">Thesaurus in time : publishing versions of ScoLOMFR vocabulary</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2018/09/25/thesaurus-versions-of-scolomfr-skos/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Aligner son thesaurus avec RAMEAU en utilisant OnAGUI</title>
		<link>https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/</link>
		<comments>https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/#comments</comments>
		<pubDate>Tue, 17 Jul 2018 08:56:09 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Editeurs]]></category>
		<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[OnAGUI]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[alignement]]></category>
		<category><![CDATA[bnf]]></category>
		<category><![CDATA[data.bnf.fr]]></category>
		<category><![CDATA[mapping]]></category>
		<category><![CDATA[onagui]]></category>
		<category><![CDATA[Rameau]]></category>
		<category><![CDATA[thesaurus]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1212</guid>
		<description><![CDATA[<p>La BNF organisait le 10 juillet 2018 un atelier &#171;&#160;Données liées et données à lier : quels outils pour quels alignements ?&#171;&#160;, avec plein de bonnes choses dedans : RobotDonnées, le module développé par Logilab pour data.bnf.fr qui permet le regroupement semi-automatique des éditions en œuvres; où l&#8217;on apprend que data.bnf.fr ne comporte &#171;&#160;que&#160;&#187; 300&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/">Aligner son thesaurus avec RAMEAU en utilisant OnAGUI</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">La BNF organisait le 10 juillet 2018 un <a href="https://bnf.hypotheses.org/3077">atelier &laquo;&nbsp;<em>Données liées et données à lier : quels outils pour quels alignements ?</em>&laquo;&nbsp;</a>, avec plein de bonnes choses dedans :</p>
<ul>
<li style="text-align: justify;">RobotDonnées, le module développé par Logilab pour data.bnf.fr qui permet le regroupement semi-automatique des éditions en œuvres;
<ul>
<li>où l&rsquo;on apprend que <a href="http://data.bnf.fr">data.bnf.fr</a> ne comporte &laquo;&nbsp;que&nbsp;&raquo; 300 000 œuvres, alors que la cible théorique serait à plusieurs millions; par exemple on voit bien en regardant <a href="http://data.bnf.fr/12249911/michel_houellebecq/#rdt70-12249911">les oeuvres dont Michel Houellebecq est auteur dans data.bnf.fr</a> que &laquo;&nbsp;<em>La carte et le territoire</em>&nbsp;&raquo; n’apparaît pas comme œuvre, mais que toutes les éditions de cet ouvrage sont bien listées quand on regarde <a href="http://data.bnf.fr/documents-by-rdt/12249911/70/page1">tous les documents dont Houellebecq est l&rsquo;auteur</a>.</li>
<li>où l&rsquo;on apprend également que ce regroupement en œuvre est progressivement réintroduit dans le catalogue général de la BNF;</li>
</ul>
</li>
<li style="text-align: justify;">BiblioStratus, pour aligner un catalogue externe avec celui de la BNF sur la base de plusieurs heuristiques (ISBN, EAN ou bien titre+auteur+date ou titre+auteur); où l&rsquo;on apprend que la transition n&rsquo;est pas qu&rsquo;écologique mais qu&rsquo;il existe également une <a href="https://www.transition-bibliographique.fr/17-06-20-notice-bibliographique-manifestation-notice-autorite-titre-oeuvre/">transition bibliographique</a>;</li>
<li style="text-align: justify;">l&rsquo;ANR <a href="https://project.inria.fr/elker/">ELKER</a> pour &laquo;&nbsp;Enhancing Link Keys: Extraction and Reasoning&nbsp;&raquo;, porté notamment par l&rsquo;INRIA Grenoble pour la détection automatique des attributs permettant de trouver des correspondances dans 2 jeux de données RDF arbitraires; très impressionnant;</li>
<li style="text-align: justify;"><a href="http://cultuurlink.beeldengeluid.nl">CultuurLink</a>, à tester pour tous ceux qui s&rsquo;intéressent aux processus d&rsquo;alignement de vocabulaires, bien que l&rsquo;outil soit restreint aux vocabulaires patrimoniaux des Pays-Bas;</li>
<li style="text-align: justify;"><em>et encore plein d&rsquo;autres choses (cf les liens sur la page de l&rsquo;atelier);</em></li>
</ul>
<h2 style="text-align: justify;">OnAGUI pour aligner 2 thesaurus SKOS</h2>
<p style="text-align: justify;">Je voulais profiter de cette thématique des alignements pour parler d&rsquo;un autre outil d&rsquo;alignement de thesaurus SKOS : <strong><a href="https://github.com/lmazuel/onagui">OnAGUI</a> </strong>pour &laquo;&nbsp;<em>Ontology Alignment Graphical Interface</em>&laquo;&nbsp;. OnAGUI est le genre d&rsquo;outil qui ne paie pas de mine au premier abord mais qui est à mon avis<strong> l&rsquo;outil dont la prise en main est la plus immédiate pour qui veut aligner 2 thesaurus en SKOS, </strong>tout en permettant d&rsquo;<strong>outiller le processus depuis l&rsquo;alignement linguistique automatique jusqu&rsquo;à la validation manuelle de l&rsquo;alignement produit</strong>.</p>
<div id="attachment_1170" style="width: 660px" class="wp-caption aligncenter"><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet.png"><img class="size-large wp-image-1170" src="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet-1024x582.png" alt="L'interface d'OnAGUI pour aligner 2 thesaurus" width="650" height="369" /></a><p class="wp-caption-text">L&rsquo;interface d&rsquo;OnAGUI pour aligner 2 thesaurus</p></div>
<p style="text-align: justify;">Quelques considérations générales : d&rsquo;abord l&rsquo;acronyme parle d&rsquo;alignement d&rsquo; &laquo;&nbsp;ontologies&nbsp;&raquo;, mais pas de panique, ça marche pour des <strong>thesaurus en SKOS</strong>; surtout pour des thesaurus en SKOS, d&rsquo;ailleurs. Ensuite, c&rsquo;est <strong>open-source</strong>; ça s&rsquo;installe facilement sur n&rsquo;importe quel poste équipé de Java, c&rsquo;est une <strong>application &laquo;&nbsp;de bureau&nbsp;&raquo;</strong>, qui ne nécessite pas d&rsquo;infrastructure client-serveur, etc. l&rsquo;interface est en <strong>français</strong> (et anglais) puisque le développement à été fait par <a href="https://github.com/lmazuel">Laurent Mazuel</a> à l&rsquo;époque où il travaillait avec <a href="http://www.limics.fr/fr/annuaire/fiche-membre/voir/18-CHARLET-Jean">Jean Charlet</a> au <a href="http://www.limics.fr/fr/">LIMICS</a> (INSERM). L&rsquo;outil est maintenu, notamment par votre serviteur.</p>
<p style="text-align: justify;">Vous pouvez consulter la <a href="https://github.com/lmazuel/onagui/wiki">documentation d&rsquo;OnAGUI</a> où vous trouverez des informations plus détaillées sur le logiciel.</p>
<h2 style="text-align: justify;">Alignement avec RAMEAU</h2>
<p style="text-align: justify;">Maintenant, le cas d&rsquo;usage : il m&rsquo;ait arrivé de rencontrer des personnes qui avaient besoin d&rsquo;<strong>aligner un vocabulaire vers le <a href="http://rameau.bnf.fr/">langage d&rsquo;indexation RAMEAU de la BNF</a></strong>. Comment faire ?</p>
<ol>
<li style="text-align: justify;">Je ne détaille pas ici la structure de RAMEAU et son mécanisme de &laquo;&nbsp;vedettes-matières pré-coordonnées&nbsp;&raquo; que je ne connais pas bien d&rsquo;ailleurs, mais je pars (naïvement) de ce qui existe : le fichier des Thèmes Rameau que l&rsquo;on télécharge depuis le site des <a href="http://api.bnf.fr/dumps-de-databnffr">dumps de données de la BNF</a>. Il s&rsquo;agit du fichier intitulé &laquo;&nbsp;<a href="ftp://databnf:databnf@pef.bnf.fr/DATA/databnf_rameau_xml.tar.gz">[RDF/XML] Thèmes RAMEAU</a>&laquo;&nbsp;.</li>
<li style="text-align: justify;">A ce stade il faut l&rsquo;avouer : <em>la BNF a encore des efforts à faire sur diffusion des données de RAMEAU</em>; les données telles qu&rsquo;on les télécharge sont inutilisables telles qu&rsquo;elles, et nécessitent : 1/ un nettoyage et 2/ une fusion en un seul fichier; je ne m&rsquo;étends pas sur cette étape que j&rsquo;ai réalisé à l&rsquo;aide de scripts <a href="http://rdf4j.org">RDF4J</a> dont je me sers régulièrement, mais on se ramène au final à un seul fichier RDF contenant tout RAMEAU en SKOS; si vous voulez tester OnAGUI sur un autre vocabulaire ne nécessitant pas cette étape de &laquo;&nbsp;magie noire&nbsp;&raquo;, essayez avec <a href="http://vocabularies.unesco.org/browser/en/about">le thesaurus de l&rsquo;UNESCO</a> ou <a href="http://data.europa.eu/euodp/fr/data/dataset/eurovoc">Eurovoc</a>;</li>
<li style="text-align: justify;">Il faut ensuite avoir son propre thesaurus en SKOS; on peut utiliser pour cela l&rsquo;<a href="http://labs.sparna.fr/skos-play/convert">outil de conversion Excel vers SKOS disponible dans SKOS Play</a>;</li>
<li style="text-align: justify;">Il faut <a href="https://github.com/lmazuel/onagui/releases">télécharger OnAGUI</a> en prenant soin de prendre une version postérieure à 0.3.2, version pour laquelle des améliorations ont été apportées pour fonctionner avec RAMEAU;</li>
<li>Muni donc de votre vocabulaire en SKOS d&rsquo;un côté, de RAMEAU (nettoyé) de l&rsquo;autre, et d&rsquo;OnAGUI entre les deux, vous pouvez ensuite :
<ol>
<li style="text-align: justify;">Charger votre thesaurus dans OnaGUI (Menu &laquo;&nbsp;Fichier &gt; Charger vocabulaire 1 &gt; Charger en SKOS&nbsp;&raquo;);</li>
<li style="text-align: justify;">Charger RAMEAU dans OnaGUI (Menu &laquo;&nbsp;Fichier &gt; Charger vocabulaire 2 &gt; Charger en SKOS&nbsp;&raquo;), qui va vaillamment charger 160000+ concepts;</li>
<li style="text-align: justify;">Lancer un alignement linguistique (Menu &laquo;&nbsp;Alignement &gt; I-Sub distance&nbsp;&raquo;) en prenant soin de :
<ol>
<li>sélectionner la langue &laquo;&nbsp;fr&nbsp;&raquo; dans les 2 thesaurus;</li>
<li>abaisser légèrement le seuil de tolérance de l&rsquo;algorithme, en le mettant à 0.85 par exemple; ne le mettez pas trop bas sinon vous aurez trop de correspondances qui ne veulent rien dire, ni trop haut sinon vous allez rater des choses;</li>
</ol>
</li>
<li style="text-align: justify;">Aller prendre un petit café, ou deux, ou trois&#8230; en fonction de la taille du vocabulaire que vous avez besoin d&rsquo;aligner; patientez entre quelques secondes et une nuit entière;</li>
<li style="text-align: justify;">Analyser le tableau de résultat fourni et soit :
<ol>
<li>supprimer des lignes de correspondances fausses; regardez le score de chaque correspondance : plus le score tend vers 1, meilleure est la correspondance linguisitique, plus le score diminue, plus les libellés sont éloignés;</li>
<li>ajouter des nouvelles correspondances qui auraient été ratées;</li>
</ol>
</li>
<li style="text-align: justify;">Puis exporter l&rsquo;alignement (Menu &laquo;&nbsp;Fichier &gt; Exporter l&rsquo;alignemenr&nbsp;&raquo;) soit dans un format RDF <a href="http://alignapi.gforge.inria.fr/edoal.html">EDOAL</a>, le plus expressif, soit avec les <a href="https://www.w3.org/TR/2009/REC-skos-reference-20090818/#mapping">propriétés d&rsquo;alignement SKOS</a>, soit en CSV pour une analyse dans un tableur;</li>
</ol>
</li>
</ol>
<div id="attachment_1216" style="width: 537px" class="wp-caption aligncenter"><a href="http://blog.sparna.fr/wp-content/uploads/2018/07/onagui-rameau.png"><img class="wp-image-1216 size-full" src="http://blog.sparna.fr/wp-content/uploads/2018/07/onagui-rameau.png" alt="Vocabulaire Rameau dans OnaGUI" width="527" height="903" /></a><p class="wp-caption-text">Vocabulaire Rameau chargé dans OnaGUI</p></div>
<p>&nbsp;</p>
<p style="text-align: justify;">OnAGUI est un outil perfectible sur bien des aspects mais qui permet de valider &laquo;&nbsp;pour de vrai&nbsp;&raquo; des alignements sur des vrais projets, sans besoin d&rsquo;infrastructure compliquée ou d&rsquo;outil commercial. J&rsquo;ai pu le mettre en œuvre à 2 reprises : pour l&rsquo;alignement du <a href="https://vocabulaires.irstea.fr/">thesaurus de l&rsquo;IRSTEA</a> vers le <a href="http://www.eionet.europa.eu/gemet/en/themes/">GEMET</a> et <a href="http://aims.fao.org/vest-registry/vocabularies/agrovoc">Agrovoc</a>, et plus récemment pour un essai d&rsquo;alignement du <a href="http://data.legilux.public.lu/vocabulaires/legal-subject-theme/fr/">vocabulaire thématique d&rsquo;indexation de la loi Luxembourgeoise</a> avec le <a href="http://eurovoc.europa.eu/">thesaurus Eurovoc</a> utilisé au niveau européen, sur la base de l&rsquo;analyse des <a href="https://fr.wikipedia.org/wiki/Transposition_(droit)">transpositions des directives européennes</a> dans la loi nationale. Il peut également prendre en charger des cas d&rsquo;usage d&rsquo;<em>alignement partiel</em>, en alignant seulement les concepts créés ou modifiés après une certaine date, de façon à ne pas à avoir à refaire l&rsquo;intégralité de l&rsquo;alignement à chaque nouvelle version du thesaurus.</p>
<p style="text-align: justify;">Si vous avez des questions, des cas d&rsquo;usage ou des retours d&rsquo;expérience sur OnAGUI, n&rsquo;hésitez pas à <a href="https://github.com/lmazuel/onagui/issues">soumettre des tickets dans le site du projet</a>.</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/">Aligner son thesaurus avec RAMEAU en utilisant OnAGUI</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2018/07/17/aligner-thesaurus-rameau-onagui/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Vocabulaires dans le web de données : quels outils open-source ?</title>
		<link>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/</link>
		<comments>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/#comments</comments>
		<pubDate>Tue, 23 Jan 2018 10:43:08 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Editeurs]]></category>
		<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[OnAGUI]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Skosmos]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[ginco]]></category>
		<category><![CDATA[onagui]]></category>
		<category><![CDATA[opentheso]]></category>
		<category><![CDATA[skos play]]></category>
		<category><![CDATA[skos testing tool]]></category>
		<category><![CDATA[skosmos]]></category>
		<category><![CDATA[vocbench]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1157</guid>
		<description><![CDATA[<p>Je travaille régulièrement sur des projets de gestion et/ou de mise en ligne de vocabulaires (thesaurus, taxonomies) en SKOS : pour l&#8217;UNESCO &#8211; voir le précédent billet -, l&#8217;INED (thesaurus Popin), le Luxembourg, l&#8217;IRSTEA ou le Réseau Canopé (vocabulaire ScolomFr). Ces projets sont réalisés en utilisant de l&#8217;open-source sur toute la chaîne, depuis le back-office&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/">Vocabulaires dans le web de données : quels outils open-source ?</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">Je travaille régulièrement sur des <strong>projets de gestion et/ou de mise en ligne de vocabulaires (thesaurus, taxonomies)</strong> en <a href="http://www.sparna.fr/skos/SKOS-traduction-francais.html">SKOS</a> : pour l&rsquo;<a href="http://vocabularies.unesco.org">UNESCO</a> &#8211; voir le <a href="http://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/">précédent billet</a> -, l&rsquo;<a href="https://www.ined.fr/">INED</a> (thesaurus Popin), le <a href="http://data.legilux.public.lu/">Luxembourg</a>, l&rsquo;<a href="http://irstea.fr">IRSTEA</a> ou le <a href="https://www.reseau-canope.fr/">Réseau Canopé</a> (vocabulaire <a href="https://www.reseau-canope.fr/scolomfr/accueil.html">ScolomFr</a>). Ces projets sont réalisés en utilisant de l&rsquo;open-source sur toute la chaîne, depuis le back-office de gestion jusqu&rsquo;à la diffusion conforme aux standards du web de données, en passant par l&rsquo;alignement ou la conversion depuis des tableaux Excel.</p>
<p>&nbsp;</p>
<p style="text-align: justify;"><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees.jpg"><img class=" wp-image-1158 size-full aligncenter" src="http://blog.sparna.fr/wp-content/uploads/2018/01/Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees.jpg" alt="Outils-pour-la-publication-des-thesaurus-dans-le-web-de-donnees" width="960" height="720" /></a></p>
<p style="text-align: justify;">Je vous propose un petit <strong>tour d&rsquo;horizon des outils open-source pour la gestion et la diffusion de vocabulaires contrôlés</strong>.</p>
<h1>Outils de gestion</h1>
<h2>Vocbench3</h2>
<p style="text-align: justify;"><a href="http://vocbench.uniroma2.it/">Vocbench3</a> est l&rsquo;outil de gestion de référentiels SKOS que je recommande. Il est développé par l&rsquo;Université de Rome Tor-Vergata, et financé pour 1 ou 2 année encore par le programme de financement européen ISA, ce qui lui donne une bonne visibilité à moyen terme. La <a href="http://vocbench.uniroma2.it/support/community.jsf">communauté d&rsquo;utilisateurs</a> est large avec beaucoup d&rsquo;organismes internationaux (FAO/<a href="http://aims.fao.org/vest-registry/vocabularies/agrovoc-multilingual-agricultural-thesaurus">Agrovoc</a>, INRA, Office des Publications de l&rsquo;UE/<a href="http://eurovoc.europa.eu/">Eurovoc</a>, etc.). Le support est bon, l&rsquo;équipe de développement répond rapidement aux questions.</p>
<p style="text-align: justify;">Coté technique, il est directement basé sur des données RDF, ce qui facilite son intégration dans des environnements techniques basés sur le web de données. Le modèle de données est extensible et permet de gérer des propriétés &laquo;&nbsp;customisées&nbsp;&raquo; sur les concepts. Vocbench permet également d&rsquo;éditer des ontologies OWL, sans arriver à concurrencer <a href="https://protege.stanford.edu/">Protégé</a>.</p>
<p style="text-align: justify;"><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/td_eurovoc_show.png"><img class="aligncenter wp-image-1166 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/td_eurovoc_show-1024x646.png" alt="td_eurovoc_show" width="650" height="410" /></a></p>
<h2 style="text-align: justify;">Ginco</h2>
<p style="text-align: justify;"><a href="https://github.com/culturecommunication/ginco">Ginco</a> est l&rsquo;outil de gestion de vocabulaires développé par le Ministère de la Culture pour la maintenance de ses référentiels. Il a été dès le départ spécifié pour être compatible avec la norme <a href="http://dossierdoc.typepad.com/descripteurs/2011/08/norme-iso-25964-1-thesaurus-publication-officielle.html">ISO-25964</a> sur la modélisation des thesaurus, et avec SKOS. Donc en particulier la gestion des facettes, des tableaux de concepts, etc. Il a un pendant &laquo;&nbsp;<a href="https://github.com/culturecommunication/ginco-diff">Ginco diffusion</a>&nbsp;&raquo; qui motorise le <a href="http://data.culture.fr/thesaurus/">site de diffusion des vocabulaires du MCC</a>.</p>
<h2 style="text-align: justify;">OpenTheso</h2>
<p style="text-align: justify;"><a href="https://github.com/miledrousset/opentheso">OpenTheso</a> est l&rsquo;outil de gestion SKOS <em>made in</em> CNRS. La communauté d&rsquo;utilisateurs est dans le monde de la recherche française/francophone (notamment le réseau <a href="https://www.frantiq.fr/">FRANTIQ</a>).<br />
On pourra consulter la <a href="http://semweb.pro/semwebpro-2017.html#p3">présentation d&rsquo;OpenTheso à semweb.pro 2017 par Miled Rousset</a>.</p>
<h1>Outils de Publication et Visualisation de vocabulaires</h1>
<h2>Skosmos</h2>
<p style="text-align: justify;">Vous voulez <strong>valoriser vos vocabulaires/thesaurus/taxonomies</strong> ? Vous avez besoin des les rendre visibles, navigables, interrogeables par les utilisateurs ? Vous voulez recevoir du feedback, faire participer une communauté ? <a href="http://skosmos.org/">Skosmos</a> est l&rsquo;outil de choix.<br />
Développé par la Bibliothèque Nationale de Finlande pour son portail &laquo;&nbsp;<a href="http://finto.fi">finto.fi</a>&nbsp;&raquo; (parlez-vous finnois ?), Skosmos propose une interface de rendu très propre avec toutes les fonctions de navigation dans des vocabulaires contrôlés : listes alphabétiques, arborescence hiérarchique, recherche plain-texte avec autocompletion, gestion des groupes/collections SKOS, affichage propre des alignements avec d&rsquo;autres vocabulaires. Il s&rsquo;adapte assez facilement pour le mettre aux couleurs de l&rsquo;institution. Il prend en charge la négociation de contenu pour l&rsquo;accès aux données brutes en RDF. L&rsquo;interface inclut également un formulaire permettant d&rsquo;envoyer du feedback à l&rsquo;équipe de maintenance du thesaurus.</p>
<p style="text-align: justify;">L&rsquo;équipe de développement répond très vite aux questions, le code PHP est de qualité, l&rsquo;outil est vivant et de nouvelles versions sont disponibles régulièrement.</p>
<p style="text-align: justify;">Skosmos est à mon sens <strong>LE meilleur outil pour la diffusion de vocabulaires en SKOS</strong>.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skosmos-finto.png"><img class="aligncenter wp-image-1168 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skosmos-finto-1024x597.png" alt="screenshot-skosmos-finto" width="650" height="379" /></a></p>
<h2>Skos Play</h2>
<p style="text-align: justify;"><a href="http://labs.sparna.fr/skos-play/">SKOS Play</a> est l&rsquo;outil que je développe depuis 2013 pour faire de la publication et de la visualisation de référentiels SKOS. Il permet de générer des documents PDF des vocabulaires, des sorties HTML dynamiques (arbres dépliables),des listings alphabétiques, des tableaux de traduction ou d&rsquo;alignement, ou des data visualisations. A titre d&rsquo;exemple on pourra consulter les <a href="http://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/">rendus du code Rome de Pôle Emploi en SKOS</a>.</p>
<p style="text-align: justify;">SKOS Play est intégré dans la plateforme de publication des vocabulaires du MCC, et dans celle de l&rsquo;UNESCO, pour la <a href="http://vocabularies.unesco.org/exports/thesaurus/latest/">génération des PDFs</a>. Le service en ligne est quant à lui utilisé plus de <strong>500 fois par mois</strong>.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/code-rome-visualisation-arbre.png"><img class="aligncenter wp-image-1164 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/code-rome-visualisation-arbre-1024x557.png" alt="code-rome-visualisation-arbre" width="650" height="354" /></a></p>
<h1>Conversion Excel, contrôle qualité, alignement</h1>
<h2>Skos Play convert</h2>
<p style="text-align: justify;">SKOS Play inclut un <a href="http://labs.sparna.fr/skos-play/convert">service de génération de données RDF/SKOS depuis des tableaux Excel</a> (voir <a href="http://blog.sparna.fr/2017/01/12/creer-des-referentiels-skosrdf-a-partir-dexcel/">précédent billet</a>).</p>
<p style="text-align: justify;">Soyons honnêtes : <strong>rien ne remplace Excel</strong> <img src="https://blog.sparna.fr/wp-includes/images/smilies/simple-smile.png" alt=":-)" class="wp-smiley" style="height: 1em; max-height: 1em;" /> ! pour de la saisie ou de l&rsquo;analyse de données en masse, avoir une vue globale sur ces données, faire des reporting, gérer facilement plusieurs vocabulaires&#8230; Pas de courbe d&rsquo;apprentissage, pas d&rsquo;outil à installer, grande efficacité de saisie. Et si on utilise un environnement en ligne type Google Sheets, on gagne l&rsquo;aspect collaboratif.<br />
Cette passerelle Excel-RDF-SKOS s&rsquo;est révélée très importante pour faire les reprises ou les créations initiales de vocabulaires, avant de les basculer dans des outils de gestion comme VocBench.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/convert-screenshot-body.png"><img class="aligncenter wp-image-1163 size-full" src="http://blog.sparna.fr/wp-content/uploads/2018/01/convert-screenshot-body.png" alt="convert-screenshot-body" width="1490" height="335" /></a></p>
<h2>Skos Testing Tool : contrôle qualité</h2>
<p style="text-align: justify;">Le <a href="http://labs.sparna.fr/skos-testing-tool/">SKOS Testing Tool</a> est une interface web permettant de valider la conformité de fichiers SKOS (voir <a href="http://blog.sparna.fr/2017/07/11/outil-de-test-de-vocabulaires-skos/">précédent billet</a>). L&rsquo;outil s&rsquo;appuie sur <a href="https://github.com/cmader/qSKOS">qSKOS</a>, qui fonctionne lui en ligne de commande. 27 vérifications peuvent être effectuées sur les données, comme :</p>
<ul style="text-align: justify;">
<li>vérification de l&rsquo;absence de cycle dans la hiérarchie des concepts</li>
<li>vérification que tous les concepts ont bien un prefLabel</li>
<li>vérification que tous les concepts sont traduits (dans le cas de thesaurus multilingues)</li>
<li>&#8230;</li>
</ul>
<p style="text-align: justify;">Combiné avec les sorties alphabétiques/hiérarchiques de SKOS Play, ces vérifications permettent de s&rsquo;assurer de la qualité des données soit en amont lors des comités de validation du vocabulaire, soit en aval avant la diffusion des données en ligne dans Skosmos.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skos-testing-tool.png"><img class="aligncenter wp-image-1172 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/screenshot-skos-testing-tool-1024x715.png" alt="screenshot-skos-testing-tool" width="650" height="454" /></a></p>
<h2>OnaGUI : Alignement semi-automatique</h2>
<p style="text-align: justify;"><a href="https://github.com/lmazuel/onagui">OnaGUI</a> (Ontology Alignment Graphical User Interface) a été développé à l&rsquo;origine à l&rsquo;INSERM dans l&rsquo;équipe de <a href="http://www.limics.fr/fr/annuaire/fiche-membre/voir/18-CHARLET-Jean">Jean Charlet</a> pour faire de l&rsquo;alignement d&rsquo;ontologies médicales, et il a depuis été adapté pour pouvoir aligner des données SKOS.</p>
<p style="text-align: justify;">C&rsquo;est l&rsquo;outil le plus accessible et le plus simple d&rsquo;utilisation pour aligner 2 vocabulaires : on charge un thesaurus à gauche, un thesaurus à droite, et on lance un algorithme d&rsquo;alignement qui va proposer des correspondances sur la base des proximités des libellés des concepts.</p>
<p style="text-align: justify;">On utilise régulièrement OnaGUI pour illustrer les alignements de thesaurus dans les <a href="https://www.adbs.fr/formations/formation-comprendre-web-semantique-et-ontologies-167">formations web de données à l&rsquo;ADBS</a>.</p>
<p style="text-align: justify;">Si on veut utiliser des algorithmes d&rsquo;alignement plus poussés, on se tournera vers l&rsquo;<a href="http://alignapi.gforge.inria.fr/">API d&rsquo;alignement de l&rsquo;INRIA</a>, mais qui demande du développement technique pour être intégrée dans un outil.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet.png"><img class="aligncenter wp-image-1170 size-large" src="http://blog.sparna.fr/wp-content/uploads/2018/01/onagui-irstea-gemet-1024x582.png" alt="onagui-irstea-gemet" width="650" height="369" /></a></p>
<h2>Quels outils manquent ?</h2>
<p>Quels outils manquent dans l&rsquo;écosystème des vocabulaires dans le web de données ?</p>
<ul>
<li>Probablement des outils faciles à mettre en œuvre pour assister à la <strong>création de vocabulaires à partir d&rsquo;analyse de corpus</strong> (détection d&rsquo;entités, agrégation des mots en concepts, etc.); en connaissez-vous ? <a href="https://www.ibm.com/watson/products-services/">IBM Watson</a> ne ferait pas quelque chose comme ça ?</li>
<li>Des <strong>interfaces d&rsquo;alignement puissantes</strong> faciliteraient la mise en réseau des référentiels (des choses comme <a href="http://cultuurlink.beeldengeluid.nl">cultuurlink</a>, mais généralisées);</li>
<li>Une <strong>gestion des versions successives</strong> des vocabulaires, avec calcul de deltas, génération automatique de ce qui a changé entre 2 versions, etc;</li>
<li>Des <strong>plugins dans les CMS</strong> courants (WordPress, Drupal, etc&#8230;) permettant d&rsquo;importer directement des vocabulaires SKOS, et de les mettre à jour; ça doit bien exister, non ? également des ponts faciles et direct vers SolR et ElasticSearch;</li>
<li>Mon rêve : un <strong>outil d&rsquo;édition des vocabulaires en mode collaboratif et ouvert poussé</strong>, en mode SaaS, sans différence entre l&rsquo;environnement d&rsquo;édition et de publication, permettant de faire collaborer une communauté plus large que quelques éditeurs experts; ça viendra un jour ! <img src="https://blog.sparna.fr/wp-includes/images/smilies/simple-smile.png" alt=":-)" class="wp-smiley" style="height: 1em; max-height: 1em;" /></li>
</ul>
<p><em><strong>Et vous, quels outils vous manquent ?</strong></em></p>
<p><em>(Illustration de l&rsquo;article : &laquo;&nbsp;Atelier Heilmann Ducommun pour la construction de machines-outils&nbsp;&raquo; Gallica <a href="http://gallica.bnf.fr/ark:/12148/btv1b10201510v" target="_blank">http://gallica.bnf.fr/ark:/12148/btv1b10201510v</a>)</em></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/">Vocabulaires dans le web de données : quels outils open-source ?</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2018/01/23/vocabulaires-thesaurus-web-donnees-skos-open-source/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
		<item>
		<title>Outil de test de vocabulaires SKOS</title>
		<link>https://blog.sparna.fr/2017/07/11/outil-de-test-de-vocabulaires-skos/</link>
		<comments>https://blog.sparna.fr/2017/07/11/outil-de-test-de-vocabulaires-skos/#comments</comments>
		<pubDate>Tue, 11 Jul 2017 08:11:39 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Thesaurus]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1151</guid>
		<description><![CDATA[<p>Nous avons développé un outil de test de vocabulaires SKOS (&#171;&#160;SKOS Testing Tool&#160;&#187;). Cette application est une interface vers l&#8217;outil de validation qSKOS de Christian Mader. L&#8217;application est gratuite, open-source, sans login, et en français ! Vous pouvez soumettre des demandes d&#8217;évolution ou des remontées de bug sur le Github du projet. L&#8217;outil permet de&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/07/11/outil-de-test-de-vocabulaires-skos/">Outil de test de vocabulaires SKOS</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Nous avons développé un <strong><a href="http://labs.sparna.fr/skos-testing-tool" target="_blank">outil de test de vocabulaires SKOS</a></strong> (&laquo;&nbsp;SKOS Testing Tool&nbsp;&raquo;). Cette application est une interface vers l&rsquo;outil de validation <a href="https://github.com/cmader/qSKOS" target="_blank"><strong>qSKOS</strong></a> de Christian Mader.</p>
<p>L&rsquo;application est gratuite, open-source, sans login, et en français ! Vous pouvez soumettre des demandes d&rsquo;évolution ou des remontées de bug sur <a href="https://github.com/tfrancart/skos-testing-tool" target="_blank">le Github du projet</a>. L&rsquo;outil permet de :</p>
<ul>
<li>valider un fichier SKOS uploadé ou à partir d&rsquo;une URL;</li>
<li>sélectionner les règles à vérifier;</li>
<li>récupérer le résultat de la validation dans un rapport HTML, le format texte brut de qSKOS, ou en RDF dans le <a href="https://www.w3.org/TR/vocab-dqv/" target="_blank">Data Quality Vocabulary</a> DQV;</li>
<li>pointer directement sur l&rsquo;URL du rapport de test à partir d&rsquo;une URL de fichier SKOS (voir les détails sur <a href="https://github.com/tfrancart/skos-testing-tool#linking-directly-to-a-report-from-a-skos-file-url" target="_blank">la page de documentation Github</a>);</li>
</ul>
<h3>Vous avez dit &laquo;&nbsp;test de SKOS&nbsp;&raquo; ?</h3>
<p>On peut distinguer plusieurs niveaux de règles dans <a href="https://github.com/cmader/qSKOS/wiki/Quality-Issues" target="_blank">les règles vérifiées par qSKOS et l&rsquo;outil de test</a> :</p>
<p><strong>Les contraintes formelles</strong> : SKOS défini peu de contraintes formelles :</p>
<ul>
<li>un concept ne doit pas avoir plus d&rsquo;un skos:prefLabel par langue</li>
<li>un même libellé ne peut pas être à la fois prefLabel ou altLabel</li>
<li>une entrée ne peut pas être à la fois Concept et Collection</li>
<li>et c&rsquo;est à peu près tout.</li>
</ul>
<p><strong>Les conventions SKOS</strong> : SKOS donne des contraintes qui sont plus des conventions ou des bonnes pratiques :</p>
<ul>
<li>les relations d&rsquo;alignement sont à utiliser entre des ConceptScheme différents</li>
<li>il faut mieux ne pas avoir d&rsquo;homonymes dans un ConceptScheme</li>
<li>les skos:notation doivent être uniques dans un même ConceptScheme</li>
<li>un Concept marqué comme &laquo;&nbsp;top concept&nbsp;&raquo; (racine) ne doit normalement pas avoir de skos:broader</li>
<li>etc.</li>
</ul>
<p><strong>Les &laquo;&nbsp;boulettes classiques&nbsp;&raquo; :</strong></p>
<ul>
<li>Concepts sans libellés;</li>
<li>Cycles dans la hiérarchie des concepts;</li>
<li>Caractères spéciaux dans les libellés (copier-coller depuis Word&#8230;)</li>
<li>etc&#8230;</li>
</ul>
<p><strong>Les bonnes pratiques de publications de données liées</strong> : L&rsquo;outil vérifie quelques autres bonnes pratiques de publication :</p>
<ul>
<li>Il faut mieux que les concepts soient documenter avec des propriétés de documentation SKOS;</li>
<li>Il faut mieux qu&rsquo;ils soient reliés à d&rsquo;autres concepts dans le vocabulaire (avec des broader, narrower ou related);</li>
<li>Il faut mieux qu&rsquo;ils fassent référence à d&rsquo;autres données sur le web (linked data);</li>
</ul>
<h3>Correction automatique des fichiers</h3>
<p>La prochaine grande étape après le test sera de proposer des corrections automatiques des données pour certain problèmes, similaires à ce que fait <a href="https://github.com/NatLibFi/Skosify/wiki/Validation" target="_blank">Skosify</a>.</p>
<p>A vos vocabulaires !</p>
<p><em>Illustration : &laquo;&nbsp;Usage des nouvelles mesures&nbsp;&raquo; sur Gallica : <a href="http://gallica.bnf.fr/ark:/12148/btv1b8412951c" target="_blank">http://gallica.bnf.fr/ark:/12148/btv1b8412951c</a></em></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/07/11/outil-de-test-de-vocabulaires-skos/">Outil de test de vocabulaires SKOS</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2017/07/11/outil-de-test-de-vocabulaires-skos/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Référentiel ROME de Pôle Emploi en SKOS (à partir de data.gouv.fr)</title>
		<link>https://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/</link>
		<comments>https://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/#comments</comments>
		<pubDate>Tue, 18 Apr 2017 08:31:17 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Open Data]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[Visualisation de données]]></category>
		<category><![CDATA[data.gouv.fr]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[rome]]></category>
		<category><![CDATA[skos play]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web de données de l'emploi]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1132</guid>
		<description><![CDATA[<p>Etalab, la mission chargée de la politique Open Data de l’administration aujourd’hui intégrée à la DSI de l’Etat, vient d’ouvrir le portail du service public de la donnée (lire l&#8217;article sur silicon.fr) : des jeux de données de référence, &#171;&#160;à fort impact économique et social&#160;&#187;, d&#8217;un niveau de qualité et de fraîcheur garanti. Parmi ceux-ci&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/">Référentiel ROME de Pôle Emploi en SKOS (à partir de data.gouv.fr)</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">Etalab, la mission chargée de la politique Open Data de l’administration aujourd’hui intégrée à la DSI de l’Etat, vient d’ouvrir le <a href="http://www.data.gouv.fr/fr/reference" target="_blank">portail du service public de la donnée</a> (lire l&rsquo;<a href="http://www.silicon.fr/open-data-service-public-donnee-ouvre-171799.html" target="_blank">article sur silicon.fr</a>) : des jeux de données de référence, &laquo;&nbsp;à fort impact économique et social&nbsp;&raquo;, d&rsquo;un niveau de qualité et de fraîcheur garanti. Parmi ceux-ci le <strong><a href="https://www.data.gouv.fr/fr/datasets/repertoire-operationnel-des-metiers-et-des-emplois-rome/" target="_blank">Répertoire Opérationnel des Métiers et de l&rsquo;Emploi (ROME)</a></strong>, la classification utilisée par Pôle Emploi.</p>
<p style="text-align: justify;">A partir des fichiers de données du Répertoire Opérationnel des Métiers et de l&rsquo;Emploi, j&rsquo;ai mis en ligne des <a href="http://labs.sparna.fr/code-rome.html" target="_blank"><strong>visualisations de données du ROME</strong></a>, après nettoyage, traitement, et conversion des données en <a href="http://www.sparna.fr/skos/SKOS-traduction-francais.html">SKOS</a>.</p>
<h3 style="text-align: justify;">Le Répertoire ROME</h3>
<p style="text-align: justify;">Ce répertoire ROME m&rsquo;avait intéressé il y a 4 ans lorsque j&rsquo;avais effectué une mission pour l&rsquo;optimisation sémantique du moteur de recherche SolR d&rsquo;un <em>job board</em>. Nous nous étions demandé à l&rsquo;époque si nous pouvions réutiliser une partie de ce référentiel pour effectuer un rapprochement (automatique ou manuelle) des titres d&rsquo;annonces d&rsquo;emplois vers le référentiel. Cela aurait permis, à partir de l&rsquo;identification du nom du poste, de <strong>catégoriser automatiquement les annonces dans la catégorie ROME appropriée</strong>. Le ROME contient en effet plus de <strong>11000 dénominations de postes/métiers</strong>, catégorisés dans une double classification : une arborescence principale, et une arborescence thématique. On y trouve donc des entrées comme :</p>
<ul style="text-align: justify;">
<li><span id="19f41e49-c1fc-4e81-9b60-c5805abd8aab1348877816"><span class="ext-uri" title="http://data.sparna.fr/vocabulaires/code-rome/G1201-3570">Accompagnateur / Accompagnatrice en écotourisme</span></span></li>
<li>Responsable de rayon produits alimentaires</li>
<li>Assistant / Assistante mise en scène</li>
<li>etc.</li>
</ul>
<p style="text-align: justify;">Ces noms de postes sont organisés dans une classification à 3 niveaux : &laquo;&nbsp;AGRICULTURE ET PÊCHE, ESPACES NATURELS ET ESPACES VERTS, SOINS AUX ANIMAUX &gt; Espaces naturels et espaces verts &gt; Bûcheronnage et élagage&nbsp;&raquo;. Le 3eme niveau (ici &laquo;&nbsp;Bûcheronnage et élagage&nbsp;&raquo;) correspond à une <strong>fiche métier</strong> (ici <a href="http://candidat.pole-emploi.fr/marche-du-travail/fichemetierrome?codeRome=A1201">http://candidat.pole-emploi.fr/marche-du-travail/fichemetierrome?codeRome=A1201</a>) et est associé à un code (ici A1201).</p>
<div style="width: 1189px" class="wp-caption aligncenter"><a href="http://labs.sparna.fr/code-rome.html"><img src="http://labs.sparna.fr/code-rome/code-rome-arborescence.png" alt="" width="1179" height="716" /></a><p class="wp-caption-text">Arborescence principale du code ROME dans SKOS-Play</p></div>
<h3 style="text-align: justify;">Conversion en SKOS</h3>
<p style="text-align: justify;">Je suis reparti ici des fichiers bruts fournis sur data.gouv.fr, et j&rsquo;ai passé un peu de temps à les convertir en SKOS avec le <a href="http://labs.sparna.fr/skos-play/convert" target="_blank">convertisseur Excel vers SKOS de SKOS Play</a> :</p>
<ul style="text-align: justify;">
<li>ajustement manuel de certaines valeurs mal séparées par des virgules dans le fichier CSV de départ;</li>
<li>suppression des guillemets simples et doubles;</li>
<li>fusion des 2 fichiers fournis (arborescence principale et arborescence thématique);</li>
<li>réorganisation des colonnes;</li>
</ul>
<p style="text-align: justify;">Il s&rsquo;agit ensuite de construire un tableau Excel au format adéquat pour une conversion vers SKOS, en adaptant la structure des fichiers, typiquement en calculant le contenu de nouvelles colonnes avec des formules Excel. En particulier, il s&rsquo;agit de <strong>donner des identifiants URI à toutes les entrées du code ROME, pour arriver ainsi à des <a href="http://5stardata.info/fr/">données open data &laquo;&nbsp;4 étoiles&nbsp;&raquo;</a>.  </strong>Cette conversion SKOS est relativement aisée à réaliser, <strong>sans écriture de code ni script</strong>. Elle est accessible à toute personne capable de manipuler Excel.</p>
<p style="text-align: justify;">Ces données SKOS du ROME sont publiées à <a href="http://data.sparna.fr/vocabulaires/code-rome"><strong>http://data.sparna.fr/vocabulaires/code-rome</strong></a>.</p>
<p style="text-align: justify;">Je ne rentrerai pas dans les détails de modélisation du ROME en SKOS, sauf sur 1 point : on peut <strong>se demander ce qu&rsquo;il convient d&rsquo;identifier comme &laquo;&nbsp;Concept&nbsp;&raquo;</strong> dans ce référentiel. J&rsquo;ai pris le parti de considérer chaque nom de <em>poste</em> comme un <a href="http://www.w3.org/2004/02/skos/core#Concept">skos:Concept</a>, et tous les éléments de classification thématiques comme des <a href="http://www.w3.org/2004/02/skos/core#Collection">skos:Collection</a> (donc des tiroirs, qui ne sont pas utilisables dans une indexation). Un point de vue différent mais tout aussi valable serait de considérer non pas les noms de <em>poste</em> comme des concepts, mais bien les noms de <em>métier</em>, chaque métier ayant une correspondance avec une fiche sur le site Pôle Emploi; les noms de poste seraient alors des synonymes (<a href="http://www.w3.org/2004/02/skos/core#altLabel">skos:altLabel</a>) du métier (dans l&rsquo;exemple au-dessus, le métier A1202 &laquo;&nbsp;Bûcheronnage et élagage&nbsp;&raquo; aurait alors pour synonymes &laquo;&nbsp;Agent / Agente d&rsquo;aménagement des haies et fossés&nbsp;&raquo;, &laquo;&nbsp;Agent / Agente d&rsquo;entretien des espaces naturels&nbsp;&raquo;, &laquo;&nbsp;Ouvrier / Ouvrière d&rsquo;entretien des espaces naturels&nbsp;&raquo;, etc.).</p>
<h3 style="text-align: justify;">Visualisations de données</h3>
<p style="text-align: justify;">A partir des données SKOS, on peut ensuite générer des visualisations avec <a href="http://labs.sparna.fr/skos-play">SKOS Play</a> : ces visualisations sont publiés à <strong><a href="http://labs.sparna.fr/code-rome.html" target="_blank">http://labs.sparna.fr/code-rome.html</a></strong>. 3 visualisations ont été produites :</p>
<ol style="text-align: justify;">
<li><a href="http://labs.sparna.fr/code-rome/code-rome-autocomplete-pole-emploi.html">Un champ de recherche assisté</a> (avec une autocompletion sur les noms des métiers), permettant de lancer une recherche d&rsquo;annonces sur le site Pôle Emploi à partir d&rsquo;un nom de métier; on pourrait imaginer quelque chose de similaire pour accéder aux fiches métiers plutôt qu&rsquo;aux annonces;</li>
<li><a href="http://labs.sparna.fr/code-rome/code-rome-visualisation-arbre.html">Une vue arborescente</a> avec d3js, permettant de naviguer visuellement dans l&rsquo;arbre;</li>
<li><a href="http://labs.sparna.fr/code-rome/code-rome-arborescence.html">Un listing indenté</a> en HTML, que l&rsquo;on peut plier et déplier;</li>
</ol>
<p>On notera que, sauf pour l&rsquo;articulation entre le champ de recherche assisté et le site de Pôle Emploi qui demande 10 lignes de javascript, ces visualisations sont produites directement par SKOS Play sans avoir à écrire de code.</p>
<h3 style="text-align: justify;">Un &laquo;&nbsp;Web des données de l&rsquo;emploi&nbsp;&raquo; ?</h3>
<p style="text-align: justify;">On a donc ici fait passer le référentiel ROME à un meilleur niveau de qualité des données, permettant une intégration facilitée dans d&rsquo;autres systèmes, d&rsquo;autres outils de recherche. Au delà de la démonstration sur la conversion et la visualisation de données, j&rsquo;aimerai dans une deuxième étape illustrer l&rsquo;<strong>alignement des données du ROME avec d&rsquo;autres référentiels</strong> (probablement <a href="https://ec.europa.eu/esco/portal/home">ESCO</a>), en utilisant <a href="https://github.com/lmazuel/onagui">OnaGUI,</a> qui permet de simplifier les alignements de vocabulaires. On aurait alors un beau référentiel 5 étoiles, <em>_dans_</em> le web (et pas simplement <em>_sur_</em> le web), avec des correspondances vers d&rsquo;autres données. Un <strong>&laquo;&nbsp;web des données de l&rsquo;emploi&nbsp;&raquo;</strong> ? il fallait bien ça à quelques jours des présidentielles !</p>
<p style="text-align: justify;">Dans une deuxième étape je publierai le SKOS généré pour que les URIs soient déréférençables, en utilisant <a href="http://skosmos.org/">SKOSMOS</a>, dans un déploiement similaire à celui utilisé pour <a href="http://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/">publier le thesaurus de l&rsquo;UNESCO</a>.</p>
<p style="text-align: justify;">J&rsquo;espère que cette conversion de données en SKOS permettra une diffusion et une intégration plus large de ce référentiel utile pour la recherche d&rsquo;emplois. Dites-moi si vous réutilisez ces données pour d&rsquo;autres visualisations ou d&rsquo;autres systèmes, ou si vous souhaitez de l&rsquo;aide pour son intégration.</p>
<p style="text-align: justify;"><em>Illustration de l&rsquo;article tirée de Wikimedia Commons : <a href="https://fr.wikipedia.org/wiki/Fichier:Metro_de_Paris_-_Ligne_2_-_Rome_07.jpg">https://fr.wikipedia.org/wiki/Fichier:Metro_de_Paris_-_Ligne_2_-_Rome_07.jpg</a></em></p>
<p style="text-align: justify;">
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/">Référentiel ROME de Pôle Emploi en SKOS (à partir de data.gouv.fr)</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>UNESCO Thesaurus published with Semantic Web standards and Open-Source software</title>
		<link>https://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/</link>
		<comments>https://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/#comments</comments>
		<pubDate>Mon, 06 Feb 2017 08:03:10 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[Open Data]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Skosmos]]></category>
		<category><![CDATA[SPARQL]]></category>
		<category><![CDATA[Thesaurus]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1102</guid>
		<description><![CDATA[<p>Sparna conducted in 2016 the replacement of the Thesaurus Management Software and thesaurus publication platform for the UNESCO, with Open-Source tools all relying on Semantic Web technologies. The result is the new UNESCO vocabularies publication platform at http://vocabularies.unesco.org. The project was conducted in 2 phases : a new thesaurus publication platform based on Skosmos, SKOS&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/">UNESCO Thesaurus published with Semantic Web standards and Open-Source software</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;"><a href="http://sparna.fr">Sparna</a> conducted in 2016 the replacement of the Thesaurus Management Software and thesaurus publication platform for the <a href="http://uensco.org">UNESCO</a>, with Open-Source tools all relying on Semantic Web technologies. The result is the <strong>new UNESCO vocabularies publication platform at <a href="http://vocabularies.unesco.org">http://vocabularies.unesco.org</a></strong>. The project was conducted in 2 phases : a new thesaurus publication platform based on <a href="http://skosmos.org/">Skosmos</a>, <a href="http://labs.sparna.fr/skos-play/">SKOS Play</a> and <a href="https://jena.apache.org/documentation/fuseki2/">Fuseki</a>, and in a second phase the deployment of <a href="http://vocbench.uniroma2.it/">VocBench</a> as the new Thesaurus Management Software. The system leverages Semantic Web standards by relying on <a href="https://www.w3.org/TR/2009/REC-skos-reference-20090818/">SKOS</a> as the data exchange format, <a href="https://www.w3.org/TR/sparql11-query/">SPARQL</a> as the online thesaurus query language, and dereferancable URI identifiers.</p>
<h2 style="text-align: justify;"><strong>The new thesaurus browser</strong></h2>
<p style="text-align: justify;">The first objective was to replace the thesaurus publication platform, while maintaining existing backoffice tools for thesaurus management. This choice allowed to quickly demonstrate a publicly available interface for searching and browsing the vocabulary, without waiting for the deployment of the complete system.</p>
<p style="text-align: justify;"><a href="https://github.com/NatLibFi/Skosmos">Skosmos</a> was used as the thesaurus browser; it is easy to deploy, well documented, and the team behind it from the National Library of Finland is super-reactive for fixing bugs. It offers out-of-box features like alphabetical/hierarchical browsing, autocomplete search, URI-based content negociation, and a feedback form. Important aspects for UNESCO were the ability to have a multilingual interface (English, French, Spanish, Russian), the possibility to customize the stylesheets/logo/help page, or the order of the fields in a concept display page. We added a direct link to trigger a search in the UNESDOC database from a concept page in Skosmos, thus easily linking the new thesaurus browser to the existing resource center.</p>
<div id="attachment_1108" style="width: 660px" class="wp-caption aligncenter"><a href="http://blog.sparna.fr/wp-content/uploads/2017/01/screenshot-skosmos-small.png"><img class="wp-image-1108 size-large" src="http://blog.sparna.fr/wp-content/uploads/2017/01/screenshot-skosmos-small-1024x676.png" alt="unesco-skosmos" width="650" height="429" /></a><p class="wp-caption-text">UNESCO thesaurus published in Skosmos</p></div>
<p style="text-align: justify;">2 additionnal components were used for a complete vocabulary publishing solution; <a href="http://labs.sparna.fr/skos-play/">SKOS Play</a> was used to generate <a href="http://vocabularies.unesco.org/exports/thesaurus/latest/">downloadable PDF documents generated from the SKOS thesaurus</a> : complete editions of the thesaurus with alphabetical index, hierarchical tree and translation tables, and KWIC indexes, each in French, English, Spanish and Russian. The documents are regenerated automatically each time a new version of the thesaurus is published. <a href="https://jena.apache.org/documentation/fuseki2/">Fuseki</a> with a customized SPARLQ form is used as the frontend for <a href="http://vocabularies.unesco.org/sparql">public SPARQL querying of the thesaurus</a>.</p>
<p style="text-align: justify;">Meron Ewketu, responsible for the UNESCO thesaurus, describes the benefits of the new publication platform : <em>&laquo;&nbsp;The obvious benefit is the enhanced user interface : a nice hierarchical display, a powerful search, an easy navigation between the different language versions. Thanks to these features <strong>the platform was immediately endorsed by our user community</strong>. </em><em>What is also very much appreciated is the possibility of responding to various user needs in terms of format and content. Being able to extract part of the thesaurus as per our users’ requirements, and being able to deliver the content in a variety of formats, including PDF, using the SPARQL endpoint and SKOS Play. </em><em>We have also noticed an <strong>increase in user participation</strong>. The feedback form enabled us to engage with our users more easily.</em>&laquo;&nbsp;</p>
<h2 style="text-align: justify;">The Collaborative Thesaurus Management Software</h2>
<p style="text-align: justify;">The second phase of the project aimed at replacing the old thesaurus management software, and integrating it with the new thesaurus browser. UNESCO and Sparna chose to deploy <a href="http://vocbench.uniroma2.it/">VocBench</a>, an open-source SKOS-based thesaurus management solution from the Tor Vergata University in Rome. We also considered <a href="https://github.com/culturecommunication/ginco">Ginco</a> as a possible alternative; VocBench was chosen mainly for its ability to properly handle collaborative multi-user maintenance of the thesaurus; this was an important aspect for UNESCO, having remote contributors to the thesaurus in Russia, and translations in Chinese and Arabic coming in the future; the ability to work remotely and to have a validation workflow of the modifications was essential. In addition, <a href="http://vocbench.uniroma2.it/support/community.jsf">Vocbench is already deployed by other international organizations</a>, and the <a href="https://groups.google.com/d/msg/vocbench-user/S2Nn05osD24/onVn30AhBgAJ">upcoming v3 of Vocbench</a> is funded by the ISA2 program of the European Union, thus giving garantees as to the maintenance of the application in the next few years.</p>
<div id="attachment_1109" style="width: 660px" class="wp-caption aligncenter"><a href="http://blog.sparna.fr/wp-content/uploads/2017/01/screenshot-vocbench.png"><img class="wp-image-1109 size-large" src="http://blog.sparna.fr/wp-content/uploads/2017/01/screenshot-vocbench-1024x510.png" alt="unesco-vocbench" width="650" height="324" /></a><p class="wp-caption-text">UNESCO Thesaurus managed in VocBench</p></div>
<p style="text-align: justify;">VocBench is SKOS-XL from the bottom up and stores the thesaurus data in an RDF triplestore. We chose to deploy <a href="http://graphdb.ontotext.com/">GraphDB from Ontotext</a> as the backend for VocBench. VocBench offers user profile management and edition workflow management, multilingual thesaurus editing, and the possibility to add custom attributes to the thesaurus concepts and terms. We used this to capture corresponding country codes and language codes for certain concepts in the UNESCO thesaurus with a small <a href="http://vocabularies.unesco.org/ontology/">UNESCO vocabulary publishing ontology</a> describing these 2 properties.</p>
<p style="text-align: justify;">The deployment in production of Vocbench is fairly complex, essentially due to the middleware component on which it relies, called <a href="http://semanticturkey.uniroma2.it/">SemanticTurkey</a>; VocBench requires a total of 4 pieces of software (relationnal database, RDF triplestore, SemanticTurkey server, VocBench application server). But, once you are familiar with the procedure, and again with the precious help of the community on th <a href="https://groups.google.com/forum/#!forum/vocbench-user">mailing-list</a>, everything works fine. Another limitation of VocBench v2 is that it does not support SKOS Collections, only ConceptSchemes.</p>
<p style="text-align: justify;">Ms Ewketu explains the benefits of VocBench : &laquo;&nbsp;A<em>part from the obvious functionalities of collaborative and distributed maintenance, other important aspects for us were the ability to <strong>manage several vocabularies</strong> and the ability to <strong>make alignments with other thesauri</strong>. </em><em>Being able to document changes through history notes is something very interesting, which I am sure we will exploit in the future. This is quite interesting for researchers who study the evolution of terminology, within an organization.</em>&laquo;&nbsp;</p>
<h2 style="text-align: justify;"><em>&laquo;&nbsp;<strong>leverage the thesaurus to achieve interoperability</strong>&laquo;&nbsp;</em></h2>
<p style="text-align: justify;">The project clearly is a success story for Semantic Web technologies : with URIs, RDF and SKOS as W3C standards, the <strong>UNESCO has achieved its mission of transforming its thesaurus into open, reusable data</strong>. The thesaurus is now available for browsing by humans and in machine-readable formats. URIs makes it open for linking from/to other knowledge organization systems on the web, thus enabling interoperability between document databases of multiple organizations.</p>
<p style="text-align: justify;">The project is also a great success story for Open Source; the support from the community and the maintainers of both Skosmos and VocBench was essential for such a quality achievement, and Sparna and UNESCO contributed to both communities by providing translations, filing bug reports and testing new versions. It shows how these tools have enabled the UNESCO to replace an entire thesaurus management platform with <strong>no licensing cost, no vendor or data lock-in</strong>.</p>
<p style="text-align: justify;">&laquo;&nbsp;<em><strong>The main benefit of this project for us will be to leverage the thesaurus to achieve interoperability</strong> between our different repositories, as well as with external datasets.&nbsp;&raquo; c</em>oncludes Ms Ewketu from UNESCO.<em> &laquo;&nbsp;We are currently working on integrating the new thesaurus within the various information systems. Next phase will be mapping our thesaurus with vocabularies such as the <a href="https://lib-thesaurus.un.org/LIB/DHLUNBISThesaurus.nsf/zHelpDocuments/English+About+Help?OpenDocument">UN Thesaurus</a> and <a href="http://eurovoc.europa.eu/">Eurovoc</a>.&nbsp;&raquo;</em></p>
<hr />
<p style="text-align: justify;"><em>Want to learn more ? reach me at thomas /dot/ francart /at/ sparna /dot/ fr. </em></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/">UNESCO Thesaurus published with Semantic Web standards and Open-Source software</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/feed/</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
		<item>
		<title>Créer des référentiels SKOS/RDF à partir d&#8217;Excel</title>
		<link>https://blog.sparna.fr/2017/01/12/creer-des-referentiels-skosrdf-a-partir-dexcel/</link>
		<comments>https://blog.sparna.fr/2017/01/12/creer-des-referentiels-skosrdf-a-partir-dexcel/#comments</comments>
		<pubDate>Thu, 12 Jan 2017 14:55:12 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Editeurs]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[convertisseur]]></category>
		<category><![CDATA[excel]]></category>
		<category><![CDATA[google spreadsheets]]></category>
		<category><![CDATA[skos play]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1084</guid>
		<description><![CDATA[<p>Les projets de &#171;&#160;moteurs de recherche sémantiques&#160;&#187;, ou de &#171;&#160;d&#8217;accès intelligent à l&#8217;information&#160;&#187; nécessitent de mettre au point, reprendre et maintenir des référentiels d&#8217;autorités : concepts d&#8217;indexation, liste de personnes, organisations, lieux, etc. Ces référentiels d&#8217;autorité forment l&#8217;embryon d&#8217;un Knowledge Graph de l&#8217;organisation. RDF et/ou SKOS sont de bonnes technologies pour implémenter ce Knowledge Graph&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/01/12/creer-des-referentiels-skosrdf-a-partir-dexcel/">Créer des référentiels SKOS/RDF à partir d&rsquo;Excel</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">Les projets de &laquo;&nbsp;moteurs de recherche sémantiques&nbsp;&raquo;, ou de &laquo;&nbsp;d&rsquo;accès intelligent à l&rsquo;information&nbsp;&raquo; nécessitent de mettre au point, reprendre et maintenir des <strong>référentiels d&rsquo;autorités</strong> : concepts d&rsquo;indexation, liste de personnes, organisations, lieux, etc. Ces référentiels d&rsquo;autorité forment l&rsquo;embryon d&rsquo;un <a href="https://www.google.com/intl/fr_fr/insidesearch/features/search/knowledge.html">Knowledge Graph</a> de l&rsquo;organisation. RDF et/ou SKOS sont de bonnes technologies pour implémenter ce Knowledge Graph de par leur structure en graphe, leur absence de modèle contraint et la possibilité de récupérer des données liées sur le web pour enrichir la connaissance interne. La maintenance et le travail sur ce graphe de connaissance peut nécessiter des outils professionnels et commerciaux; mais ils ne sont pas toujours justifiés et les projets simples et les approches pragmatiques feraient mieux de favoriser <strong>l&rsquo;outil le plus simple pour commencer à créer un Knowledge Graph : <a href="https://products.office.com/fr-fr/excel" target="_blank">Excel</a></strong>.</p>
<p style="text-align: justify;">Ce besoin de génération de données RDF à partir de tableaux éditables par tous, sans courbe d&rsquo;apprentissage, est récurrent. C&rsquo;est pourquoi <a href="http://labs.sparna.fr/skos-play">SKOS Play</a> vient d&rsquo;être enrichi avec un nouveau <a href="http://labs.sparna.fr/skos-play/convert" target="_blank"><strong>convertisseur de tableaux Excel vers SKOS / RDF</strong></a>. On créé un fichier Excel, on le structure en respectant quelques règles, on le soumet au convertisseur, et celui-ci nous renvoie un fichier RDF/SKOS. Le convertisseur contient quelques règles prédéfinies pour générer du SKOS mais permet très facilement de générer du RDF utilisant n&rsquo;importe quel vocabulaire (<a href="http://schema.org" target="_blank">schema.org</a>, SHACL, etc.).</p>
<p style="text-align: justify;"><strong>Ce convertisseur en ligne ne demande rien à télécharger, rien à installer, pas de login à créer, n&rsquo;a pas de limitations, et est entièrement <a href="http://labs.sparna.fr/skos-play/convert#documentation" target="_blank">documenté</a>.</strong> Il permet sans aucune courbe d&rsquo;apprentissage de créer des données RDF/SKOS, par des documentalistes ou professionnels de l&rsquo;information sans formation sur ces notions. Ce développement a été en partie financé par le gouvernement Luxembourgeois dans le cadre du développement de la <a href="http://legilux.public.lu" target="_blank">nouvelle version du portail de recherche Legilux</a> sur la législation luxembourgeoise, qui s&rsquo;appuie sur un certain nombre de référentiels contrôlés (testez l&rsquo;autocompletion du champ de recherche pour vous en rendre compte).<strong><br />
</strong></p>
<h2>Format des fichiers Excel</h2>
<p style="text-align: justify;">Le formulaire de conversion inclut un certain nombre de fichiers Excel d&rsquo;exemples que vous pouvez télécharger pour les adapter à vos propres données, pour respecter le format de tableau attendu par le convertisseur (reportez-vous à la <a href="http://labs.sparna.fr/skos-play/convert#documentation" target="_blank">documentation en ligne</a>). Ce format est très simple :</p>
<ul style="text-align: justify;">
<li>quelques informations d&rsquo;entête dans les premières lignes (URI du ConceptScheme / graphe nommé, métadonnées descriptives du référentiel, déclaration des préfixes, etc.);</li>
<li>une ligne déclarant les propriétés RDF correspondant à chaque colonne;</li>
<li>puis ensuite une ligne par entrée, avec son URI dans la première colonne puis les valeurs de chaque propriétés dans les colonnes suivante;</li>
</ul>
<p style="text-align: justify;">Ce qui donne :</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2017/01/screenshot_excel_convert.png"><img class="aligncenter wp-image-1088 size-full" src="http://blog.sparna.fr/wp-content/uploads/2017/01/screenshot_excel_convert.png" alt="screenshot_excel_convert" width="1253" height="384" /></a></p>
<h2>Génération de données RDF</h2>
<p style="text-align: justify;">Le convertisseur supporte tout le modèle SKOS, y compris les skos:Collection, skos:OrderedCollection, le SKOS-XL, etc. avec toutes les facilités de saisie correspondantes (possibilité d&rsquo;inverser le sens des propriétés, de barrer certaines cellules pour qu&rsquo;elles ne soient pas converties, etc.). Et pour ceux qui veulent aller plus loin, le convertisseur supporte toutes les constructions RDF avancées :</p>
<ul style="text-align: justify;">
<li>déclaration de préfixes;</li>
<li>littéraux avec langues ou datatypes;</li>
<li>noeuds anonymes;</li>
<li>listes RDF;</li>
<li>graphes nommés;</li>
</ul>
<p style="text-align: justify;">Le convertisseur a été éprouvé dans plusieurs projets en production pour la génération de référentiels d&rsquo;autorité (personnes, organisations, status, etc.), de concepts SKOS enrichis avec des métadonnées d&rsquo;autres vocabulaires, et de configuration de Shapes en <a href="http://blog.sparna.fr/2017/01/02/shacl-rdf-shapes-constraint-language-enfin-la-possibilite-de-valider-des-donnees-rdf/" target="_blank">SHACL</a>.</p>
<h2>Intégration avec Google Spreadsheet</h2>
<p style="text-align: justify;">Excel c&rsquo;est bien. Excel collaboratif c&rsquo;est mieux. C&rsquo;est pourquoi <strong>le convertisseur s&rsquo;intègre directement avec <a href="https://docs.google.com/spreadsheets/u/0/" target="_blank">Google Spreadsheets</a></strong>. Le résultat ? on peut éditer ses tableaux à plusieurs en même temps dans un document en ligne Google, puis se connecter dans le convertisseur avec son login Google, choisir le fichier dans la liste des fichiers de notre Drive, et convertir ce fichier à la volée.</p>
<p style="text-align: justify;">Le web sémantique n&rsquo;a pas besoin d&rsquo;être compliqué.</p>
<p><em>Crédit photo : By Piet Mondrian &#8211; Gemeentemuseum Den Haag,  Public Domain, <a href="https://commons.wikimedia.org/w/index.php?curid=37614350">https://commons.wikimedia.org/w/index.php?curid=37614350</a></em></p>
<p><script type="application/ld+json">// <![CDATA[
{
 "@context": "http://schema.org",
 "@type": "WebApplication",
 "name": "SKOS Play convert",
 "url": "http://labs.sparna.fr/skos-play/convert",
 "applicationCategory": "Semantic web application",
 "description": "SKOS Play convert allows generating RDF/SKOS data from Excel tables",
 "keywords": "Excel, RDF, SKOS"
}
// ]]&gt;</script></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/01/12/creer-des-referentiels-skosrdf-a-partir-dexcel/">Créer des référentiels SKOS/RDF à partir d&rsquo;Excel</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2017/01/12/creer-des-referentiels-skosrdf-a-partir-dexcel/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>SKOS Play : alignments, SKOS-XL, autocomplete search fields, and more !</title>
		<link>https://blog.sparna.fr/2015/01/05/skos-play-thesaurus-alignments-skos-xl-autocomplete-search-fields/</link>
		<comments>https://blog.sparna.fr/2015/01/05/skos-play-thesaurus-alignments-skos-xl-autocomplete-search-fields/#comments</comments>
		<pubDate>Mon, 05 Jan 2015 11:16:56 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[alignment]]></category>
		<category><![CDATA[skos play]]></category>
		<category><![CDATA[skos-xl]]></category>
		<category><![CDATA[thesaurus]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=855</guid>
		<description><![CDATA[<p>There have been a lot of improvements and news on SKOS Play recently, since the last time I took the time to write about it. Here is what you can do with the latest version of the application. Print thesaurus alignments The major enhancement recently added is the ability to generate tables to display thesaurus&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2015/01/05/skos-play-thesaurus-alignments-skos-xl-autocomplete-search-fields/">SKOS Play : alignments, SKOS-XL, autocomplete search fields, and more !</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">There have been a lot of improvements and news on <strong><a href="http://labs.sparna.fr/skos-play" target="_blank">SKOS Play</a></strong> recently, since <a title="New version of SKOS Play for taxonomy visualization" href="http://blog.sparna.fr/new-version-of-skos-play-for-taxonomy-visualization/">the last time I took the time to write about it</a>. Here is what you can do with the latest version of the application.</p>
<p style="text-align: justify;"><span id="more-855"></span></p>
<h2>Print thesaurus alignments</h2>
<p style="text-align: justify;">The major enhancement recently added is the ability to generate tables to display thesaurus alignments (declared using the <a href="http://www.w3.org/TR/skos-reference/#mapping" target="_blank">mapping properties</a> skos:exactMatch, skos:broadMatch, skos:narrowMatch or skos:relatedMatch). Here is an<strong> <a href="http://blog.sparna.fr/wp-content/uploads/2014/12/architecture-alignement.pdf">example of printing a thesaurus alignment in PDF</a></strong> :</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2015/01/alignements.png"><img class="aligncenter wp-image-875 size-large" src="http://blog.sparna.fr/wp-content/uploads/2015/01/alignements-1024x585.png" alt="alignements" width="650" height="371" /></a></p>
<p style="text-align: justify;">This architecture thesaurus from french Ministry of Culture (published in <a href="http://data.culture.fr/thesaurus/" target="_blank">data.culture.fr</a> using <a href="https://github.com/culturecommunication/ginco-diff" target="_blank">GINCO</a>) is aligned with <a href="http://www.getty.edu/research/tools/vocabularies/lod/" target="_blank">Getty AAT</a>, <a href="http://fr.dbpedia.org/" target="_blank">french DBPedia</a> and <a href="http://rameau.bnf.fr/informations/projint.htm#macs" target="_blank">Rameau</a> (published in <a href="http://data.bnf.fr" target="_blank">data.bnf.fr</a>). The table is listing source concepts, and for each of them, the mappings to the other thesauri. It is also possible to generate a slightly different output by grouping the mappings by target thesaurus rather than with an alphabetical listing of the source concepts.</p>
<p style="text-align: justify;">Note that <strong>this is real Linked Data here</strong> : SKOS Play doesn&rsquo;t simply display the URIs of the target concepts (e.g. <a href="http://data.bnf.fr/11936410/abattoirs/" target="_blank">http://data.bnf.fr/11936410/abattoirs/</a>), but rather their labels by <strong>following the URIs and fetching the labels dynamically.</strong> This can obviously take a long time if the alignement is large. Of course, each target concept label is clickable so that you can navigate to the corresponding page.</p>
<h2>Print OWL files, too !</h2>
<p style="text-align: justify;">In some cases, people working on large ontologies with lots of classes (e.g. medical ontologies, like <a href="http://bioportal.bioontology.org/ontologies/HRDO" target="_blank">HRDO</a> with &gt; 13000 classes) also have a need to print them, much like people working on thesauri. This is why <strong>SKOS Play now includes an option to convert an <a href="http://www.w3.org/TR/owl-features/" target="_blank">OWL</a> class hierarchy to SKOS</strong>, to be able to print it. Of course by doing so we lose the rest of the ontology structure; here is exactly what this conversion does :</p>
<ul style="text-align: justify;">
<li>the OWL Ontology becomes a SKOS concept scheme;</li>
<li>every OWL class becomes a SKOS concept, and is declared &laquo;&nbsp;skos:inScheme&nbsp;&raquo; of the generated concept scheme;</li>
<li>the rdfs:subClassOf links yields skos:narrower and skos:broader relations;</li>
<li>rdfs:labels on OWL classes generate skos:prefLabel;</li>
</ul>
<p style="text-align: justify;">While this remains pretty basic, it gives a nice a easy path to <strong>use SKOS Play to display OWL classes hierarchies</strong>.</p>
<h2>Use data expressed using SKOS-XL</h2>
<p style="text-align: justify;">SKOS comes with the optional extension <a href="http://www.w3.org/TR/2009/REC-skos-reference-20090818/#xl" target="_blank">SKOS-XL</a>, that allows to declare the labels themselves as separate resources. Until now SKOS Play was not compatible with this extension. It is now the case, with an additionnal option (activated by default) that will apply simple inference rules to regenerate internally plain SKOS labels (pref, alt or hidden) from their SKOS-XL equivalent.</p>
<h2>Generate autocomplete field with the thesaurus terms</h2>
<p style="text-align: justify;">A  typical usage of a thesaurus in a search system is to guide the user typing queries in an input field. While this functionnaly is usually achieved using search engines autocomplete features (see <a href="https://wiki.apache.org/solr/Suggester" target="_blank">SolR suggester</a>), it is sometimes desirable to be able to do the same entirely on the client side when no search engine is available. And this is what SKOS Play does :</p>
<p>1. You see a page with an input field saying &laquo;&nbsp;search 1234 terms in thesaurus Y&nbsp;&raquo; :</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2015/01/autocomplete-0.png"><img class="aligncenter wp-image-866 size-large" src="http://blog.sparna.fr/wp-content/uploads/2015/01/autocomplete-0-1024x585.png" alt="autocomplete-0" width="650" height="371" /></a></p>
<p>2. When you start typing, you get suggestions from the thesaurus, with definition and scope note displayed for each of them :</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2015/01/autocomplete-2.png"><img class="aligncenter wp-image-867 size-large" src="http://blog.sparna.fr/wp-content/uploads/2015/01/autocomplete-2-1024x585.png" alt="autocomplete-2" width="650" height="371" /></a></p>
<p>3. When clicking on a suggested term, the corresponding concept URI is selected and can be sent to a search index to fetch resources indexed on that concept.</p>
<p style="text-align: justify;">This is implemented using <a href="http://jqueryui.com/autocomplete/" target="_blank">JQuery UI autocomplete widget</a> and everything is on the client side &#8211; no server required ! the page can be saved locally and adapted to an existing search portal. The terms fueling the completion list are written in JSON in the page :</p>
<pre id="line1">{
<span id="line111"></span>    "uri" : "http://skos.um.es/unescothes/C00007",
<span id="line112"></span>    "label" : "Abstract journals",
<span id="line113"></span>    "pref" : "Abstracts",
<span id="line114"></span>    "type" : "alt"
<span id="line115"></span>  }, {
<span id="line116"></span>    "uri" : "http://skos.um.es/unescothes/C03290",
<span id="line117"></span>    "label" : "Abstract reasoning",
<span id="line118"></span>    "pref" : "Reasoning",
<span id="line119"></span>    "type" : "alt"
<span id="line120"></span>  }, {
<span id="line121"></span>    "uri" : "http://skos.um.es/unescothes/C00007",
<span id="line122"></span>    "label" : "Abstracts",
<span id="line123"></span>    "scopeNote" : "The usually non-critical indication of the subject contents of a document, aiming to permit the user a decision about the relevance of the document.",
<span id="line124"></span>    "type" : "pref"
<span id="line125"></span>  }</pre>
<h2>Generate professional-looking PDF documents for your thesauri</h2>
<p style="text-align: justify;">SKOS Play is used by french Ministry of Culture to generate professional-looking PDF documents, in their effort to structure, align and publish controlled vocabularies on <a href="http://data.culture.fr/thesaurus/" target="_blank">http://data.culture.fr/thesaurus/</a> (using <a href="https://github.com/culturecommunication/ginco" target="_blank">GINCO</a> and <a href="https://github.com/culturecommunication/ginco-diff" target="_blank">GINCO Diffusion</a>). SKOS Play was used to generate the final PDF rendering of the &laquo;&nbsp;<a href="http://www.inventaire.culture.gouv.fr/telechar/thesaurus_architecture_2013.pdf" target="_blank">Thesaurus de la désignation des oeuvres architecturales et des espaces aménagés</a>&nbsp;&raquo; and the &laquo;&nbsp;<a href="http://www.inventaire.culture.gouv.fr/telechar/thesaurus_objets_mobiliers_2014.pdf" target="_blank">Thesaurus de la désignation des objets mobiliers</a>&laquo;&nbsp;.</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2015/01/alpha-index-1.png"><img class="aligncenter wp-image-871 size-large" src="http://blog.sparna.fr/wp-content/uploads/2015/01/alpha-index-1-1024x561.png" alt="alpha-index-1" width="650" height="356" /></a></p>
<p style="text-align: justify;">These PDFs include :</p>
<ul>
<li style="text-align: justify;">an alphabetical index containing for each term :
<ul>
<li style="text-align: justify;">the corresponding preferred term, if the term is non-preferred;</li>
<li style="text-align: justify;">if the term is a preferred term :
<ul>
<li style="text-align: justify;">its broader, narrowers, related and top term (clickable to navigate in the PDF);</li>
<li style="text-align: justify;">a scope note and a definition (if available);</li>
</ul>
</li>
</ul>
</li>
<li style="text-align: justify;">a hierarchical display, with each entry being clickable to navigate to the alphabetical index;</li>
<li style="text-align: justify;">translation tables, when the thesaurus is multilingual;</li>
</ul>
<p>An effort as been made on the page layout and design to achieve optimal readability.</p>
<h2>Generate permuted indexes (KWIC)</h2>
<p>SKOS Play also allows you to generate <a href="http://en.wikipedia.org/wiki/Key_Word_in_Context" target="_blank">permuted indexes</a> from the labels of the thesaurus :</p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2015/01/kwic.png"><img class="wp-image-872 size-large aligncenter" src="http://blog.sparna.fr/wp-content/uploads/2015/01/kwic-1024x585.png" alt="kwic" width="650" height="371" /></a></p>
<p>This can be used to easily search a term in the thesaurus, or check in which label a given word appear. Note that the computed permutations are correctly excluding stopwords based on the chosen language.</p>
<p>As usual, the output is available in HTML or PDF.</p>
<h2>More to come in 2015 !</h2>
<p>Probably new enhancements will come in 2015 :</p>
<ul>
<li>display images associated with each concepts, if they are available;</li>
<li>handle right-to-left languages (arabic);</li>
</ul>
<p>and more, based on your feedback, most welcomed as usual !</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2015/01/05/skos-play-thesaurus-alignments-skos-xl-autocomplete-search-fields/">SKOS Play : alignments, SKOS-XL, autocomplete search fields, and more !</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2015/01/05/skos-play-thesaurus-alignments-skos-xl-autocomplete-search-fields/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>
