<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sparna Blog &#187; Open Data</title>
	<atom:link href="https://blog.sparna.fr/tag/open-data-2/feed/" rel="self" type="application/rss+xml" />
	<link>https://blog.sparna.fr</link>
	<description>Web de données &#124; Architecture de l&#039;information &#124; Accès aux connaissances</description>
	<lastBuildDate>Tue, 03 Jun 2025 10:30:27 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
	<item>
		<title>European Parliament Open Data Portal : a SHACL-powered knowledge graph</title>
		<link>https://blog.sparna.fr/2025/04/09/european-parliament-open-data-portal-a-shacl-powered-knowledge-graph/</link>
		<comments>https://blog.sparna.fr/2025/04/09/european-parliament-open-data-portal-a-shacl-powered-knowledge-graph/#comments</comments>
		<pubDate>Wed, 09 Apr 2025 14:10:12 +0000</pubDate>
		<dc:creator><![CDATA[Marie Muller]]></dc:creator>
				<category><![CDATA[Editeurs]]></category>
		<category><![CDATA[FAIR]]></category>
		<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[Non classé]]></category>
		<category><![CDATA[Ontologies]]></category>
		<category><![CDATA[Open Data]]></category>
		<category><![CDATA[SHACL]]></category>
		<category><![CDATA[SHACL Play]]></category>
		<category><![CDATA[api]]></category>
		<category><![CDATA[DCAT]]></category>
		<category><![CDATA[ELI]]></category>
		<category><![CDATA[google spreadsheets]]></category>
		<category><![CDATA[json-ld]]></category>
		<category><![CDATA[knowledge graph]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SPARQL]]></category>

		<guid isPermaLink="false">https://blog.sparna.fr/?p=1959</guid>
		<description><![CDATA[<p>A second usecase Thomas wrote for Veronika Heimsbakk’s SHACL for the Practitioner upcoming book is about Sparna&#8217;s work for the European Parliament. From validation of the data in the knowledge graph to further projects of data integration and dissemination, many different usages of SHACL specifications were explored&#8230; &#8230; and more exploratory usages of SHACL are foreseen ! “&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2025/04/09/european-parliament-open-data-portal-a-shacl-powered-knowledge-graph/">European Parliament Open Data Portal : a SHACL-powered knowledge graph</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>A second usecase Thomas wrote for Veronika Heimsbakk’s <em><a href="https://veronahe.wordpress.com/shacl-for-the-practitioner/">SHACL for the Practitioner</a></em> upcoming book is about Sparna&rsquo;s work for the European Parliament.</p>
<p>From validation of the data in the knowledge graph to further projects of data integration and dissemination, many different usages of SHACL specifications were explored&#8230;</p>
<p>&#8230; and more exploratory usages of SHACL are foreseen !</p>
<h1>“</h1>
<h2><strong>A knowledge-graph powered open data portal</strong></h2>
<p><a href="https://data.europarl.europa.eu/">The European Parliament Open Data Portal (EPODP)</a> went live in January 2023. Its particularity is that it is not a mere aggregation of documents or dump files from business applications in custom formats; but rather a <strong>collection of datasets each extracted from a central semantic knowledge graph</strong>, itself aggregating data migrated from approximately <strong>twenty business applications</strong>. The result is a semantically interoperable open data portal : the semantic of its data model is clearly defined and documented, and reuses widely deployed existing ontologies. It already provides its data to different consumers (most notably <a href="https://www.europarl.europa.eu/">the europarl website</a> and <a href="https://law-tracker.europa.eu/">the EU law tracker</a>) in a context of cross-institutions interoperability. The data captures the activity of the parliament : as co-legislator together with the Council of the EU, the European Parliament (EP) holds plenary sittings, in which reports originating from committees, as well as motion for resolutions, are amended and voted; after the vote, the final adopted texts are published.</p>
<p>The focus on semantic interoperability of EPODP maximizes the potential of reuse and linkage of its datasets, and <strong>maximizes the quality</strong> of the offered data. It comes however at a cost when building the portal : deep analysis and understanding of the existing data and documents structure is required to capture the business semantic. SHACL is the way to formally encode this business semantic &#8211; but how is it deployed in practice ? how is it maintained ? what are the different types of SHACL specifications used ?</p>
<h2><strong>SHACL at the center of a model-driven approach</strong></h2>
<p>SHACL in the EPODP is at the basis of multiple model-driven usages depicted in the following diagram:</p>
<p><a href="https://blog.sparna.fr/wp-content/uploads/2025/04/spec-SHACL.png"><img class="aligncenter size-large wp-image-1961" src="https://blog.sparna.fr/wp-content/uploads/2025/04/spec-SHACL-1024x508.png" alt="spec-SHACL" width="650" height="322" /></a></p>
<p>There was two key drivers for introducing the use of SHACL in the EPODP project : <strong>validation of the data</strong> in the knowledge graph, and <strong>generation of public documentations</strong> of the models. The same SHACL specification that captures the business semantic is directly actionable to be published as a documentation and to validate the data. The produced documentation is a set of public files, such as <a href="https://data.europarl.europa.eu/def/eli-ep">the ELI-EP application profile documentation</a> and others accessible from <a href="https://data.europarl.europa.eu/en/developer-corner">the EPODP developer&rsquo;s corner</a>. <a href="https://shacl-play.sparna.fr/play/doc">The SHACL Play documentation generator</a> is used to produce the documentation pages. Data validation happens at earlier stages, after data transformation steps.</p>
<p>Two additional usages of SHACL specifications were explored : one was to generate SPARQL queries to extract the content of datasets from the larger knowledge graph. The SHACL specification of a dataset content is interpreted to generate SPARQL CONSTRUCT queries, executed against the entire knowledge graph, to return a subset of data corresponding to the specification. The query generation was implemented <a href="https://shacl-play.sparna.fr/play/sparql">in SHACL Play</a>, however the EPODP chose to continue using manually crafted SPARQL queries to generate the datasets. The other usage was to complement the SHACL specifications with the mapping rules used to feed the corresponding properties or classes in the graph. This has the advantage that the mapping rules are documented and maintained alongside the specification and not in a separate document. This work is ongoing.</p>
<p>More exploratory usages of SHACL are foreseen : generating a query user interface based on the SHACL specification, <a href="https://docs.sparnatural.eu/how-to-configure-shacl/How-to-configure-Sparnatural-shacl.html">using the <strong>Sparnatural</strong> query builder</a>, and also input forms to facilitate the creation of DCAT datasets descriptions. Additionally, automated generation of the JSON-LD context and the JSON schema of the API are foreseen.</p>
<h2><strong>Not &laquo;&nbsp;1 SHACL to rule them all&nbsp;&raquo;, but application profiles, dataset definitions, and migration specifications</strong></h2>
<p>The definition of the EPODP knowledge graph is not captured in a single SHACL specification, but rather in three different application profiles, each being a selection of classes and properties of one sub-domain : <strong><a href="https://data.europarl.europa.eu/def/eli-ep">ELI-EP</a></strong> covers the description of documents and activities, <strong><a href="https://data.europarl.europa.eu/def/org-ep">ORG-EP</a></strong> covers the definitions of EP organisations (such as committees, political groups, etc.) and members of the parliament, and <strong><a href="https://europarl.github.io/skos-ep">SKOS-EP</a></strong> covers how controlled vocabularies are structured. In addition, <a href="https://data.europarl.europa.eu/def/dcat-ep">DCAT-EP</a> is the specification for how dataset records are described in the EPODP catalog &#8211; but this is not part of the knowledge graph <em>per se</em>.</p>
<p>Together, ELI-EP, ORG-EP and SKOS-EP specify the structure of the entire knowledge graph from which the datasets are extracted. In addition, the structure of each dataset family available in the EPODP (such as adopted texts, plenary documents, parliamentary questions, etc.) is also described in SHACL, referred to as <strong>&laquo;&nbsp;DSD&nbsp;&raquo; for &laquo;&nbsp;Dataset Definition&nbsp;&raquo;</strong>. While the application profiles describe every possible properties on generic shapes, the DSDs will specify only the subset of properties used in a dataset, with possibly different cardinalities or range. For example, ELI-EP specifies that <em>&laquo;&nbsp;a Work may have the property</em><em> </em><em>eli:adopts</em><em>&laquo;&nbsp;</em> (with no minimum cardinality (eli:adopts is defined as <em>&laquo;&nbsp;Indicates that the work represents the adopted work of one or several related works&nbsp;&raquo;</em>). The DSD for adopted texts datasets specifies the shape of &laquo;&nbsp;Adopted texts&nbsp;&raquo; as a subset of the Works, and indicates that the minimum cardinality of eli:adopts is 1 for this particular subset. Besides, some properties, such as eli:amends are not available for adopted texts, thus not declared in the DSD.</p>
<p>In addition, specifications of the conversion of some data sources are also specified in independent SHACL files. The articulations of these 3 kinds of SHACL files and the reused ontologies is depicted in the following diagram:</p>
<p><a href="https://blog.sparna.fr/wp-content/uploads/2025/04/3-SHACL-shapes.png"><img class="aligncenter size-large wp-image-1962" src="https://blog.sparna.fr/wp-content/uploads/2025/04/3-SHACL-shapes-1024x603.png" alt="3-SHACL-shapes" width="650" height="383" /></a></p>
<p>There is currently no reuse or reference of shapes across the different specifications. Each is independent. A nice improvement would be to study how SHACL DSDs could be derived from the application profile SHACL, without redeclaring the identical constraints.</p>
<h2><strong>Editing SHACL in spreadsheets</strong></h2>
<p>In total 16 SHACL specifications are currently published in the EPODP, and around 80 are used to validate data migrated from each individual sources. The first step in the specification of each model is the design in a diagram such as the ones visible in the public documentations of the models. The EPODP team is then using spreadsheets to encode the specifications, adapted from the one provided <a href="https://shacl-play.sparna.fr/play/shaclexcel">in the SHACL Play suite</a>. The spreadsheet is converted to SHACL using <a href="https://xls2rdf.sparna.fr/rest/">the xls2rdf converter</a>. <strong>Spreadsheets provide a simple editing solution</strong>, with an easy learning curve, made even easier with a few formulas to compute cell values automatically. It even provides ways for editing advanced patterns (such as the ability to directly turtle lists for sh:or, or blank nodes for property paths), but of course still limits the expressivity. The following screenshot shows how property shapes look like in the spreadsheet:</p>
<p><a href="https://blog.sparna.fr/wp-content/uploads/2025/04/properties-ELI.png"><img class="aligncenter size-large wp-image-1963" src="https://blog.sparna.fr/wp-content/uploads/2025/04/properties-ELI-1024x442.png" alt="properties-ELI" width="650" height="281" /></a></p>
<h2></h2>
<h2><strong>Results and future perspectives</strong></h2>
<p>The EPODP use-case shows how SHACL can be applied in a systematic way in a data integration and dissemination project : at the data transformation step, at the knowledge graph level, and at the data dissemination. <strong>Public documentation, data validation, data extraction are tasks that can be be automated based on a SHACL specification</strong>. While the context is one of a large public institution, the same approach can be applied in industrial contexts. The SHACL specifications are a cornerstone of such projects, enabling semantic interoperability at large and a mutual understanding between business experts, data analysts, developers, and data consumers.</p>
<p>&nbsp;</p>
<h1>”</h1>
<p>Veronika&rsquo;s book will be divided into three parts :<br class="html-br" /><br class="html-br" />1. Back to Basics<br class="html-br" />Introduction to logic and RDF, brief skimming of the topics. Also covering various world assumptions.</p>
<p>2. Getting to know the stuff<br class="html-br" />Introduction to SHACL, including core, sh-sparql, advanced features.</p>
<p>3. Working with the stuff<br class="html-br" />SHACL Stories. Use cases, user stories and implementations.</p>
<p><em>Image : © European Union, [2024] &#8211; EP</em></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2025/04/09/european-parliament-open-data-portal-a-shacl-powered-knowledge-graph/">European Parliament Open Data Portal : a SHACL-powered knowledge graph</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2025/04/09/european-parliament-open-data-portal-a-shacl-powered-knowledge-graph/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>CORDIS : a SPARQL endpoint is born !</title>
		<link>https://blog.sparna.fr/2024/01/15/cordis-a-sparql-endpoint-is-born/</link>
		<comments>https://blog.sparna.fr/2024/01/15/cordis-a-sparql-endpoint-is-born/#comments</comments>
		<pubDate>Mon, 15 Jan 2024 08:55:41 +0000</pubDate>
		<dc:creator><![CDATA[Marie Muller]]></dc:creator>
				<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[Ontologies]]></category>
		<category><![CDATA[Open Data]]></category>
		<category><![CDATA[SPARQL]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[Triplestores]]></category>
		<category><![CDATA[Visualisation de données]]></category>
		<category><![CDATA[endpoint]]></category>
		<category><![CDATA[Europe]]></category>
		<category><![CDATA[Linked Open Data]]></category>
		<category><![CDATA[ontologie]]></category>
		<category><![CDATA[ontologies]]></category>
		<category><![CDATA[thesaurus]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1615</guid>
		<description><![CDATA[<p>Another star to light on EU&#8217;s linked open data maturity flag ! 🌟 Not talking about 2024 exceptional Northern Lights to come, but this one&#8217;s also good news for science ! ➡️ Late 2023, the Publications Office of the European Union announced on social media the public release of the new CORDIS SPARQL endpoint. CORDIS, aka « the Community&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2024/01/15/cordis-a-sparql-endpoint-is-born/">CORDIS : a SPARQL endpoint is born !</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p><span style="font-weight: 400;">Another star to light on EU&rsquo;s linked open data maturity flag ! <img src="https://s.w.org/images/core/emoji/72x72/1f31f.png" alt="🌟" class="wp-smiley" style="height: 1em; max-height: 1em;" /></span></p>
<p><span style="font-weight: 400;">Not talking about 2024 exceptional <a href="https://www.nationalgeographic.com/science/article/auroras-solar-maximum-2024">Northern Lights to come,</a> </span><span style="font-weight: 400;">but this one&rsquo;s also good news for science !</span></p>
<p><span style="font-weight: 400;">➡️ Late 2023, </span><span style="font-weight: 400;">the Publications Office of the European Union</span><span style="font-weight: 400;"> <a href="https://twitter.com/CORDIS_EU/status/1726865540143276079">announced on social media</a> </span><span style="font-weight: 400;">the public release of </span><strong><a href="https://cordis.europa.eu/datalab/sparql-endpoint">the new CORDIS SPARQL endpoint</a></strong><span style="font-weight: 400;">.</span></p>
<p><span style="font-weight: 400;">CORDIS, aka « </span><span style="font-weight: 400;">t</span><span style="font-weight: 400;">he Community Research and Development Information Service </span><span style="font-weight: 400;">of</span><span style="font-weight: 400;"> the European Commission</span><span style="font-weight: 400;"> », is « </span><em><a href="https://cordis.europa.eu/about"><span style="font-weight: 400;">the [&#8230;] primary source of results from the projects funded by the EU&rsquo;s framework programmes for research and innovation, from FP1 to Horizon Europe</span></a></em><span style="font-weight: 400;"> ». Described as a « <em>rich and structured public repository with all project information held by the European Commission such as project factsheets, participants, reports, deliverables and links to open-access publications</em> », the CORDIS catalog has also been made available in 6 European languages by Publications Office&rsquo;s editorial team.</span></p>
<p><span style="font-weight: 400;">Cherry on top <img src="https://s.w.org/images/core/emoji/72x72/1f352.png" alt="🍒" class="wp-smiley" style="height: 1em; max-height: 1em;" /> of a whole process, the CORDIS SPARQL endpoint release comes to crown a long-term linked open data project. The aim identifying, acquiring, preserving and providing access to knowledge in a common will to share with the widest public possible a trust-worthy, qualified and structured information (see </span><a href="https://op.europa.eu/webpub/op/annual-management-report-2021/en/"><span style="font-weight: 400;">Publications Office 2021 Annual Management Report</span></a><span style="font-weight: 400;">).</span></p>
<p><span style="font-weight: 400;">In the context of the pandemic (and recent opening of <a href="https://data.europa.eu/en">data.europa.eu</a>, the official portal for European data, as defined in 2017–2025 European Open Data Space strategy), </span><a href="https://data.europa.eu/data/datasets/euroscivoc-the-european-science-vocabulary?locale=en"><span style="font-weight: 400;">the EuroSciVoc taxonomy of fields of science</span></a><span style="font-weight: 400;"> was released April 2020, followed December 2021 by the publishing of </span><a href="https://data.europa.eu/data/datasets/european-research-information-ontology?locale=en"><span style="font-weight: 400;">European research information ontology (EURIO)</span></a><span style="font-weight: 400;"> on the EU Vocabularies website <img src="https://s.w.org/images/core/emoji/72x72/1f310.png" alt="🌐" class="wp-smiley" style="height: 1em; max-height: 1em;" />.</span></p>
<p><span style="font-weight: 400;">As presented at </span><a href="https://op.europa.eu/en/web/endorse-2021/conference"><span style="font-weight: 400;">ENDORSE conference March 2021</span></a><span style="font-weight: 400;">, the redesign of CORDIS data-model in accordance with Semantic Web standards contributed to bring the platform « <strong><em>from acting as a data repository to finally playing an active role as data provider</em></strong> », where EuroSciVoc taxonomy &amp; EURIO ontology both played key roles in the creation of future CORDIS knowledge graph and SPARQL endpoint :</span></p>
<p><span style="font-weight: 400;"><img src="https://s.w.org/images/core/emoji/72x72/1f538.png" alt="🔸" class="wp-smiley" style="height: 1em; max-height: 1em;" /></span><em><span style="font-weight: 400;"> <a href="https://data.europa.eu/data/datasets/euroscivoc-the-european-science-vocabulary?locale=en">EuroSciVoc</a> [&#8230;] is a multilingual, SKOS-XL based taxonomy that represents all the main fields of science that were discovered from the CORDIS content, e.g., project abstracts. It was built starting from the hierarchy of the OECD&rsquo;s Fields of R&amp;D classification (FoRD) as root and extended through a semi-automatic process based on NLP techniques. It contains almost 1 000 categories in 6 languages (English, French, German, Italian, Polish and Spanish) and each category is enriched with relevant keywords extracted from the textual description of CORDIS projects. It is constantly evolving and is available on EU Vocabularies website [&#8230;].</span></em></p>
<p><span style="font-weight: 400;"><img src="https://s.w.org/images/core/emoji/72x72/1f538.png" alt="🔸" class="wp-smiley" style="height: 1em; max-height: 1em;" /></span><em><span style="font-weight: 400;"> In order to transform CORDIS data into Linked Open Data, thus aligning with Semantic Web standards, best practices and tools in industry and public organizations, the need for an ontology emerged. CORDIS created the <a href="https://data.europa.eu/data/datasets/european-research-information-ontology?locale=en">EURIO</a> (European Research Information Ontology) based on data about research projects funded by the EU&rsquo;s framework programmes for research and innovation. EURIO is aligned with EU ontologies such as <a href="https://dcodings.github.io/DINGO/">DINGO</a> and <a href="https://github.com/SPAROntologies/frapo">FRAPO</a> and de facto standard ontologies such as schema.org and the Organization Ontology from W3C. It models projects, their results and actors such as people and organizations, and includes administrative information like funding schemes and grants.</span></em></p>
<p><span style="font-weight: 400;"><img src="https://s.w.org/images/core/emoji/72x72/1f449.png" alt="👉" class="wp-smiley" style="height: 1em; max-height: 1em;" /></span><em> EURIO, which is available on EU Vocabularies website, was <strong>the starting point to develop a Knowledge Graph of CORDIS data that will be publicly available via a dedicated SPARQL endpoint</strong>.</em> <em>»</em></p>
<p>(Enrico Bignotti &amp; Baya Remaoun, &laquo;&nbsp;<a href="https://op.europa.eu/en/web/endorse-2021/programme">EuroSciVoc taxonomy and EURIO ontology: CORDIS as (semantic) data provider</a> &nbsp;&raquo; , ENDORSE March 16, 2021. <a href="https://op.europa.eu/documents/10120270/10133951/BIGNOTTI_REMAOUN_presentation_EuroSciVoc+taxonomy+and+EURIO+ontology+CORDIS+as+%28semantic%29+data+provider.pdf/3303e7b9-967d-65f2-23a3-96b3e2bd2856?t=1616568751644"><span style="font-weight: 400;">PDF</span></a><span style="font-weight: 400;"> </span><a href="https://www.youtube.com/watch?v=vIBC_PO5aoM&amp;t=3689s"><span style="font-weight: 400;">VIDEO</span></a>)</p>
<p><span style="font-weight: 400;">&#8230; A Knowledge graph <a href="https://upcommons.upc.edu/bitstream/handle/2117/378291/2022-ISWC.pdf?sequence=1&amp;isAllowed=y">that was soon released in 2022-2023</a></span><span style="font-weight: 400;"> (see INDUSTRY TRACK 1 on Tuesday, 25 October of <a href="http://iswc2022.semanticweb.org/index.php/conference/">ISWC 2022 Conference</a> for more detail), until final opening of a </span><a href="https://cordis.europa.eu/datalab"><span style="font-weight: 400;">CORDIS SPARQL endpoint</span></a><span style="font-weight: 400;"> late november 2023.</span></p>
<p><span style="font-weight: 400;">Now fancy a few SPARQL queries in there ?</span></p>
<p><strong>Follow the SPARQL <img src="https://s.w.org/images/core/emoji/72x72/1f4ab.png" alt="💫" class="wp-smiley" style="height: 1em; max-height: 1em;" /></strong></p>
<p><span style="font-weight: 400;">CORDIS SPARQL endpoint is </span><a href="https://cordis.europa.eu/datalab"><span style="font-weight: 400;">actually made available on CORDIS Datalab</span></a><span style="font-weight: 400;"> (and already referenced in <a href="https://linkedopendata.eu/wiki/The_EU_Knowledge_Graph">EU Knowledge Graph</a> among other European SPARQL endpoints ! <a href="http://tinyurl.com/yn5fsylk">see the query</a> / <a href="http://tinyurl.com/2e8z6y5e">see the results</a>)</span></p>
<p><span style="font-weight: 400;">Here you can access a quick documentation guide to CORDIS Linked Open Data : </span><a href="https://cordis.europa.eu/about/sparql"><span style="font-weight: 400;">https://cordis.europa.eu/about/sparql</span></a><span style="font-weight: 400;">.</span></p>
<p><span style="font-weight: 400;">Let’s have a look at EURIO ontology first : we need to understand it to query CORDIS knowledge graph.</span></p>
<p><span style="font-weight: 400;">As we are told in the guide, the latest version can be downloaded </span><a href="https://op.europa.eu/en/web/eu-vocabularies/dataset/-/resource?uri=http://publications.europa.eu/resource/dataset/eurio"><span style="font-weight: 400;">on EU Vocabularies website</span></a><span style="font-weight: 400;">. When we unzip</span><span style="font-weight: 400;"> the archive we access the whole documentation about EURIO Classes &amp; properties that we need to write our SPARQL queries – and a diagram of </span><span style="font-weight: 400;">main classes and properties</span><span style="font-weight: 400;"> of CORDIS data model : </span></p>
<p><a href="http://blog.sparna.fr/wp-content/uploads/2024/01/EURIO_v2.4.png"><img class="aligncenter size-large wp-image-1669" src="http://blog.sparna.fr/wp-content/uploads/2024/01/EURIO_v2.4-1024x812.png" alt="EURIO_v2.4" width="650" height="515" /></a></p>
<p><span style="font-weight: 400;">At first sight we can observe on the schema 3 main groups of entities :</span></p>
<ul>
<li style="font-weight: 400;"><span style="font-weight: 400;">On the top right, the projects &amp; publications associated, key ressources of CORDIS ;</span></li>
<li style="font-weight: 400;"><span style="font-weight: 400;">On the top left, the fundings &amp; grants materials, on « monetary » side of the project ;</span></li>
<li style="font-weight: 400;"><span style="font-weight: 400;">On the bottom, the organisations &amp; persons implied, with references &amp; coordinates.</span></li>
</ul>
<p><span style="font-weight: 400;">Let’s open </span><a href="https://cordis.europa.eu/datalab/sparql-endpoint"><span style="font-weight: 400;">CORDIS SPARQL endpoint</span></a><span style="font-weight: 400;"> – some easy queries can be run to begin exploring CORDIS knowledge graph.</span></p>
<p><span style="font-weight: 400;">Nb : the data on SPARQL endpoint is a snapshot, but freshest dumps can be found </span><a href="https://data.europa.eu/data/datasets/named-graphs-from-eurio-knowledge-graph?locale=en"><span style="font-weight: 400;">on European data portal</span></a><span style="font-weight: 400;"> !</span></p>
<p><span style="font-weight: 400;">Here a simple one to </span><b>find a list of FundingSchemes with their titles and IDs corresponding to « Horizon 2020 » programme</b><span style="font-weight: 400;"> :</span></p>
<table>
<tbody>
<tr>
<td><strong>FundingSchemes with their titles and IDs corresponding to « Horizon 2020 » programme</strong></p>
<p>PREFIX xsd: &lt;http://www.w3.org/2001/XMLSchema#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
SELECT ?fs ?title ?id<br />
WHERE {<br />
# select all funding schemes …<br />
?fs a eurio:FundingScheme.<br />
# … with their title …<br />
?fs eurio:title ?title.<br />
# … and identifier …<br />
?fs eurio:identifier ?id.<br />
# where the identifier contains the regular expression “H2020”<br />
FILTER (REGEX (?id, &lsquo;H2020&prime;))<br />
} LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20FundingSchemes%20with%20their%20titles%20and%20IDs%20corresponding%20to%20%C2%AB%20Horizon%202020%20%C2%BB%20programme%0A%0APREFIX%20xsd%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2001%2FXMLSchema%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%20%3Ffs%20%3Ftitle%20%3Fid%0AWHERE%20%7B%0A%23%20select%20all%20funding%20schemes%20%E2%80%A6%0A%3Ffs%20a%20eurio%3AFundingScheme.%0A%23%20%E2%80%A6%20with%20their%20title%20%E2%80%A6%0A%3Ffs%20eurio%3Atitle%20%3Ftitle.%0A%23%20%E2%80%A6%20and%20identifier%20%E2%80%A6%0A%3Ffs%20eurio%3Aidentifier%20%3Fid.%0A%23%20where%20the%20identifier%20contains%20the%20regular%20expression%20%E2%80%9CH2020%E2%80%9D%0AFILTER%20(REGEX%20(%3Fid%2C%20'H2020'))%0A%7D%20LIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p><span style="font-weight: 400;">The FILTER REGEX enables us to display the IDs corresponding to H2020 Funding Schemes.</span></p>
<p><span style="font-weight: 400;">We can make another query to get the projects with the Funding Scheme Programme they are related to (note that, in EURIO a eurio:</span><span style="font-weight: 400;">hasFundingSchemeProgramme</span><span style="font-weight: 400;"> is a sub-property of eurio:fundingScheme) :</span></p>
<table>
<tbody>
<tr>
<td><strong>Projects with the Funding Scheme Programme they are related to</strong></p>
<p><span style="font-weight: 400;">PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;</span><br />
<span style="font-weight: 400;">SELECT ?project ?acronym ?fundingscheme</span><br />
<span style="font-weight: 400;">WHERE {</span><br />
# select the projects &#8230;<br />
<span style="font-weight: 400;">?project a eurio:Project.</span><br />
# … with acronyms &#8230;<br />
<span style="font-weight: 400;">?project eurio:hasAcronym/eurio:shortForm ?acronym.</span><br />
# … and corresponding funding scheme programmes<br />
<span style="font-weight: 400;">?project eurio:isFundedBy/eurio:hasFundingSchemeProgramme/eurio:code ?fundingscheme.</span><br />
<span style="font-weight: 400;">} LIMIT 100</span></td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Projects%20with%20the%20Funding%20Scheme%20Programme%20they%20are%20related%20to%0A%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%20%3Fproject%20%3Facronym%20%3Ffundingscheme%0AWHERE%20%7B%0A%23%20select%20the%20projects%20...%0A%3Fproject%20a%20eurio%3AProject.%0A%23%20%E2%80%A6%20with%20acronyms%20...%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%23%20%E2%80%A6%20and%20corresponding%20funding%20scheme%20programmes%0A%3Fproject%20eurio%3AisFundedBy%2Feurio%3AhasFundingSchemeProgramme%2Feurio%3Acode%20%3Ffundingscheme.%0A%7D%20LIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%201&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p><span style="font-weight: 400;">(Here we used a property path with a « / » to shorten the query to get the acronyms of projects &amp; Funding Scheme Programmes codes).</span></p>
<p><span style="font-weight: 400;">&#8230; and combining with the first query we can find the projects depending on H2020 Funding Scheme Programme in particular :</span></p>
<table>
<tbody>
<tr>
<td><strong>Projects depending on H2020 Funding Scheme Programme in particular</strong></p>
<p><span style="font-weight: 400;">PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;</span><br />
<span style="font-weight: 400;">SELECT ?project ?acronym ?fundingscheme</span><br />
<span style="font-weight: 400;">WHERE {</span><br />
# select the projects &#8230;<br />
<span style="font-weight: 400;">?project a eurio:Project.</span><br />
# … with acronyms &#8230;<br />
<span style="font-weight: 400;">?project eurio:hasAcronym/eurio:shortForm ?acronym.</span><br />
# … and corresponding funding scheme programmes codes &#8230;<br />
<span style="font-weight: 400;">?project eurio:isFundedBy/eurio:hasFundingSchemeProgramme/eurio:code ?fundingscheme.</span><br />
# … with a filter on funding scheme codes &lsquo;H2020&prime;<br />
<span style="font-weight: 400;">FILTER REGEX (?fundingscheme, &lsquo;H2020&prime;)</span><br />
<span style="font-weight: 400;">} LIMIT 100</span></td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Projects%20depending%20on%20H2020%20Funding%20Scheme%20Programme%20in%20particular%0A%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%20%3Fproject%20%3Facronym%20%3Ffundingscheme%0AWHERE%20%7B%0A%23%20select%20the%20projects%20...%0A%3Fproject%20a%20eurio%3AProject.%0A%23%20%E2%80%A6%20with%20acronyms%20...%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%23%20%E2%80%A6%20and%20corresponding%20funding%20scheme%20programmes%20codes%20...%0A%3Fproject%20eurio%3AisFundedBy%2Feurio%3AhasFundingSchemeProgramme%2Feurio%3Acode%20%3Ffundingscheme.%0A%23%20%E2%80%A6%20with%20a%20filter%20on%20funding%20scheme%20codes%20'H2020'%0AFILTER%20REGEX%20(%3Ffundingscheme%2C%20'H2020')%0A%7D%20LIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p><span style="font-weight: 400;">It is also possible to get the list of all existing Funding Scheme Programmes CORDIS projects have been funded by – we observe 27 of them here (from the SPARQL endpoint) – while adding a count function to know how many projects per FundingSchemeProgramme :</span></p>
<table>
<tbody>
<tr>
<td><strong>All existing Funding Scheme Programmes CORDIS projects have been funded by</strong></p>
<p><span style="font-weight: 400;">PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;</span><br />
<span style="font-weight: 400;">PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;</span><br />
# count the number of projects by funding scheme programme &#8230;<br />
<span style="font-weight: 400;">SELECT (COUNT (?project) as ?count) ?fundingscheme</span><br />
<span style="font-weight: 400;">WHERE {</span><br />
# select the projects with corresponding funding scheme programmes codes &#8230;<br />
<span style="font-weight: 400;">?project eurio:isFundedBy/eurio:hasFundingSchemeProgramme/eurio:code ?fundingscheme.</span><br />
# &#8230; counting projects per funding scheme programme<br />
<span style="font-weight: 400;">} GROUP BY ?fundingscheme</span><br />
<span style="font-weight: 400;">LIMIT 100</span></td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20All%20existing%20Funding%20Scheme%20Programmes%20CORDIS%20projects%20have%20been%20funded%20by%0A%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0A%23%20count%20the%20number%20of%20projects%20by%20funding%20scheme%20programme%20...%0ASELECT%20(COUNT%20(%3Fproject)%20as%20%3Fcount)%20%3Ffundingscheme%0AWHERE%20%7B%0A%23%20select%20the%20projects%20with%20corresponding%20funding%20scheme%20programmes%20codes%20...%0A%3Fproject%20eurio%3AisFundedBy%2Feurio%3AhasFundingSchemeProgramme%2Feurio%3Acode%20%3Ffundingscheme.%0A%23%20...%20counting%20projects%20per%20funding%20scheme%20programme%0A%7D%20GROUP%20BY%20%3Ffundingscheme%0ALIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%201&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p>Querying the organisations properties will return other kind of useful informations about geographical location of the projects stakeholders. Let’s figure out we want to find the projects whose coordinating organisations have sites located in France :</p>
<table>
<tbody>
<tr>
<td><strong>Projects whose coordinating organisations have sites located in France <img src="https://s.w.org/images/core/emoji/72x72/1f413.png" alt="🐓" class="wp-smiley" style="height: 1em; max-height: 1em;" /></strong></p>
<p>PREFIX skos: &lt;http://www.w3.org/2004/02/skos/core#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
SELECT ?project ?acronym ?role ?organisation ?country<br />
WHERE {<br />
# select the projects with their acronyms &#8230;<br />
?project a eurio:Project.<br />
?project eurio:hasAcronym/eurio:shortForm ?acronym.<br />
# &#8230; and organisations with &lsquo;coordinator&rsquo; role and name &#8230;<br />
?project eurio:hasInvolvedParty ?organisationrole.<br />
?organisationrole eurio:roleLabel ?role.<br />
?organisationrole eurio:roleLabel &laquo;&nbsp;coordinator&nbsp;&raquo;.<br />
?organisationrole eurio:isRoleOf/eurio:legalName ?organisation.<br />
# &#8230; with address country for the sites defined at &lsquo;FR&rsquo;<br />
?organisationrole eurio:isRoleOf/eurio:hasSite/eurio:hasAddress/eurio:addressCountry ?country.<br />
VALUES ?country { &lsquo;FR&rsquo; }<br />
} LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Projects%20whose%20coordinating%20organisations%20have%20sites%20located%20in%20France%20%F0%9F%90%93%0A%0APREFIX%20skos%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%20%3Fproject%20%3Facronym%20%3Frole%20%3Forganisation%20%3Fcountry%0AWHERE%20%7B%0A%23%20select%20the%20projects%20with%20their%20acronyms%20...%0A%3Fproject%20a%20eurio%3AProject.%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%23%20...%20and%20organisations%20with%20'coordinator'%20role%20and%20name%20...%0A%3Fproject%20eurio%3AhasInvolvedParty%20%3Forganisationrole.%0A%3Forganisationrole%20eurio%3AroleLabel%20%3Frole.%0A%3Forganisationrole%20eurio%3AroleLabel%20%22coordinator%22.%0A%3Forganisationrole%20eurio%3AisRoleOf%2Feurio%3AlegalName%20%3Forganisation.%0A%23%20...%20with%20address%20country%20for%20the%20sites%20defined%20at%20'FR'%0A%3Forganisationrole%20eurio%3AisRoleOf%2Feurio%3AhasSite%2Feurio%3AhasAddress%2Feurio%3AaddressCountry%20%3Fcountry.%0AVALUES%20%3Fcountry%20%7B%20'FR'%20%7D%0A%7D%20LIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p>Depending on available data, you can either query via PostalAddress info (eurio:addressCountry &lsquo;FR&rsquo;) or AdministrativeArea (eurio:hasGeographicalLocation) &#8230; Here we&rsquo;re lucky as both fields are mandatory ones.</p>
<p>Last but not least, we can also play with CORDIS vocabularies : here you&rsquo;ll have the choice to investigate via plain keywords of Projects or Publications items, querying titles, abstracts or other types of literals&#8230;</p>
<p>An example of projects with abstracts containing string ❄ &lsquo;winter&rsquo; ❄ &#8211; the URL giving the exact link to the project online :</p>
<table>
<tbody>
<tr>
<td><strong>Looking for ❄ &lsquo;winter&rsquo; ❄ in CORDIS projects abstracts (with nice URL to go)</strong></p>
<p>PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
SELECT?project ?acronym ?abstract ?url<br />
WHERE {<br />
# select the projects with their acronyms and abstracts &#8230;<br />
?project rdf:type eurio:Project.<br />
?project eurio:hasAcronym/eurio:shortForm ?acronym.<br />
?project eurio:abstract ?abstract.<br />
# &#8230; with a filter on abstracts containing string &lsquo;winter&rsquo; case insensitive &#8230;<br />
FILTER (regex(str(?abstract), &lsquo;winter&rsquo;, &lsquo;i&rsquo;))<br />
# &#8230; generating proper CORDIS website URLs based on RCN project code<br />
?project eurio:rcn ?rcn.<br />
BIND(IRI(CONCAT(&lsquo;https://cordis.europa.eu/project/rcn/&rsquo;, ?rcn)) AS ?url)<br />
} LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Looking%20for%20%E2%9D%84%20'winter'%20%E2%9D%84%20in%20CORDIS%20projects%20abstracts%20(with%20nice%20URL%20to%20go)%0A%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%3Fproject%20%3Facronym%20%3Fabstract%20%3Furl%0AWHERE%20%7B%0A%23%20select%20the%20projects%20with%20their%20acronyms%20and%20abstracts%20...%0A%3Fproject%20rdf%3Atype%20eurio%3AProject.%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%3Fproject%20eurio%3Aabstract%20%3Fabstract.%0A%23%20...%20with%20a%20filter%20on%20abstracts%20containing%20string%20'winter'%20case%20insensitive%20...%0AFILTER%20(regex(str(%3Fabstract)%2C%20'winter'%2C%20'i'))%0A%23%20...%20generating%20proper%20CORDIS%20website%20URLs%20based%20on%20RCN%20project%20code%0A%3Fproject%20eurio%3Arcn%20%3Frcn.%0ABIND(IRI(CONCAT('https%3A%2F%2Fcordis.europa.eu%2Fproject%2Frcn%2F'%2C%20%3Frcn))%20AS%20%3Furl)%0A%7D%20LIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%201&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p>But funniest way will be using EuroSciVoc taxonomy (and navigating through thesaurus hierarchy) : to do so we need to navigate through property &laquo;&nbsp;eurio:hasEuroSciVocClassification&nbsp;&raquo; to get the Concepts skosxl:prefLabel property &#8230; to finally obtain the thesaurus labels (don&rsquo;t forget to choose a prefered language with a FILTER (lang parameter) :</p>
<table>
<tbody>
<tr>
<td><strong>Projects with their associated EuroSciVoc keywords (English prefLabels <img src="https://s.w.org/images/core/emoji/72x72/1f482.png" alt="💂" class="wp-smiley" style="height: 1em; max-height: 1em;" />)</strong></p>
<p>PREFIX skosxl: &lt;http://www.w3.org/2008/05/skos-xl#&gt;<br />
PREFIX skos: &lt;http://www.w3.org/2004/02/skos/core#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
SELECT ?project ?acronym ?ESV<br />
WHERE {<br />
# select the projects with their acronyms &#8230;<br />
?project eurio:hasAcronym/eurio:shortForm ?acronym.<br />
# &#8230; with EuroSciVoc Classification prefLabels &#8230;<br />
?project eurio:hasEuroSciVocClassification/skosxl:prefLabel/skosxl:literalForm ?ESV.<br />
# &#8230; only returning &lsquo;English&rsquo; prefLabels<br />
FILTER (lang(?ESV) = &lsquo;en&rsquo;)<br />
} LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Projects%20with%20their%20associated%20EuroSciVoc%20keywords%20(English%20prefLabels%20%F0%9F%92%82)%0A%0APREFIX%20skosxl%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2008%2F05%2Fskos-xl%23%3E%0APREFIX%20skos%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0ASELECT%20%3Fproject%20%3Facronym%20%3FESV%0AWHERE%20%7B%0A%23%20select%20the%20projects%20with%20their%20acronyms%20...%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%23%20...%20with%20EuroSciVoc%20Classification%20prefLabels%20...%0A%3Fproject%20eurio%3AhasEuroSciVocClassification%2Fskosxl%3AprefLabel%2Fskosxl%3AliteralForm%20%3FESV.%0A%23%20...%20only%20returning%20'English'%20prefLabels%0AFILTER%20(lang(%3FESV)%20%3D%20'en')%0A%7D%20LIMIT%20100%0A&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%203&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p><span style="font-weight: 400;">A bit more complex one using first level of hierarchy of the taxonomy : here we are searching for all skos:broader concepts &laquo;&nbsp;with no other broader concept&nbsp;&raquo; (the FILTER NOT EXISTS formula), aka the top concepts or root concepts of the vocabulary used to describe the projects. Then counting the projects by each category :</span></p>
<table>
<tbody>
<tr>
<td><strong>All root categories of EuroSciVoc used to describe the projects</strong></p>
<p>PREFIX skosxl: &lt;http://www.w3.org/2008/05/skos-xl#&gt;<br />
PREFIX skos: &lt;http://www.w3.org/2004/02/skos/core#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
# count the number of projects by EuroSciVoc top categories &#8230;<br />
SELECT (COUNT(?project) AS ?nbProject) ?ESV_root_label<br />
WHERE {<br />
# &#8230; the top categories are Concepts &#8230;<br />
?ESV_root a skos:Concept .<br />
# &#8230; with no broader Concept &#8230;<br />
FILTER NOT EXISTS { ?ESV_root skos:broader ?anything }<br />
# &#8230; list with corresponding projects &#8230;<br />
?ESV_root ^skos:broader*/^eurio:hasEuroSciVocClassification ?project .<br />
# &#8230; and EuroSciVoc corresponding skos-xl prefLabels &#8230;<br />
?ESV_root skosxl:prefLabel/skosxl:literalForm ?ESV_root_label.<br />
# &#8230; sorting by EuroSciVoc category, with English prefLabels<br />
FILTER (lang(?ESV_root_label) = &lsquo;en&rsquo;)<br />
} GROUP BY ?ESV_root_label<br />
LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20All%20root%20categories%20of%20EuroSciVoc%20used%20to%20describe%20the%20projects%0A%0APREFIX%20skosxl%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2008%2F05%2Fskos-xl%23%3E%0APREFIX%20skos%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0A%23%20count%20the%20number%20of%20projects%20by%20EuroSciVoc%20top%20categories%20...%0ASELECT%20(COUNT(%3Fproject)%20AS%20%3FnbProject)%20%3FESV_root_label%0AWHERE%20%7B%0A%23%20...%20the%20top%20categories%20are%20Concepts%20...%0A%3FESV_root%20a%20skos%3AConcept%20.%0A%23%20...%20with%20no%20broader%20Concept%20...%0AFILTER%20NOT%20EXISTS%20%7B%20%3FESV_root%20skos%3Abroader%20%3Fanything%20%7D%0A%23%20...%20list%20with%20corresponding%20projects%20...%0A%3FESV_root%20%5Eskos%3Abroader*%2F%5Eeurio%3AhasEuroSciVocClassification%20%3Fproject%20.%0A%23%20...%20and%20EuroSciVoc%20corresponding%20skos-xl%20prefLabels%20...%0A%3FESV_root%20skosxl%3AprefLabel%2Fskosxl%3AliteralForm%20%3FESV_root_label.%0A%23%20...%20sorting%20by%20EuroSciVoc%20category%2C%20with%20English%20prefLabels%0AFILTER%20(lang(%3FESV_root_label)%20%3D%20'en')%0A%7D%20GROUP%20BY%20%3FESV_root_label%0ALIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%201&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p>&#8230; and maybe again more explicit results if refined to level 2 of hierarchy <img src="https://s.w.org/images/core/emoji/72x72/1f440.png" alt="👀" class="wp-smiley" style="height: 1em; max-height: 1em;" /> :</p>
<table>
<tbody>
<tr>
<td><strong>All &lsquo;level 2&prime; root categories of EuroSciVoc used to describe the projects</strong></p>
<p>PREFIX skosxl: &lt;http://www.w3.org/2008/05/skos-xl#&gt;<br />
PREFIX skos: &lt;http://www.w3.org/2004/02/skos/core#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
# count the number of projects by EuroSciVoc level 2 top categories &#8230;<br />
SELECT (COUNT(?project) AS ?nbProject) ?ESV_root_label ?ESV_level2_label<br />
WHERE {<br />
# &#8230; the top categories are Concepts &#8230;<br />
?ESV_root a skos:Concept .<br />
# &#8230; with no broader Concept &#8230;<br />
FILTER NOT EXISTS { ?ESV_root skos:broader ?anything }<br />
# &#8230; list level 2 category below level 1 with corresponding projects &#8230;<br />
?ESV_root ^skos:broader ?ESV_level2 .<br />
?ESV_level2 ^skos:broader*/^eurio:hasEuroSciVocClassification ?project .<br />
# &#8230; and EuroSciVoc corresponding skos-xl prefLabels &#8230;<br />
?ESV_root skosxl:prefLabel/skosxl:literalForm ?ESV_root_label.<br />
?ESV_level2 skosxl:prefLabel/skosxl:literalForm ?ESV_level2_label.<br />
# &#8230; sorting by EuroSciVoc category, with English prefLabels<br />
FILTER (lang(?ESV_root_label) = &lsquo;en&rsquo;)<br />
FILTER (lang(?ESV_level2_label) = &lsquo;en&rsquo;)<br />
} GROUP BY ?ESV_root_label ?ESV_level2_label<br />
ORDER BY ?ESV_root_label<br />
LIMIT 100</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20All%20'level%202'%20root%20categories%20of%20EuroSciVoc%20used%20to%20describe%20the%20projects%0A%0APREFIX%20skosxl%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2008%2F05%2Fskos-xl%23%3E%0APREFIX%20skos%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0A%23%20count%20the%20number%20of%20projects%20by%20EuroSciVoc%20level%202%20top%20categories%20...%0ASELECT%20(COUNT(%3Fproject)%20AS%20%3FnbProject)%20%3FESV_root_label%20%3FESV_level2_label%0AWHERE%20%7B%0A%23%20...%20the%20top%20categories%20are%20Concepts%20...%0A%3FESV_root%20a%20skos%3AConcept%20.%0A%23%20...%20with%20no%20broader%20Concept%20...%0AFILTER%20NOT%20EXISTS%20%7B%20%3FESV_root%20skos%3Abroader%20%3Fanything%20%7D%0A%23%20...%20list%20level%202%20category%20below%20level%201%20with%20corresponding%20projects%20...%0A%3FESV_root%20%5Eskos%3Abroader%20%3FESV_level2%20.%0A%3FESV_level2%20%5Eskos%3Abroader*%2F%5Eeurio%3AhasEuroSciVocClassification%20%3Fproject%20.%0A%23%20...%20and%20EuroSciVoc%20corresponding%20skos-xl%20prefLabels%20...%0A%3FESV_root%20skosxl%3AprefLabel%2Fskosxl%3AliteralForm%20%3FESV_root_label.%0A%3FESV_level2%20skosxl%3AprefLabel%2Fskosxl%3AliteralForm%20%3FESV_level2_label.%0A%23%20...%20sorting%20by%20EuroSciVoc%20category%2C%20with%20English%20prefLabels%0AFILTER%20(lang(%3FESV_root_label)%20%3D%20'en')%0AFILTER%20(lang(%3FESV_level2_label)%20%3D%20'en')%0A%7D%20GROUP%20BY%20%3FESV_root_label%20%3FESV_level2_label%0AORDER%20BY%20%3FESV_root_label%0ALIMIT%20100&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p>And a little last one with a count, to enumerate most used EuroSciVoc Concepts for indexing projects :</p>
<table>
<tbody>
<tr>
<td><strong>Most used EuroSciVoc Concepts for indexing projects</strong></p>
<p>PREFIX skosxl: &lt;http://www.w3.org/2008/05/skos-xl#&gt;<br />
PREFIX skos: &lt;http://www.w3.org/2004/02/skos/core#&gt;<br />
PREFIX eurio: &lt;http://data.europa.eu/s66#&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX rdfs: &lt;http://www.w3.org/2000/01/rdf-schema#&gt;<br />
# count the number of projects by EuroSciVoc Concept &#8230;<br />
SELECT (COUNT (?project) as ?count) ?ESV<br />
WHERE {<br />
#  &#8230; select the projects with their acronyms &#8230;<br />
?project eurio:hasAcronym/eurio:shortForm ?acronym.<br />
# &#8230; with EuroSciVoc Classification prefLabels &#8230;<br />
?project eurio:hasEuroSciVocClassification/skosxl:prefLabel/skosxl:literalForm ?ESV.<br />
# &#8230; sorting by EuroSciVoc Concept, with English prefLabels<br />
FILTER (lang(?ESV) = &lsquo;en&rsquo;)<br />
} GROUP BY ?ESV<br />
ORDER BY DESC(?count)<br />
LIMIT 3000</td>
</tr>
</tbody>
</table>
<p>▶️ <a href="https://cordis.europa.eu/datalab/sparql-endpoint#query=%23%20Most%20used%20EuroSciVoc%20Concepts%20for%20indexing%20projects%0A%0APREFIX%20skosxl%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2008%2F05%2Fskos-xl%23%3E%0APREFIX%20skos%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0APREFIX%20eurio%3A%20%3Chttp%3A%2F%2Fdata.europa.eu%2Fs66%23%3E%0APREFIX%20rdf%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F1999%2F02%2F22-rdf-syntax-ns%23%3E%0APREFIX%20rdfs%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0A%23%20count%20the%20number%20of%20projects%20by%20EuroSciVoc%20Concept%20...%0ASELECT%20(COUNT%20(%3Fproject)%20as%20%3Fcount)%20%3FESV%0AWHERE%20%7B%0A%23%20%20...%20select%20the%20projects%20with%20their%20acronyms%20...%0A%3Fproject%20eurio%3AhasAcronym%2Feurio%3AshortForm%20%3Facronym.%0A%23%20...%20with%20EuroSciVoc%20Classification%20prefLabels%20...%0A%3Fproject%20eurio%3AhasEuroSciVocClassification%2Fskosxl%3AprefLabel%2Fskosxl%3AliteralForm%20%3FESV.%0A%23%20...%20sorting%20by%20EuroSciVoc%20Concept%2C%20with%20English%20prefLabels%0AFILTER%20(lang(%3FESV)%20%3D%20'en')%0A%7D%20GROUP%20BY%20%3FESV%0AORDER%20BY%20DESC(%3Fcount)%0ALIMIT%203000&amp;endpoint=https%3A%2F%2Fcordis.europa.eu%2Fdatalab%2Fsparql&amp;requestMethod=POST&amp;tabTitle=Query%201&amp;headers=%7B%7D&amp;contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq&amp;contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq&amp;outputFormat=table">See the results</a></p>
<p><img src="https://s.w.org/images/core/emoji/72x72/1f4a1.png" alt="💡" class="wp-smiley" style="height: 1em; max-height: 1em;" />This one an ideal one to generate a word cloud maybe ?</p>
<p>What if we send the CSV data to <a href="https://wordart.com/create">some nice online word cloud generator</a> then ?</p>
<p><a href="https://wordart.com/r8zsokkk7ghu/untitled"><img class="aligncenter size-full wp-image-1710" src="http://blog.sparna.fr/wp-content/uploads/2024/01/Cordis-Taxo-Cloud.png" alt="Cordis Taxo Cloud" width="660" height="757" /></a></p>
<p>(OMG <a href="https://wordart.com/create">they also have a shooting star shape</a> <img src="https://s.w.org/images/core/emoji/72x72/1f320.png" alt="🌠" class="wp-smiley" style="height: 1em; max-height: 1em;" /> in there 🤩)</p>
<p><strong>As a conclusion&#8230;</strong></p>
<p><span style="font-weight: 400;">According to Science (CORDIS saying !), <a href="https://europa.eu/!vYVHXD">New Year’s resolutions appear difficult to be held</a></span><span style="font-weight: 400;">&#8230; because most of time too ambitious, restrictive or unprecisely formulated : indeed, « </span><span style="font-weight: 400;">the </span><a href="https://cordis.europa.eu/article/id/428767-trending-science-do-this-one-thing-to-keep-your-new-year-s-resolutions-research-says"><span style="font-weight: 400;">effectiveness of resolutions depends on how they are </span><b>framed</b></a><span style="font-weight: 400;">.</span><span style="font-weight: 400;"> »</span></p>
<p><span style="font-weight: 400;">Horizon 2024, let’s suggest a(n RDF ?) well-framed one : may CORDIS SPARQL endpoint initiative be an example for other structures who want to share Linked Open Data !</span></p>
<p><span style="font-weight: 400;"><strong>Wishing you Best Interoperability and a Very Merry ✨ Sparqling New Year !</strong> ✨</span></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2024/01/15/cordis-a-sparql-endpoint-is-born/">CORDIS : a SPARQL endpoint is born !</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2024/01/15/cordis-a-sparql-endpoint-is-born/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Référentiel ROME de Pôle Emploi en SKOS (à partir de data.gouv.fr)</title>
		<link>https://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/</link>
		<comments>https://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/#comments</comments>
		<pubDate>Tue, 18 Apr 2017 08:31:17 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Open Data]]></category>
		<category><![CDATA[SKOS]]></category>
		<category><![CDATA[SKOS Play]]></category>
		<category><![CDATA[Thesaurus]]></category>
		<category><![CDATA[Visualisation de données]]></category>
		<category><![CDATA[data.gouv.fr]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[rome]]></category>
		<category><![CDATA[skos play]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web de données de l'emploi]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1132</guid>
		<description><![CDATA[<p>Etalab, la mission chargée de la politique Open Data de l’administration aujourd’hui intégrée à la DSI de l’Etat, vient d’ouvrir le portail du service public de la donnée (lire l&#8217;article sur silicon.fr) : des jeux de données de référence, &#171;&#160;à fort impact économique et social&#160;&#187;, d&#8217;un niveau de qualité et de fraîcheur garanti. Parmi ceux-ci&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/">Référentiel ROME de Pôle Emploi en SKOS (à partir de data.gouv.fr)</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">Etalab, la mission chargée de la politique Open Data de l’administration aujourd’hui intégrée à la DSI de l’Etat, vient d’ouvrir le <a href="http://www.data.gouv.fr/fr/reference" target="_blank">portail du service public de la donnée</a> (lire l&rsquo;<a href="http://www.silicon.fr/open-data-service-public-donnee-ouvre-171799.html" target="_blank">article sur silicon.fr</a>) : des jeux de données de référence, &laquo;&nbsp;à fort impact économique et social&nbsp;&raquo;, d&rsquo;un niveau de qualité et de fraîcheur garanti. Parmi ceux-ci le <strong><a href="https://www.data.gouv.fr/fr/datasets/repertoire-operationnel-des-metiers-et-des-emplois-rome/" target="_blank">Répertoire Opérationnel des Métiers et de l&rsquo;Emploi (ROME)</a></strong>, la classification utilisée par Pôle Emploi.</p>
<p style="text-align: justify;">A partir des fichiers de données du Répertoire Opérationnel des Métiers et de l&rsquo;Emploi, j&rsquo;ai mis en ligne des <a href="http://labs.sparna.fr/code-rome.html" target="_blank"><strong>visualisations de données du ROME</strong></a>, après nettoyage, traitement, et conversion des données en <a href="http://www.sparna.fr/skos/SKOS-traduction-francais.html">SKOS</a>.</p>
<h3 style="text-align: justify;">Le Répertoire ROME</h3>
<p style="text-align: justify;">Ce répertoire ROME m&rsquo;avait intéressé il y a 4 ans lorsque j&rsquo;avais effectué une mission pour l&rsquo;optimisation sémantique du moteur de recherche SolR d&rsquo;un <em>job board</em>. Nous nous étions demandé à l&rsquo;époque si nous pouvions réutiliser une partie de ce référentiel pour effectuer un rapprochement (automatique ou manuelle) des titres d&rsquo;annonces d&rsquo;emplois vers le référentiel. Cela aurait permis, à partir de l&rsquo;identification du nom du poste, de <strong>catégoriser automatiquement les annonces dans la catégorie ROME appropriée</strong>. Le ROME contient en effet plus de <strong>11000 dénominations de postes/métiers</strong>, catégorisés dans une double classification : une arborescence principale, et une arborescence thématique. On y trouve donc des entrées comme :</p>
<ul style="text-align: justify;">
<li><span id="19f41e49-c1fc-4e81-9b60-c5805abd8aab1348877816"><span class="ext-uri" title="http://data.sparna.fr/vocabulaires/code-rome/G1201-3570">Accompagnateur / Accompagnatrice en écotourisme</span></span></li>
<li>Responsable de rayon produits alimentaires</li>
<li>Assistant / Assistante mise en scène</li>
<li>etc.</li>
</ul>
<p style="text-align: justify;">Ces noms de postes sont organisés dans une classification à 3 niveaux : &laquo;&nbsp;AGRICULTURE ET PÊCHE, ESPACES NATURELS ET ESPACES VERTS, SOINS AUX ANIMAUX &gt; Espaces naturels et espaces verts &gt; Bûcheronnage et élagage&nbsp;&raquo;. Le 3eme niveau (ici &laquo;&nbsp;Bûcheronnage et élagage&nbsp;&raquo;) correspond à une <strong>fiche métier</strong> (ici <a href="http://candidat.pole-emploi.fr/marche-du-travail/fichemetierrome?codeRome=A1201">http://candidat.pole-emploi.fr/marche-du-travail/fichemetierrome?codeRome=A1201</a>) et est associé à un code (ici A1201).</p>
<div style="width: 1189px" class="wp-caption aligncenter"><a href="http://labs.sparna.fr/code-rome.html"><img src="http://labs.sparna.fr/code-rome/code-rome-arborescence.png" alt="" width="1179" height="716" /></a><p class="wp-caption-text">Arborescence principale du code ROME dans SKOS-Play</p></div>
<h3 style="text-align: justify;">Conversion en SKOS</h3>
<p style="text-align: justify;">Je suis reparti ici des fichiers bruts fournis sur data.gouv.fr, et j&rsquo;ai passé un peu de temps à les convertir en SKOS avec le <a href="http://labs.sparna.fr/skos-play/convert" target="_blank">convertisseur Excel vers SKOS de SKOS Play</a> :</p>
<ul style="text-align: justify;">
<li>ajustement manuel de certaines valeurs mal séparées par des virgules dans le fichier CSV de départ;</li>
<li>suppression des guillemets simples et doubles;</li>
<li>fusion des 2 fichiers fournis (arborescence principale et arborescence thématique);</li>
<li>réorganisation des colonnes;</li>
</ul>
<p style="text-align: justify;">Il s&rsquo;agit ensuite de construire un tableau Excel au format adéquat pour une conversion vers SKOS, en adaptant la structure des fichiers, typiquement en calculant le contenu de nouvelles colonnes avec des formules Excel. En particulier, il s&rsquo;agit de <strong>donner des identifiants URI à toutes les entrées du code ROME, pour arriver ainsi à des <a href="http://5stardata.info/fr/">données open data &laquo;&nbsp;4 étoiles&nbsp;&raquo;</a>.  </strong>Cette conversion SKOS est relativement aisée à réaliser, <strong>sans écriture de code ni script</strong>. Elle est accessible à toute personne capable de manipuler Excel.</p>
<p style="text-align: justify;">Ces données SKOS du ROME sont publiées à <a href="http://data.sparna.fr/vocabulaires/code-rome"><strong>http://data.sparna.fr/vocabulaires/code-rome</strong></a>.</p>
<p style="text-align: justify;">Je ne rentrerai pas dans les détails de modélisation du ROME en SKOS, sauf sur 1 point : on peut <strong>se demander ce qu&rsquo;il convient d&rsquo;identifier comme &laquo;&nbsp;Concept&nbsp;&raquo;</strong> dans ce référentiel. J&rsquo;ai pris le parti de considérer chaque nom de <em>poste</em> comme un <a href="http://www.w3.org/2004/02/skos/core#Concept">skos:Concept</a>, et tous les éléments de classification thématiques comme des <a href="http://www.w3.org/2004/02/skos/core#Collection">skos:Collection</a> (donc des tiroirs, qui ne sont pas utilisables dans une indexation). Un point de vue différent mais tout aussi valable serait de considérer non pas les noms de <em>poste</em> comme des concepts, mais bien les noms de <em>métier</em>, chaque métier ayant une correspondance avec une fiche sur le site Pôle Emploi; les noms de poste seraient alors des synonymes (<a href="http://www.w3.org/2004/02/skos/core#altLabel">skos:altLabel</a>) du métier (dans l&rsquo;exemple au-dessus, le métier A1202 &laquo;&nbsp;Bûcheronnage et élagage&nbsp;&raquo; aurait alors pour synonymes &laquo;&nbsp;Agent / Agente d&rsquo;aménagement des haies et fossés&nbsp;&raquo;, &laquo;&nbsp;Agent / Agente d&rsquo;entretien des espaces naturels&nbsp;&raquo;, &laquo;&nbsp;Ouvrier / Ouvrière d&rsquo;entretien des espaces naturels&nbsp;&raquo;, etc.).</p>
<h3 style="text-align: justify;">Visualisations de données</h3>
<p style="text-align: justify;">A partir des données SKOS, on peut ensuite générer des visualisations avec <a href="http://labs.sparna.fr/skos-play">SKOS Play</a> : ces visualisations sont publiés à <strong><a href="http://labs.sparna.fr/code-rome.html" target="_blank">http://labs.sparna.fr/code-rome.html</a></strong>. 3 visualisations ont été produites :</p>
<ol style="text-align: justify;">
<li><a href="http://labs.sparna.fr/code-rome/code-rome-autocomplete-pole-emploi.html">Un champ de recherche assisté</a> (avec une autocompletion sur les noms des métiers), permettant de lancer une recherche d&rsquo;annonces sur le site Pôle Emploi à partir d&rsquo;un nom de métier; on pourrait imaginer quelque chose de similaire pour accéder aux fiches métiers plutôt qu&rsquo;aux annonces;</li>
<li><a href="http://labs.sparna.fr/code-rome/code-rome-visualisation-arbre.html">Une vue arborescente</a> avec d3js, permettant de naviguer visuellement dans l&rsquo;arbre;</li>
<li><a href="http://labs.sparna.fr/code-rome/code-rome-arborescence.html">Un listing indenté</a> en HTML, que l&rsquo;on peut plier et déplier;</li>
</ol>
<p>On notera que, sauf pour l&rsquo;articulation entre le champ de recherche assisté et le site de Pôle Emploi qui demande 10 lignes de javascript, ces visualisations sont produites directement par SKOS Play sans avoir à écrire de code.</p>
<h3 style="text-align: justify;">Un &laquo;&nbsp;Web des données de l&rsquo;emploi&nbsp;&raquo; ?</h3>
<p style="text-align: justify;">On a donc ici fait passer le référentiel ROME à un meilleur niveau de qualité des données, permettant une intégration facilitée dans d&rsquo;autres systèmes, d&rsquo;autres outils de recherche. Au delà de la démonstration sur la conversion et la visualisation de données, j&rsquo;aimerai dans une deuxième étape illustrer l&rsquo;<strong>alignement des données du ROME avec d&rsquo;autres référentiels</strong> (probablement <a href="https://ec.europa.eu/esco/portal/home">ESCO</a>), en utilisant <a href="https://github.com/lmazuel/onagui">OnaGUI,</a> qui permet de simplifier les alignements de vocabulaires. On aurait alors un beau référentiel 5 étoiles, <em>_dans_</em> le web (et pas simplement <em>_sur_</em> le web), avec des correspondances vers d&rsquo;autres données. Un <strong>&laquo;&nbsp;web des données de l&rsquo;emploi&nbsp;&raquo;</strong> ? il fallait bien ça à quelques jours des présidentielles !</p>
<p style="text-align: justify;">Dans une deuxième étape je publierai le SKOS généré pour que les URIs soient déréférençables, en utilisant <a href="http://skosmos.org/">SKOSMOS</a>, dans un déploiement similaire à celui utilisé pour <a href="http://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/">publier le thesaurus de l&rsquo;UNESCO</a>.</p>
<p style="text-align: justify;">J&rsquo;espère que cette conversion de données en SKOS permettra une diffusion et une intégration plus large de ce référentiel utile pour la recherche d&rsquo;emplois. Dites-moi si vous réutilisez ces données pour d&rsquo;autres visualisations ou d&rsquo;autres systèmes, ou si vous souhaitez de l&rsquo;aide pour son intégration.</p>
<p style="text-align: justify;"><em>Illustration de l&rsquo;article tirée de Wikimedia Commons : <a href="https://fr.wikipedia.org/wiki/Fichier:Metro_de_Paris_-_Ligne_2_-_Rome_07.jpg">https://fr.wikipedia.org/wiki/Fichier:Metro_de_Paris_-_Ligne_2_-_Rome_07.jpg</a></em></p>
<p style="text-align: justify;">
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/">Référentiel ROME de Pôle Emploi en SKOS (à partir de data.gouv.fr)</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2017/04/18/rome-pole-emploi-skos-rdf-data-gouv-fr/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Partarger et réutiliser des données structurées sur le web</title>
		<link>https://blog.sparna.fr/2014/03/12/partarger-et-reutiliser-donnees-structurees-sur-le-web/</link>
		<comments>https://blog.sparna.fr/2014/03/12/partarger-et-reutiliser-donnees-structurees-sur-le-web/#comments</comments>
		<pubDate>Wed, 12 Mar 2014 11:35:51 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[Open Data]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[Schema.org]]></category>
		<category><![CDATA[data]]></category>
		<category><![CDATA[DBpedia]]></category>
		<category><![CDATA[open refine]]></category>
		<category><![CDATA[schema.org]]></category>
		<category><![CDATA[wikidata]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=542</guid>
		<description><![CDATA[<p>J&#8217;interviens le jeudi 20 mars 2014 à la Cantine Numérique de Tours, dans le cadre des webschool, pour parler des données structurées sur le web. Je posterai ici le lien vers les supports de la présentation. C&#8217;est un challenge d&#8217;intégrer en une seule présentation cohérente et accessible des sujets comme l&#8217;open data, schema.org et le&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2014/03/12/partarger-et-reutiliser-donnees-structurees-sur-le-web/">Partarger et réutiliser des données structurées sur le web</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>J&rsquo;interviens le jeudi 20 mars 2014 à la Cantine Numérique de Tours, dans le cadre des <a href="http://www.webschool-tours.fr">webschool</a>, pour parler des <a href="http://www.webschool-tours.fr/wst7-partager-et-reutiliser-des-donnees-structurees-sur-le-web/">données structurées sur le web</a>. Je posterai ici le lien vers les supports de la présentation. C&rsquo;est un challenge d&rsquo;intégrer en une seule présentation cohérente et accessible des sujets comme l&rsquo;open data, schema.org et le web de données, tout cela regroupé dans la thématique des données sur le web. Le message que je vais faire passer va être que nous pouvons réutiliser et partager sur le web, non seulement des documents multimédias, mais aussi des données !</p>
<p><iframe src="http://www.slideshare.net/slideshow/embed_code/32500420" width="476" height="400" frameborder="0" marginwidth="0" marginheight="0" scrolling="no"></iframe></p>
<p>&nbsp;</p>
<div id="schema_block" class="schema_event">
<div><a class="schema_url" href="http://blog.sparna.fr/partarger-et-reutiliser-donnees-structurees-sur-le-web/" target="_blank"><br />
</a></p>
<div class="schema_name">Webschool : Partager et réutiliser des données structurées sur le web</div>
<div class="schema_description">Nous avons tous l’habitude de cliquer sur des liens pour naviguer de page en page sur le web. Cette « toile » du web relie entre eux des documents que nous comprenons, manipulons, sauvegardons, recopions, etc. Mais le web permet aussi, et de plus en plus, de partager des données structurées, non plus d’ « homme à homme », mais d’ « application informatique à application informatique ». Et ça change beaucoup de choses ! De l’optimisation de la présentation des résultats de recherche dans Google (schema.org et Google Knowledge Graph), à la réutilisation des données structurées de Wikipedia (dbpedia.org) ou d’autres sources (INSEE, BNF, etc.), en passant par les projets d’Open Data (data.gouv.fr, SNCF, etc.), nous pouvons réutiliser des données existantes sur le web, ou partager les nôtres. Petit panorama de quelques bases de données, outils, exemples, et standards de ce « web des données » !</div>
<div>Starts: 03/20/2014 06:00 pm</div>
<div>Ends: 03/20/2014</div>
<div>Duration: 2 hours</div>
<div>
<div class="street">30, rue André Theuriet</div>
<div class="city_state"><span class="locale">Tours</span></div>
<div class="country">FR</div>
</div>
</div>
</div>
<p>&nbsp;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2014/03/12/partarger-et-reutiliser-donnees-structurees-sur-le-web/">Partarger et réutiliser des données structurées sur le web</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2014/03/12/partarger-et-reutiliser-donnees-structurees-sur-le-web/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Données Ouvertes et Entreprises Privées</title>
		<link>https://blog.sparna.fr/2013/04/02/donnees-ouvertes-entreprises-privees/</link>
		<comments>https://blog.sparna.fr/2013/04/02/donnees-ouvertes-entreprises-privees/#comments</comments>
		<pubDate>Tue, 02 Apr 2013 13:13:50 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Open Data]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=280</guid>
		<description><![CDATA[<p>Préambule : de la différence entre &#171;&#160;public&#160;&#187; et &#171;&#160;ouvert&#160;&#187; Il y a une différence entre les informations/données publiques et les informations/données ouvertes. La différence, dans cette notion d&#8217;ouverture, est avant tout une question de conditions de réutilisation des informations/données. Conditions de réutilisation juridiques et techniques. Toute donnée publique n&#8217;est pas de l&#8217;Open Data (voir les&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2013/04/02/donnees-ouvertes-entreprises-privees/">Données Ouvertes et Entreprises Privées</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<h2>Préambule : de la différence entre &laquo;&nbsp;public&nbsp;&raquo; et &laquo;&nbsp;ouvert&nbsp;&raquo;</h2>
<p style="text-align: justify;">Il y a une différence entre les informations/données <strong>publiques</strong> et les informations/données <strong>ouvertes</strong>. La différence, dans cette notion d&rsquo;ouverture, est avant tout une question de <strong>conditions de réutilisation des informations/données</strong>. Conditions de réutilisation juridiques et techniques. Toute donnée publique n&rsquo;est pas de l&rsquo;Open Data (voir les <a href="http://www.slideshare.net/calimaq/lopen-data-culturel-en-france-et-en-europe">présentations de Calimaq</a> sur ce sujet), des tas d&rsquo;informations sont déjà publiques sans être ouvertes : comptes-rendus de conseils municipaux, journaux officiels, etc. Par ailleurs, une fois ouverte, une information l&rsquo;est pour n&rsquo;importe qui, n&rsquo;importe quand, et pour faire n&rsquo;importe quoi :</p>
<p style="text-align: justify;"><span id="more-280"></span></p>
<ul>
<li style="text-align: justify;"><em>pour n&rsquo;importe qui</em> : si l&rsquo;information/donnée n&rsquo;intéresse pas le cercle de ses destinataires premiers, il est possible que quelqu&rsquo;un, quelque part, en ait une utilité;</li>
<li style="text-align: justify;"><em>n&rsquo;importe quand</em> : une fois publiée, une information/donnée va rester accessible. A moins qu&rsquo;elle ne soit supprimée ? non, trop tard, elle aura déjà été copiée de ci de là, téléchargée par vos copains, indexée par Google, archivée dans <a href="http://archive.org/web/web.php">les archives du web</a>;</li>
<li style="text-align: justify;"><em>pour faire n&rsquo;importe quoi</em> : si l&rsquo;information/donnée n&rsquo;a pas de sens toute seule, elle peut faire sens si elle est mise en contexte avec d&rsquo;autres informations/données. Tableaux, cartes, hiérarchies de classement, les données ne prennent sens que mise dans un contexte, avec d&rsquo;autres.</li>
</ul>
<h2>1ère partie : de la misère humaine en milieu publicitaire [1. &laquo;&nbsp;De la misère humaine en milieu publicitaire&nbsp;&raquo; est livre du <a href="http://www.editionsladecouverte.fr/auteur/index.php?id=14503">Groupe Marcuse</a> dénonçant les méfaits de la publicité.]</h2>
<p style="text-align: justify;">Les institutions politiques et les gouvernements n&rsquo;ont plus les moyens suffisants d&rsquo;influer sur l&rsquo;avenir. Qui croit encore que la conquête de pouvoir est un passage obligé vers les lendemains qui chantent [2. l&rsquo;originalité des mouvements contestataires récents &#8211; <a href="http://fr.wikipedia.org/wiki/Arm%C3%A9e_zapatiste_de_lib%C3%A9ration_nationale#Changer_le_monde_sans_prendre_le_pouvoir">Zapatistes</a>, <a href="http://fr.wikipedia.org/wiki/Mouvement_des_Indign%C3%A9s#Pens.C3.A9e_du_mouvement">Indignés</a>, <a href="http://fr.wikipedia.org/wiki/Anonymous_%28collectif%29">Anonymous</a>, <a href="http://fr.wikipedia.org/wiki/D%C3%A9croissance_%28%C3%A9conomie%29">Décroissants</a>, etc. &#8211; est justement que la conquête du pouvoir est absente de leurs objectifs.] ? Le prétendument libre marché a plus d&rsquo;influence sur nos vies que les politiques publiques. La sphère économique influence notre façon de consommer, de travailler (ou de chômer), de nous détendre : tout devient prétexte à marchandisation. Elle le fait en particulier en redirigeant nos pulsions, qui sont traditionnellement &laquo;&nbsp;canalisées&nbsp;&raquo; à travers des structures sociales complexes &#8211; mariage, sport, mathématiques, dessin, etc. &#8211; et forment ainsi la base d&rsquo;un &laquo;&nbsp;vivre-ensemble&nbsp;&raquo;, vers des objets de consommation [3. C&rsquo;est la <a href="http://fr.wikipedia.org/wiki/Philia">philia</a> de <a href="http://fr.wikipedia.org/wiki/Bernard_Stiegler">Bernard Stiegler</a>]. Cette manipulation du désir est orchestrée par les plans marketing et publicitaires s&rsquo;appuyant sur les médias de masse.</p>
<p style="text-align: justify;">Le monde des entreprises et en particulier de celles dirigées par des gestionnaires qui ne viennent pas du &laquo;&nbsp;métier&nbsp;&raquo; mais des écoles de gestion est à l&rsquo;opposé de l&rsquo;idéal de démocratie vanté par les sociétés occidentales [4. ce qui n&rsquo;est pas incompatible avec l&rsquo;approche du travail psychologique/psychiatrique de <a href="http://fr.wikipedia.org/wiki/Christophe_Dejours">Christophe Dejours</a>, dans laquelle le travail est pour l&rsquo;individu le lieu d&rsquo;apprentissage de la délibération, de la solidarité, des interactions avec les autres pour trouver la meilleure solution, bref le lieu d&rsquo;apprentissage des processus démocratiques. Autant d&rsquo;apprentissages <em>cassés</em> par les méthodes de management gestionnaires.]. Les salariés ne sont pas associés aux décisions et sont des variables d&rsquo;ajustement de stratégies économiques qu&rsquo;ils n&rsquo;ont pas choisies [5. ce que prennent à contre-pied les formes coopératives d&rsquo;organisation du travail comme les <a href="http://www.les-scop.coop/sites/fr/">SCOP</a>]. Les quelques organisations (syndicats) ou mécanismes de régulation (droit du travail) sont soit dépassés, soit <a href="http://www.rue89.com/rue89-eco/2013/03/05/accord-sur-la-flexisecurite-pourquoi-tant-de-passions-240259">mis en danger</a>. Les entreprises ne recherchent pas notre mieux-être collectif; elles recherchent leurs profits. C&rsquo;est pourquoi <strong>il apparaît nécessaire de réclamer plus de transparence sur les données des entreprises, notamment à des fins de régulation</strong>.</p>
<h2>2ème partie : du constat de la quasi-absence de données ouvertes concernant les entreprises</h2>
<p style="text-align: justify;">L&rsquo; <a href="http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes">Open Data</a> ou ouverture des données est &laquo;&nbsp;une philosophie visant à rendre certaines données accessibles à tous et s’affranchir des restrictions imposées par les licences payantes (&#8230;) qui en limitent notamment l&rsquo;exploitation et la reproduction&nbsp;&raquo;. Ce mouvement concerne certaines données publiques des administrations centrales ou locales (le portail <a href="http://data.gouv.fr" target="_blank">data.gouv.fr</a> en France), mais pas les données du privé. Les registres publics en France relatifs aux entreprises ont des modes d&rsquo;accès variés; la base <a href="http://www.sirene.fr/">Sirene</a> est payante, la base <a href="http://www.infogreffe.fr">infogreffe</a> permet une recherche gratuite mais un accès payant aux fiches détaillées, les bases de l&rsquo;<a href="http://www.inpi.fr/fr/services-et-prestations/bases-de-donnees-gratuites/base-marques.html">INPI</a> sont d&rsquo;accès gratuits &#8211; même si on nous suggère de ne pas nous y fier et de commander une recherche payante; et si l&rsquo;accès est gratuit, les données ne sont pas ouvertes et il est interdit de réutiliser le contenu de la base.</p>
<p style="text-align: justify;">Quid des données concernant les entreprises sur le reste du &laquo;&nbsp;web de données&nbsp;&raquo; ? Hé bien dans <a href="http://fr.dbpedia.org">DBPedia francophone</a> c&rsquo;est la joyeuse anarchie propre aux projets communautaires, donc il ne faut s&rsquo;attendre ni à la complétude ni à l&rsquo;exactitude ni à l&rsquo;objectivité des données &#8211; même si cela permet de récupérer quelques petites choses amusantes comme <a href="http://fr.dbpedia.org/sparql?default-graph-uri=&amp;query=select+%3Flabel+%3Fslogan+where+{%0D%0A++%3Fx+a+%3Chttp%3A%2F%2Fdbpedia.org%2Fontology%2FCompany%3E+.%0D%0A++%3Fx+%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23label%3E+%3Flabel+.%0D%0A++%3Fx+%3Chttp%3A%2F%2Ffr.dbpedia.org%2Fproperty%2Fslogan%3E+%3Fslogan%0D%0A}&amp;format=text%2Fhtml&amp;timeout=0&amp;debug=on">des slogans</a>. Quant au &laquo;&nbsp;<a href="http://www.google.com/insidesearch/features/search/knowledge.html">Google Knowledge Graph</a>&laquo;&nbsp;, comme on le fait remarquer <a href="http://mondeca.wordpress.com/2013/02/20/ceci-n-est-pas-le-web-semantique/">ici</a>, il ignore de façon spectaculaire les entreprises : quelques données sur <a href="https://www.google.fr/search?q=carlos+ghosn">Carlos Goshn</a>, mais rien sur <a href="https://www.google.fr/search?q=renault">Renault</a>, quelques infos sur <a href="https://www.google.fr/search?q=xavier+niel">Xavier Niel</a> mais rien sur <a href="https://www.google.fr/search?q=iliad">Iliad</a>, etc.</p>
<p style="text-align: justify;">Début 2011 a été lancé <a href="http://opencorporates.com/" target="_blank">opencorporates.com</a> [6. Voir <a href="http://blog.opencorporates.com/2010/12/20/press-release-opencorporates-launches/" target="_blank">la press-release de l&rsquo;annonce de lancement</a>], une initiative d&rsquo;une société britannique visant à rendre accessibles de façon ouverte de nombreuses données sur les entreprises, notamment les montants des contrats publics qu&rsquo;elles ont remportés, ou le nom de leurs administrateurs. Si l&rsquo;initiative semble répondre à mon désir de données ouvertes (avec toute la couche technique qui va bien : API, identifiants, liens, etc.), elle se heurte aux contraintes légales et ne propose aucune données sur les entreprises françaises. Rien. (Voir <a href="http://data.blog.lemonde.fr/2012/09/19/opencorporates-un-oeil-ouvert-sur-les-entreprises/" target="_blank">cet article du Monde.fr</a>).</p>
<p style="text-align: justify;">Pourquoi une telle difficulté à accéder à des données ouvertes sur les entreprises ? Si le constat fait précédemment de la prééminence de ces organisations privées sur nos vies est fondé (n&rsquo;importe quel reportage à propos d&rsquo;un n-ième plan social ou d&rsquo;un n-ième scandale sanitaire servirait d&rsquo;illustration), alors <strong>nous avons le droit à une information ouverte sur le fonctionnement des entreprises</strong>. Une information ouverte : accessible et réutilisable par n&rsquo;importe qui, n&rsquo;importe quand, pour faire ce que bon nous semble.</p>
<h2>3ème partie : de ce que les données ouvertes sur les entreprises pourraient changer.</h2>
<p style="text-align: justify;">Il faut travailler, des points de vue légal, militant et technique, à l&rsquo;obtention, la constitution ou l&rsquo;ouverture de données ouvertes simples et fiables, pour toutes les sociétés privées qui structurent notre quotidien plus que ne le fait l&rsquo;action publique, concernant :</p>
<ul style="text-align: justify;">
<li><strong>les chiffres</strong> : chiffre d&rsquo;affaires, bénéfice, montant des contrats publics, etc.</li>
<li><strong>l&rsquo;actionnariat et les dirigeants</strong> : qui dirige, qui contrôle, le salaire des dirigeants ou le montant des jetons de présence au conseil d&rsquo;administration, etc.</li>
<li><strong>les produits</strong> : marques et les filiales, les sites de production, fournisseurs et clients, etc.</li>
<li><strong>le social</strong> : nombre de salariés, salaires, politique sociale, etc.</li>
</ul>
<p style="text-align: justify;">Il me semble que c&rsquo;est sur ce type d&rsquo;information que l&rsquo;Open Data peut avoir un apport réellement disruptif, pas sur des données qui étaient de toutes façons déjà publiques. De la même façon que la logique de l&rsquo;Open Data dit qu&rsquo;en tant que citoyen &laquo;&nbsp;ce sont nos impôts qui financent l&rsquo;action publique, donc nous avons le droit aux données résultant de cette action&nbsp;&raquo;, en tant que consommateurs nous pourrions dire <strong>&laquo;&nbsp;c&rsquo;est notre consommation qui finance votre entreprise, donc nous avons le droit aux données résultant du fonctionnement de votre entreprise&nbsp;&raquo;</strong>. Par ailleurs, la &laquo;&nbsp;<a href="http://www.les-europes.org/article.php3?id_article=1">concurrence libre et non-faussée</a>&nbsp;&raquo; de la constitution européenne dans la lignée des dogmes libéraux ne peut se réaliser que dans un contexte d&rsquo;égal accès à l&rsquo;information pour tous, et l&rsquo;ouverture des données privées va dans ce sens.</p>
<p style="text-align: justify;">L&rsquo;accès à ces informations éviterait entre autres les <a href="http://tempsreel.nouvelobs.com/tag/spanghero">scandales équino-bovins</a> ou l&rsquo;<a href="http://www.lanouvellerepublique.fr/Loir-et-Cher/Actualite/Economie-social/n/Contenus/Articles/2012/07/03/La-viennoiserie-maison-aura-desormais-son-label" target="_blank">opacité patissière</a>. Elle permettrait :</p>
<ul>
<li style="text-align: justify;">d&rsquo;<strong>améliorer l&rsquo;information du consommateur</strong> sur les produits ou service qu&rsquo;il achète;</li>
<li style="text-align: justify;">de <strong>réguler le fonctionnement des entreprises</strong>; comme l&rsquo;espère <a href="http://opencorporates.com/" target="_blank">opencorporates.com</a> de &laquo;&nbsp;<em>donner aux citoyens, ONG, médias et aux autres entreprises le moyen de comprendre, contrôler et réguler les entreprises&nbsp;&raquo;;</em></li>
<li style="text-align: justify;">de <strong>servir de base aux processus démocratiques au sein même des entreprises</strong>;</li>
</ul>
<p style="text-align: justify;">Quelles pistes concrètes ?</p>
<ul>
<li style="text-align: justify;"><strong>Sensibiliser les entreprises de l&rsquo;économie sociale et solidaire à la problématique de l&rsquo;Open Data</strong> afin qu&rsquo;elles ouvrent leurs données [7. à ce propos si vous êtes dans la région de Tours rendez-vous ce vendredi 5 avril pour un <a href="http://www.cresol.fr/index.php/component/content/article/2-non-categorise/104-assises-locales-ess-tours-5-04">atelier Open Data dans le cadre des assises de l&rsquo;Economie Sociale et Solidaire]</a>;</li>
<li style="text-align: justify;"><strong>Obliger par l&rsquo;accord de licence de réutilisation les entreprises qui ré-utilisent des données à publier elles-mêmes des données sur leurs activités</strong>; cela éviterait peut-être certaines dérives comme la copie pure et simple du contenu de Wikipedia (légalement autorisée mais éthiquement condamnable) dans les moteurs de recherche Orange et Voilà à la seule fin d&rsquo;y ajouter un contenu publicitaire, relatée dans <a href="http://www.savoirscom1.info/2012/11/14/pour-une-approche-complexe-des-usages-marchands-des-biens-communs-de-la-connaissance/">cet article de fond sur savoirscom1.info</a>;</li>
<li style="text-align: justify;">Faire valoir dans le cadre de la <a href="http://www.etalab.gouv.fr/article-la-feuille-de-route-du-gouvernement-en-matiere-d-ouverture-et-de-partage-des-donnees-publiques-115767801.html">nouvelle feuille de route de l&rsquo;état sur l&rsquo;Open Data</a> l&rsquo;intérêt du citoyen, du consommateur, du travailleur à disposer d&rsquo;informations ouvertes sur les entreprises; n&rsquo;hésitez pas si vous êtes sensibles à cette question à <span style="text-decoration: underline;"><strong><a href="https://www.data.gouv.fr/Communaute/Boite-a-Idees/Donnees-sur-les-registres-d-entreprises">commenter cette proposition dans la boite à idées d&rsquo;Etalab</a></strong></span>;</li>
</ul>
<hr />
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2013/04/02/donnees-ouvertes-entreprises-privees/">Données Ouvertes et Entreprises Privées</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2013/04/02/donnees-ouvertes-entreprises-privees/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Open data et web de données : convergence ?</title>
		<link>https://blog.sparna.fr/2012/10/11/open-data-et-web-de-donnees-convergence/</link>
		<comments>https://blog.sparna.fr/2012/10/11/open-data-et-web-de-donnees-convergence/#comments</comments>
		<pubDate>Thu, 11 Oct 2012 20:16:38 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[Open Data]]></category>
		<category><![CDATA[datalift]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web sémantique]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=202</guid>
		<description><![CDATA[<p>L&#8217;open data rencontre des problématiques d&#8217;interopérabilité, d&#8217;interconnexion entre les données, de cohérence de formats, d&#8217;accès atomiques aux données. Les standards du web de données proposent des solutions à ces questions, l&#8217;objectif étant toujours de maximiser la réutilisation des données. Le web de données, de son côté, n&#8217;a jamais permis autre chose que la diffusion et&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2012/10/11/open-data-et-web-de-donnees-convergence/">Open data et web de données : convergence ?</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>L&rsquo;open data rencontre des problématiques d&rsquo;interopérabilité, d&rsquo;interconnexion entre les données, de cohérence de formats, d&rsquo;accès atomiques aux données. Les standards du web de données proposent des solutions à ces questions, l&rsquo;objectif étant toujours de maximiser la réutilisation des données.</p>
<p>Le web de données, de son côté, n&rsquo;a jamais permis autre chose que la diffusion et l&rsquo;interconnexion de données à l&rsquo;échelle du web. Il aura fallu attendre la libération des données publiques pour que cet enjeu devienne clair. L&rsquo;open data offre le cas d&rsquo;usage idéal pour le web de données &#8211; <strong>car en fait, on pourrait presque dire que ces 2 mots désignent la même chose et ont le même objectif</strong>.</p>
<p>Soyons clair : avancer vers les technologies du web de données, pour un producteur de données, <strong>demande un effort supplémentaire</strong>. Que peut-il en attendre ? J&rsquo;y vois 5 enjeux :</p>
<ol>
<li><strong>Devenir un producteur de données de référence</strong>. La possibilité offerte par les standards du web de données de faire des liens entre les instances décrites dans les données, permettent à un producteur d&rsquo;obtenir des liens entrants vers ses données, devenant ainsi un &laquo;&nbsp;hub&nbsp;&raquo;, un acteur central dans le réseau de données. C&rsquo;est un enjeu stratégique : <strong>si vous n&rsquo;ouvrez pas vos données aujourd&rsquo;hui, d&rsquo;autres le feront à votre place</strong>, et deviendront les référents.</li>
<li><strong>L&rsquo;enrichissement de ses données avec celles des autres</strong>; La possibilité de relier les éléments décrits dans les données à d&rsquo;autres, comme celles de la <a href="http://data.bnf.fr">BNF</a>, de l&rsquo;<a href="http://data.insee.fr">INSEE</a>, d&rsquo;<a href="http://eurovoc.europa.eu">Eurovoc</a>, de <a href="http://dbpedia.org">DBPedia</a>, va permettre aux consommateurs des données de suivre ces liens et d&rsquo;enrichir le système qu&rsquo;ils construisent avec ces nouvelles données.</li>
<li>La normalisation de son catalogue de données au format <a href="http://www.w3.org/2011/gld/wiki/Data_Catalog_Vocabulary">DCAT</a>, le rendant ainsi <strong>interopérable avec les catalogues des autres producteurs</strong>. Cela améliore la visibilité et la réutilisation du catalogue des datasets.</li>
<li><strong>La réutilisation de modèles existants</strong> pour décrire les données; les données publiées depuis 10 ans couvrent de nombreux domaines du savoir, et la problématique de description de beaucoup de données a donc déjà été traitée. De nombreux vocabulaires sont déjà disponibles (sur le <a href="http://lov.okfn.org/dataset/lov/">LOV</a> par exemple) et prêts à l&rsquo;emploi pour décrire le contenu des données.</li>
<li><strong>Le bénéfice d&rsquo;outils existants</strong>, et de futures évolutions. Poussé par le W3C, les standards du web de données sont ouverts, pérennes, et formeront la base d&rsquo;autres technologies, par exemple pour indiquer la traçabilité et les versions des données. Les outils compatibles avec ces standards existent et continueront d&rsquo;exister.</li>
</ol>
<p>Y a-t-il, y aura-t-il convergence ? les projets de recherche comme <a href="http://datalift.org">Datalift</a> proposent des outils basés sur les technologies du web de données pour que les producteurs de données &laquo;&nbsp;sémantisent&nbsp;&raquo; les données. Et moi aussi, <a href="http://sparna.fr/open-data.html">je peux vous aider</a> !</p>
<p><strong>Update</strong></p>
<p>Etalab vient de publier le <a href="http://www.etalab.gouv.fr/article-datalift-camp-resume-d-une-journee-de-formation-action-au-web-semantique-chez-etalab-111328780.html">compte-rendu de l&rsquo;événement &laquo;&nbsp;Datalift Camp&nbsp;&raquo;</a> qui adressaient ces problématiques et dont ces réflexions personnelles sont issues.</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2012/10/11/open-data-et-web-de-donnees-convergence/">Open data et web de données : convergence ?</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2012/10/11/open-data-et-web-de-donnees-convergence/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Open Data versus API</title>
		<link>https://blog.sparna.fr/2012/09/26/opendataversusapi/</link>
		<comments>https://blog.sparna.fr/2012/09/26/opendataversusapi/#comments</comments>
		<pubDate>Wed, 26 Sep 2012 09:35:10 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Open Data]]></category>
		<category><![CDATA[api]]></category>
		<category><![CDATA[dataware]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[rest]]></category>
		<category><![CDATA[temporalité]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=188</guid>
		<description><![CDATA[<p>Un billet publié récemment par Christian Fauré comparant les approches d&#8217;ouverture des données par rapport à la mise à disposition d&#8217;une API [1] m&#8217;inspire quelques marques d&#8217;accord et de désaccord : Principal hochement de tête approbateur : le concept de dataware et d&#8217;autonomisation des données, les données en elles-même et pour elles-mêmes, comme dans mon&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2012/09/26/opendataversusapi/">Open Data versus API</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Un billet publié récemment par Christian Fauré comparant les approches d&rsquo;ouverture des données par rapport à la mise à disposition d&rsquo;une API [1] m&rsquo;inspire quelques marques d&rsquo;accord et de désaccord :</p>
<ul>
<li>Principal hochement de tête approbateur : <strong>le concept de dataware</strong> et d&rsquo;autonomisation des données, les données en elles-même et pour elles-mêmes, comme dans mon <a title="Le dataware" href="http://blog.sparna.fr/le-dataware/">précédent billet</a>. Avec ce que cela implique de bouleversement dans la façon de concevoir les systèmes et les interactions au sein du SI.</li>
</ul>
<ul>
<li>Principale grimace de désaccord : la notion de &laquo;&nbsp;vérité éternelle des données&nbsp;&raquo;. Je crois que c&rsquo;est une vue de l&rsquo;esprit qui n&rsquo;a pas cours dans la réalité. <strong>Tous les projets de gestion d&rsquo;ontologies, de thesaurus, de catalogues, demandent et requièrent maintenant des fonctions de versionnement et de prise en compte des évolutions des données dans le temps</strong>. <span class="pullquote">Toutes les données changent dans le temps. Toutes.</span> Même le classement d&rsquo;un catalogue d&rsquo;archives évolue dans le temps. On s&rsquo;étonnera que cette notion d&rsquo;évolution dans le temps des données (&laquo;&nbsp;diachronicité des données&nbsp;&raquo;) n&rsquo;ait pas été prise en compte au niveau le plus bas des standards du web, RDF, ou même les URI (et on consultera le projet memento [2] avec intérêt si on est titillé par le sujet). Quel orgeuil, quand on y pense, de croire que les éléments d&rsquo;information que l&rsquo;on encode à un certain instant sont obligatoirement les bons, ou qu&rsquo;ils resteront valides éternellement.</li>
</ul>
<ul>
<li>Bref. Pour passer à un autre point, effectivement, le principe de base du Linked Data est que <strong>la connaissance de l&rsquo;identifiant d&rsquo;une chose suffit pour accéder à une représentation de cette chose</strong>; inutile de connaitre une API, ou de passer par le biais d&rsquo;une interface pour accéder à cette représentation.</li>
</ul>
<ul>
<li>Ce n&rsquo;est pas étonnant que l&rsquo;ouverture des systèmes à travers des API soit plus populaire que l&rsquo;ouverture des données &laquo;&nbsp;tout court&nbsp;&raquo; : l&rsquo;API est pensée pour le développeur, elle prend en compte ses cas d&rsquo;usage pour les simplifier, là où le Linked Data se garde bien de lui faciliter la tâche car justement, cette approche se concentre sur les données en elles-mêmes, sans préjuger de leur mode de réutilisation. <strong>Pour un développeur, il est bien plus facile de développer des applications à partir d&rsquo;une API qu&rsquo;à partir de données brutes</strong>; comment faire pour implémenter un simple écran de liste (de lieux, de bâtiments, de n&rsquo;importe quoi) uniquement à partir des URIs des données ? cela nécessite plusieurs appels et un parsing du résultat non trivial. Là où une API fournira un seul appel, renvoyant uniquement les données utiles, dans un format simple.</li>
</ul>
<ul>
<li>On en arrive donc à dire que <strong>publier des données sous forme de Linked Data ne permet pas leur réutilisation simple</strong>. C&rsquo;est paradoxal, puisque c&rsquo;est l&rsquo;objectif affiché. <span class="pullquote">Il faut que l&rsquo;ouverture des données fasse un pas de plus vers le développeur</span>. Des outils comme Elda [3] et la proposition du Linked Data API [4] sont exactement là pour franchir ce pas :&nbsp;&raquo;For some web developers the need to understand the RDF data model and associated serializations and query language (SPARQL) has proved a barrier to adoption of linked data. [The Linked Data API project] seeks to develop APIs, data formats and supporting tools to overcome this barrier. Including, but not limited to, accessing linked data via a developer-friendly JSON format.&nbsp;&raquo;</li>
</ul>
<p>&#8212;</p>
[1] DataCulture et APICulture : <a href="http://www.christian-faure.net/2012/09/20/dataculture-et-apiculture">http://www.christian-faure.net/2012/09/20/dataculture-et-apiculture</a><br />
[2] Memento project : <a href="http://mementoweb.org/">http://mementoweb.org/</a><br />
[3] Elda : <a href="http://code.google.com/p/elda/">http://code.google.com/p/elda/</a><br />
[4] Linked Data API : <a href="http://code.google.com/p/linked-data-api/">http://code.google.com/p/linked-data-api/</a></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2012/09/26/opendataversusapi/">Open Data versus API</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2012/09/26/opendataversusapi/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Producteurs de données &#8211; datalift camp les 9 et 10 octobre 2012</title>
		<link>https://blog.sparna.fr/2012/09/18/producteurs-de-donnees-datalift-camp-les-9-et-10-octobre-2012/</link>
		<comments>https://blog.sparna.fr/2012/09/18/producteurs-de-donnees-datalift-camp-les-9-et-10-octobre-2012/#comments</comments>
		<pubDate>Tue, 18 Sep 2012 09:46:44 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Evénements]]></category>
		<category><![CDATA[Open Data]]></category>
		<category><![CDATA[datalift]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=178</guid>
		<description><![CDATA[<p>Le projet Datalift organise un &#171;&#160;datalift camp&#160;&#187; les mardi 9 et mercredi 10 octobre. Cet événement à destination des producteurs de données leur permettra, en une journée, grâce à la plateforme Datalift et à l&#8217;assistance des experts présents, de migrer leurs jeux de données vers des données compatibles avec les standards du web sémantique (RDF). Venez&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2012/09/18/producteurs-de-donnees-datalift-camp-les-9-et-10-octobre-2012/">Producteurs de données &#8211; datalift camp les 9 et 10 octobre 2012</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Le projet <a href="http://datalift.org">Datalift</a> organise un &laquo;&nbsp;datalift camp&nbsp;&raquo; les mardi 9 et mercredi 10 octobre. Cet événement à destination des producteurs de données leur permettra, en une journée, grâce à la plateforme Datalift et à l&rsquo;assistance des experts présents, de migrer leurs jeux de données vers des données compatibles avec les standards du web sémantique (RDF). Venez avec vos données natives, repartez avec vos données en RDF !</p>
<p>L&rsquo;événement est <span style="text-decoration: underline;">gratuit</span> et <a href="http://dataliftcamp.eventbrite.fr/">les détails et inscriptions sont ici</a></p>
[schema type=&nbsp;&raquo;event&nbsp;&raquo; evtype=&nbsp;&raquo;BusinessEvent&nbsp;&raquo; url=&nbsp;&raquo;http://dataliftcamp.eventbrite.fr/&nbsp;&raquo; name=&nbsp;&raquo;Datalift Camp&nbsp;&raquo; sdate=&nbsp;&raquo;2012-10-09&Prime; stime=&nbsp;&raquo;09:00 am&nbsp;&raquo; edate=&nbsp;&raquo;2012-10-10&Prime; city=&nbsp;&raquo;Paris (lieu exact à préciser)&nbsp;&raquo;].</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2012/09/18/producteurs-de-donnees-datalift-camp-les-9-et-10-octobre-2012/">Producteurs de données &#8211; datalift camp les 9 et 10 octobre 2012</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2012/09/18/producteurs-de-donnees-datalift-camp-les-9-et-10-octobre-2012/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Rencontre de l&#8217;Open Data à Grenoble le 5 juin</title>
		<link>https://blog.sparna.fr/2012/05/27/rencontre-de-lopen-data-a-grenoble-le-5-juin/</link>
		<comments>https://blog.sparna.fr/2012/05/27/rencontre-de-lopen-data-a-grenoble-le-5-juin/#comments</comments>
		<pubDate>Sun, 27 May 2012 20:06:35 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Evénements]]></category>
		<category><![CDATA[Open Data]]></category>
		<category><![CDATA[inria]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=140</guid>
		<description><![CDATA[<p>L&#8217;INRIA Exmo organise une demie-journée sur l&#8217;ouverture des données, le mardi 5 juin 2012 à 14h, dans les locaux de l&#8217;INRIA Montbonnot près de Grenoble. Mondeca y sera présent, ainsi qu&#8217;Etalab, le projet Datalift, et d&#8217;autras acteurs de l&#8217;Open Data. Tous les détails sont sur le site de l&#8217;INRIA.</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2012/05/27/rencontre-de-lopen-data-a-grenoble-le-5-juin/">Rencontre de l&rsquo;Open Data à Grenoble le 5 juin</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<div itemscope itemtype="http://schema.org/Event" url="http://www.inria.fr/centre/grenoble/agenda/seminaire-in-tech-ouverture-des-donnees">
L&rsquo;INRIA Exmo organise une <span itemprop="name">demie-journée sur l&rsquo;ouverture des données</span>, le <span itemprop="startDate" content="2012-06-05T14:00">mardi 5 juin 2012 à 14h</span>, dans les locaux de l&rsquo;<span itemprop="location"><span itemscope itemtype="http://schema.org/Place"><span itemprop="name">INRIA Montbonnot</span></span></span> près de Grenoble. <span itemprop="attendee"><span itemtype="http://schema.org/Organization"><span  itemprop="name">Mondeca</span></span></span> y sera présent, ainsi qu&rsquo;Etalab, le projet Datalift, et d&rsquo;autras acteurs de l&rsquo;Open Data. Tous les détails sont sur <a href="http://www.inria.fr/centre/grenoble/agenda/seminaire-in-tech-ouverture-des-donnees" target="_blank">le site de l&rsquo;INRIA</a>.
</div>
<div class="zemanta-pixie" style="margin-top: 10px; height: 15px;"><img class="zemanta-pixie-img" style="float: right;" src="http://img.zemanta.com/pixy.gif?x-id=8205c8ac-1de3-418b-9e54-0a45798fa8e7" alt="" /></div>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2012/05/27/rencontre-de-lopen-data-a-grenoble-le-5-juin/">Rencontre de l&rsquo;Open Data à Grenoble le 5 juin</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2012/05/27/rencontre-de-lopen-data-a-grenoble-le-5-juin/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Data Is King !</title>
		<link>https://blog.sparna.fr/2012/05/18/data-is-king/</link>
		<comments>https://blog.sparna.fr/2012/05/18/data-is-king/#comments</comments>
		<pubDate>Fri, 18 May 2012 18:22:38 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[Open Data]]></category>
		<category><![CDATA[data]]></category>
		<category><![CDATA[data.gouv.fr]]></category>
		<category><![CDATA[rest]]></category>
		<category><![CDATA[schema.org]]></category>
		<category><![CDATA[seo]]></category>
		<category><![CDATA[soa]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=36</guid>
		<description><![CDATA[<p>&#171;&#160;Data Is King&#160;&#187; est un principe qui sous-tend plusieurs buzzwords du moment, et une réalité qui se retrouve à plusieurs échelles. C&#8217;est également un slogan permettant de situer et différencier toute cette partie de l&#8217;industrie informatique se centrant autour de la gestion de la donnée, par distinction avec les centrages sur le contenu (texte) ou&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2012/05/18/data-is-king/">Data Is King !</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;"><a href="http://blog.sparna.fr/wp-content/uploads/2012/05/DataIsKing.jpg"><img class="alignright size-medium wp-image-44" title="Data Is King" src="http://blog.sparna.fr/wp-content/uploads/2012/05/DataIsKing-300x177.jpg" alt="" width="300" height="177" /></a>&laquo;&nbsp;Data Is King&nbsp;&raquo; est un principe qui sous-tend plusieurs <em>buzzwords</em> du moment, et une réalité qui se retrouve à plusieurs échelles. C&rsquo;est également un slogan permettant de situer et différencier toute cette partie de l&rsquo;industrie informatique se centrant autour de la gestion de la donnée, par distinction avec les centrages sur le contenu (texte) ou les algorithmes.</p>
<h2 style="text-align: justify;">Les mouvements du &laquo;&nbsp;Data Is King&nbsp;&raquo;</h2>
<p style="text-align: justify;">Le principe &laquo;&nbsp;Data is King&nbsp;&raquo; sous-tend les mouvements suivants :<strong></strong></p>
<p style="text-align: justify;">L&rsquo;<strong><a class="zem_slink" title="Open data" href="http://en.wikipedia.org/wiki/Open_data" rel="wikipedia" target="_blank">Open Data</a></strong> : l&rsquo;ouverture des données (publiques avec <a href="http://data.gouv.fr">data.gouv.fr</a> ou privées) induit une structuration de l&rsquo;écosystème des acteurs en deux : <span class="pullquote">d&rsquo;un côté ceux qui produisent la donnée, de l&rsquo;autre côté ceux qui l&rsquo;utilisent</span> ou la réutilise (par une posture de neutralité nécessaire, le producteur de la donnée ne peut pas être celui qui illustre son utilisation dans une application, sous peine de perdre cette impartialité quant à la donnée). Cette structuration illustre parfaitement la notion de réutilisation des données dans plusieurs applications.<strong></strong></p>
<p style="text-align: justify;">Le<strong> Web de données</strong>, ou sémantique : la notion de web de données, tout en étant antérieure dans le temps à la notion d&rsquo;Open Data, en est en fait l&rsquo;aboutissement, la dernière marche au niveau qualitatif. Un peu comme si, se rendant compte que la barre du web sémantique avait été mise trop haut, les architectes du web avaient mis là une marche intermédiaire : publiez vos données d&rsquo;abord, peu importe le format. Pour ce qui est des aspects propres au web de données, à savoir l&rsquo;identification des concepts avec des URI et les relations avec d&rsquo;autres données, hé bien, on verra plus tard, une fois que cette marche aura été franchie. Sous cette problématique se retrouve là encore le &laquo;&nbsp;Data is King&nbsp;&raquo;, les promesses du web en plus : décentralisation, liens, accès par tous et partage par tous.</p>
<p style="text-align: justify;">Gestion du contenu et <strong><a class="zem_slink" title="Search engine optimization" href="http://en.wikipedia.org/wiki/Search_engine_optimization" rel="wikipedia" target="_blank">SEO</a>. </strong>Finit le SEO à base des quelques mots-clés mis au bon endroit dans la page. Depuis <a title="schema.org" href="http://schema.org" target="_blank">schema.org</a>, ce qu&rsquo;il faut pour &laquo;&nbsp;ranker&nbsp;&raquo;, ce sont des données structurées. La promesse de remonter dans les résultats de recherche va inciter les web agencies et les producteurs de contenu à publier leurs métadonnées, voire à produire lorsqu&rsquo;elles n&rsquo;y sont pas. On va pouvoir se passer de moteur de recherche dans les systèmes, se contenter de publier de la donnée structurée, et tout faire reposer sur Google pour l&rsquo;indexation.</p>
<p style="text-align: justify;">L&rsquo;autre buzzword du moment, <a class="zem_slink" title="Big data" href="http://en.wikipedia.org/wiki/Big_data" rel="wikipedia" target="_blank">Big Data</a>, n&rsquo;est pour moi pas lié à cette philosophie &laquo;&nbsp;Data Is King&nbsp;&raquo;. Le Big Data, c&rsquo;est d&rsquo;abord de gros algorithmes permettant de traiter beaucoup de données, l&rsquo;accent est plus mis sur l&rsquo;infrastructure, la performance, et la scalabilité, que sur les données elles-mêmes.</p>
<h2 style="text-align: justify;">Les échelles du &laquo;&nbsp;Data Is King&nbsp;&raquo;</h2>
<p style="text-align: justify;">Le principe &laquo;&nbsp;Data is King&nbsp;&raquo; se retrouve à plusieurs échelles. A l&rsquo;échelle des applications d&rsquo;abord, où l&rsquo;on va privilégier la modélisation claire des schémas de données, et &#8211; au minimum &#8211; <strong>s&rsquo;assurer que les données ne sont pas prisonnières des applications</strong>, voire privilégier dès le départ une politique d&rsquo;ouverture des données des applications. <span class="pullquote">On le voit avec un peu de recul, les applications passent, les données restent</span>, il est donc capital de faire en sorte que les données ne sont pas propres aux applications, qu&rsquo;elles peuvent être réutilisées dans d&rsquo;autres contextes. On ne développe plus des applications, on développe des données; d&rsquo;autres développeront les applications qui viendront tirer avantage de ses données. La donnée fait partie du capital de l&rsquo;entreprise, l&rsquo;application n&rsquo;en fait pas partie.</p>
<p style="text-align: justify;">A l&rsquo;échelle des <strong>architectures applicatives</strong> ensuite, où l&rsquo;on passe d&rsquo;architectures orientées services (<a class="zem_slink" title="Service-oriented architecture" href="http://en.wikipedia.org/wiki/Service-oriented_architecture" rel="wikipedia" target="_blank">SOA</a>) à des architectures orientées données, qu&rsquo;on pourrait appeler DOA par jeu d&rsquo;opposition. Cela est directement lié aux architectures <a href="http://fr.wikipedia.org/wiki/Representational_State_Transfer">REST</a>, mais va un peu au-delà, dans la mesure où REST, bien que nécessitant d&rsquo;identifier des ressources par des URIs, ne privilégie pas nécessairement les données sur le document. Il est plus facile de décentraliser les données et de centraliser les services que de décentraliser les services et de centraliser les données. La promesse d&rsquo;interopérabilité du SOA et de SOAP est d&rsquo;emblée dépassée par les architectures REST.</p>
<p style="text-align: justify;"><strong>A l&rsquo;échelle du web</strong> enfin, où l&rsquo;on est en train d&rsquo;ajouter au web des documents un web des données. Les liens de cette nouvelle couche de la toile ne se font plus de page à page, mais de données à données. Les données sont publiées, interreliées, interprétables par les machines, réutilisables.</p>
<p style="text-align: justify;">Vive le roi Data !</p>
<div class="zemanta-pixie" style="margin-top: 10px; height: 15px; text-align: justify;"><img class="zemanta-pixie-img" style="float: right;" src="http://img.zemanta.com/pixy.gif?x-id=cd2aba6d-f95e-4aa9-950e-472f31afa377" alt="" /></div>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2012/05/18/data-is-king/">Data Is King !</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2012/05/18/data-is-king/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
