<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sparna Blog &#187; archives</title>
	<atom:link href="https://blog.sparna.fr/tag/archives/feed/" rel="self" type="application/rss+xml" />
	<link>https://blog.sparna.fr</link>
	<description>Web de données &#124; Architecture de l&#039;information &#124; Accès aux connaissances</description>
	<lastBuildDate>Tue, 03 Jun 2025 10:30:27 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
	<item>
		<title>Retour sur &#8230; Le déploiement de Sparnatural pour FranceArchives</title>
		<link>https://blog.sparna.fr/2025/02/14/retour-sur-le-deploiement-de-sparnatural-pour-francearchives/</link>
		<comments>https://blog.sparna.fr/2025/02/14/retour-sur-le-deploiement-de-sparnatural-pour-francearchives/#comments</comments>
		<pubDate>Fri, 14 Feb 2025 17:35:50 +0000</pubDate>
		<dc:creator><![CDATA[Marie Muller]]></dc:creator>
				<category><![CDATA[Linked Data]]></category>
		<category><![CDATA[Non classé]]></category>
		<category><![CDATA[Ontologies]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[Recherche d'informations]]></category>
		<category><![CDATA[Sparnatural]]></category>
		<category><![CDATA[SPARQL]]></category>
		<category><![CDATA[Visualisation de données]]></category>
		<category><![CDATA[archives]]></category>
		<category><![CDATA[EAC]]></category>
		<category><![CDATA[EAD]]></category>
		<category><![CDATA[EAG]]></category>
		<category><![CDATA[RiC-O]]></category>
		<category><![CDATA[schema.org]]></category>

		<guid isPermaLink="false">https://blog.sparna.fr/?p=1860</guid>
		<description><![CDATA[<p>Voilà maintenant près d’un an et demi que FranceArchives, le Portail national des Archives de France, a annoncé le déploiement de l’outil « Supernatural » (comprendre Sparnatural) via ses réseaux, dans l’optique de proposer à ses usagers « un accès nouveau aux métadonnées archivistiques, complémentaire de la recherche classique par le moteur du portail ».&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2025/02/14/retour-sur-le-deploiement-de-sparnatural-pour-francearchives/">Retour sur &#8230; Le déploiement de Sparnatural pour FranceArchives</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<h1></h1>
<p><span style="font-weight: 400;">Voilà maintenant près d’un an et demi que FranceArchives, le Portail national des Archives de France, <a href="https://francearchives.gouv.fr/fr/requeteurnaturel">a annoncé le déploiement de l’outil « Supernatural »</a> (comprendre <u><a href="https://sparnatural.eu/">Sparnatural</a></u>) via ses réseaux, dans l’optique de proposer à ses usagers « <em>un accès nouveau aux métadonnées archivistiques, complémentaire de la recherche classique par le moteur du portail</em> ».</span></p>
<p><span style="font-weight: 400;"><a href="https://x.com/FranceArchives/status/1706286558385463319"><img class="aligncenter wp-image-1897 size-full" src="https://blog.sparna.fr/wp-content/uploads/2025/02/Supernatural-e1739532443130.jpg" alt="Supernatural" width="400" height="392" /></a></span></p>
<p><span style="font-weight: 400;">Porté par le Service interministériel des Archives de France, le portail FranceArchives offre une recherche fédérée dans près de 26 millions de métadonnées archivistiques produites par près de 170 institutions et entièrement sémantisées en RDF par le biais de l&rsquo;ontologie RiC-O version 0.2 publiée en février 2021.</span></p>
<p>C’est une des premières utilisations de RiC-O à grande échelle (même s’il faudra à l’avenir qu’il se mette à jour sur la <u><a href="https://www.ica.org/resource/records-in-contexts-ontology/">version 1.0 de RiC-O publiée depuis</a></u> !), et c’est également l&rsquo;un des premiers entrepôts de données archivistiques de cette taille sur le Linked Open Data.</p>
<p><span style="font-weight: 400;">&#8230; Un graphe de données qui a tout pour être « Supernaturalisé » <img src="https://blog.sparna.fr/wp-includes/images/smilies/simple-smile.png" alt=":)" class="wp-smiley" style="height: 1em; max-height: 1em;" /></span></p>
<h2><b><i>Des données de qualité à une recherche augmentée</i></b></h2>
<p><span style="font-weight: 400;">&#8230; Enfin, il va surtout s’agir de ses « données de qualité », autrement dit les :</span></p>
<ul>
<li style="font-weight: 400;"><span style="font-weight: 400;">inventaires avec leurs composants,</span></li>
<li style="font-weight: 400;"><span style="font-weight: 400;">notices descriptives de producteurs d’archives,</span></li>
<li style="font-weight: 400;"><span style="font-weight: 400;">fiches signalétiques des services d’archives,</span></li>
</ul>
<p><span style="font-weight: 400;"> </span><span style="font-weight: 400;">… tous objets liés à une autorité « </span><a href="https://francearchives.gouv.fr/fr/agents"><span style="font-weight: 400;">personnes et institutions</span></a><span style="font-weight: 400;"> »</span><span style="font-weight: 400;">, </span><span style="font-weight: 400;">« </span><a href="https://francearchives.gouv.fr/fr/locations"><span style="font-weight: 400;">lieux</span></a><span style="font-weight: 400;"> »</span><span style="font-weight: 400;"> et </span><span style="font-weight: 400;">« </span><a href="https://francearchives.gouv.fr/fr/subjects"><span style="font-weight: 400;">thèmes</span></a><span style="font-weight: 400;"> » de qualité (soit moins de 5% des métadonnées du portail avant conversion&#8230; et plus de 70% de l’ensemble du réservoir en RDF !</span><span style="font-weight: 400;">), autorités de qualité elles-mêmes</span><a href="https://francearchives.gouv.fr/fr/article/213604642"> <span style="font-weight: 400;">harmonisées et alignées vers des référentiels nationaux et internationaux</span></a><span style="font-weight: 400;">.</span></p>
<p><span style="font-weight: 400;">M</span><span style="font-weight: 400;">odèle particulièrement adapté à la description des archives en RDF</span><span style="font-weight: 400;">, c’est l’ontologie </span><span style="font-weight: 400;">RiC-O (v0.2</span><span style="font-weight: 400;">) qui a été utilisée pour la sémantisation des données </span><span style="font-weight: 400;">XML EAD</span><span style="font-weight: 400;"> &#8211; </span><span style="font-weight: 400;">XML EAC-CPF</span><span style="font-weight: 400;"> vers RDF, complétée de</span><a href="https://schema.org/"> <span style="font-weight: 400;">schema.org</span></a><span style="font-weight: 400;"> pour les fiches signalétiques des services de l’annuaire au format </span><span style="font-weight: 400;">XML EAG</span><span style="font-weight: 400;">.</span></p>
<p><span style="font-weight: 400;">Les informations relatives aux archives et à leurs producteurs étant décrites dans des fichiers différents, la recherche avancée via SPARQL rend désormais possible une interrogation fédérée plus fine d’un vaste corpus de notices en « traversant » le graphe structuré selon le modèle RiC-O. </span><span style="font-weight: 400;">En effet, l’intérêt de l’interrogation via SPARQL est de casser les silos entre types de métadonnées : il permet de faire une recherche transversale entre données provenant de fichiers EAD et de fichier EAC-CPF.</span></p>
<p>Les notices affichées en résultats de recherche montrent les alignements existants vers les notices de producteurs externes, Wikidata, data.bnf, GeoNames ou encore le Thesaurus pour l&rsquo;indexation matières des archives locales. C’est ainsi dans l’onglet Personnes/indexations liées que sont exploités les résultats de la conversion en RDF, par le biais de suggestions de recherches complémentaires sur le portail classique.</p>
<p>Une façon de faire bénéficier le grand public du RDF de manière complètement transparente pour lui !</p>
<p><a href="https://blog.sparna.fr/wp-content/uploads/2025/02/VictorHugo.jpg"><img class="aligncenter size-large wp-image-1904" src="https://blog.sparna.fr/wp-content/uploads/2025/02/VictorHugo-1024x547.jpg" alt="VictorHugo" width="650" height="347" /></a></p>
<h2><b><i>Quelques exemples de requêtes&#8230;</i></b></h2>
<p><span style="font-weight: 400;">On accède à l’outil via le menu « Recherche SPARQL » <a href="https://francearchives.gouv.fr/fr/requeteurnaturel">en haut à droite du site du portail</a> :</span></p>
<p><span style="font-weight: 400;"> <a href="https://blog.sparna.fr/wp-content/uploads/2025/02/QueriesFA.jpg"><img class="aligncenter size-large wp-image-1905" src="https://blog.sparna.fr/wp-content/uploads/2025/02/QueriesFA-1024x504.jpg" alt="QueriesFA" width="650" height="320" /></a></span></p>
<p><span style="font-weight: 400;">Plusieurs exemples de requêtes sont à disposition pour explorer les données :</span></p>
<p><span style="font-weight: 400;">De la requête la plus simple :</span></p>
<h5><em><b>Personne est membre de Institution</b></em></h5>
<p><a href="https://blog.sparna.fr/wp-content/uploads/2025/02/SampleFA.jpg"><img class="aligncenter size-large wp-image-1906" src="https://blog.sparna.fr/wp-content/uploads/2025/02/SampleFA-1024x422.jpg" alt="SampleFA" width="650" height="268" /></a></p>
<p><span style="font-weight: 400;"> </span><span style="font-weight: 400;"> </span></p>
<p><img class="aligncenter size-large wp-image-1928" src="https://blog.sparna.fr/wp-content/uploads/2025/02/query11-1024x375.jpg" alt="query1" width="650" height="238" /></p>
<p><span style="font-weight: 400;">À des requêtes de plus en plus élaborées et complexes, comme ici :</span></p>
<h5><em><b>Lieux qui sont le sujet des archives reliées au fonds « Fabrique de berlingot Eysséric »</b></em></h5>
<p><span style="font-weight: 400;"> <a href="https://blog.sparna.fr/wp-content/uploads/2025/02/SampleFA2.jpg"><img class="aligncenter size-large wp-image-1907" src="https://blog.sparna.fr/wp-content/uploads/2025/02/SampleFA2-1024x717.jpg" alt="SampleFA2" width="650" height="455" /></a></span></p>
<p><span style="font-weight: 400;"> <a href="https://blog.sparna.fr/wp-content/uploads/2025/02/query2.jpg"><img class="aligncenter size-large wp-image-1929" src="https://blog.sparna.fr/wp-content/uploads/2025/02/query2-1024x461.jpg" alt="query2" width="650" height="293" /></a></span></p>
<p><span style="font-weight: 400;">Où l’on voit que l’on peut retracer le cheminement de la requête à travers le graphe de l’ontologie RiC-O en cliquant sur </span><i><span style="font-weight: 400;">« </span></i><i><span style="font-weight: 400;">Afficher/masquer l’éditeur SPARQL</span></i><span style="font-weight: 400;"> ».</span></p>
<h2><b><i>Des archives à la page…</i></b></h2>
<p><span style="font-weight: 400;">À noter que le projet, qui avait fait l’objet d’une présentation à l’occasion de</span><a href="https://swib.org/swib23/slides/07_Fabien%20Amarger_Slides.pdf"> <span style="font-weight: 400;">SWIB (</span><span style="font-weight: 400;">Semantic Web in Libraries</span><span style="font-weight: 400;">)</span></a><span style="font-weight: 400;"> et de</span><a href="https://web.archive.org/web/20240715083647/https://semweb.pro/conference/2023/presentation/francearchives-portail-de-reference-pour-les-archives-francaises/"> <span style="font-weight: 400;">SemWebPro 2023</span></a><span style="font-weight: 400;"> a été entièrement déployé (et configuré !) à partir de la documentation disponible sur le site web de Sparnatural.</span></p>
<p><span style="font-weight: 400;">N’hésitez pas à aller la consulter !</span></p>
<p><a href="https://docs.sparnatural.eu/hello-sparnatural/Hello-Sparnatural.html"><span style="font-weight: 400;">Hello Sparnatural</span></a></p>
<p><a href="https://docs.sparnatural.eu/how-to-configure-shacl/How-to-configure-Sparnatural-shacl.html"><span style="font-weight: 400;">How-to configure in SHACL</span></a></p>
<p><a href="https://docs.sparnatural.eu/widgets.html"><span style="font-weight: 400;">Reference documentation of Sparnatural widgets</span></a></p>
<h2><strong>Pour aller plus loin sur la sémantisation des archives…</strong></h2>
<p>Le déploiement de Sparnatural sur FranceArchives fait suite à une autre réalisation de l&rsquo;année précédente, le <a href="https://sparna-git.github.io/sparnatural-demonstrateur-an/">démonstrateur Sparnatural des Archives nationales</a>. Celui-ci avait permis de faire évoluer Sparnatural et de le déployer sur un graphe sémantique en RiC-O de 20 millions de triplets (hors inférence), alimenté avec le contenu de 1577 instruments de recherche décrivant les archives de 40 des 122 études notariales de Paris conservées aux Archives nationales, de 1120 notices décrivant ces études et les notaires qui y ont exercé, et d&rsquo;autres référentiels des Archives nationales notamment sur les lieux de Paris. La réalisation de ce démonstrateur a été <a href="https://sparna-git.github.io/sparnatural-demonstrateur-an/presentation-fr.html">entièrement documentée en français</a> et en <a href="https://sparna-git.github.io/sparnatural-demonstrateur-an/presentation-en.html">anglais</a>. Ce démonstrateur et ses interfaces évolueront d&rsquo;ailleurs bientôt.</p>
<p>Depuis, Sparna s&rsquo;est impliqué dans le domaine de la sémantisation des archives puisque nous développons également, pour les comptes des Archives Nationales, l’outil <u><a href="https://github.com/ArchivesNationalesFR/rico-converter">Ric-O converter</a></u>.</p>
<p>Celui-ci permet la conversion de notices EAD et EAC vers du RDF exprimé en RiC-O. Nous finalisons actuellement une nouvelle version du convertisseur pour le rendre compatible RiC-O 1.0 (et même 1.1 dont la sortie est imminente).</p>
<p><a href="https://blog.sparna.fr/2020/04/20/rico-records-in-contexts-archives-modele-conceptuel/">Un nouvel article à paraître ici sur RiC-O ?</a> &#8230; Stay tuned !</p>
<p>&nbsp;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2025/02/14/retour-sur-le-deploiement-de-sparnatural-pour-francearchives/">Retour sur &#8230; Le déploiement de Sparnatural pour FranceArchives</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2025/02/14/retour-sur-le-deploiement-de-sparnatural-pour-francearchives/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>RiC-CM, RiC-O : les Archives se dotent de leur modèle conceptuel (Records in Contexts)</title>
		<link>https://blog.sparna.fr/2020/04/20/rico-records-in-contexts-archives-modele-conceptuel/</link>
		<comments>https://blog.sparna.fr/2020/04/20/rico-records-in-contexts-archives-modele-conceptuel/#comments</comments>
		<pubDate>Mon, 20 Apr 2020 14:33:13 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Ontologies]]></category>
		<category><![CDATA[Recherche d'informations]]></category>
		<category><![CDATA[archives]]></category>
		<category><![CDATA[Records In Contexts]]></category>
		<category><![CDATA[RiC-CM]]></category>
		<category><![CDATA[RiC-O]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=1274</guid>
		<description><![CDATA[<p>Records In Contexts, ou RiC pour les intimes, est disponible depuis peu en 2 variantes sur le site du Conseil International des Archives : RiC-CM, le modèle conceptuel, et RiC-O, son implémentation sous forme d&#8217;ontologie OWL (dont une bonne introduction est donnée sur la page de l&#8217;ontologie elle-même à https://www.ica.org/standards/RiC/ontology). Ce modèle conceptuel a été&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2020/04/20/rico-records-in-contexts-archives-modele-conceptuel/">RiC-CM, RiC-O : les Archives se dotent de leur modèle conceptuel (Records in Contexts)</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p><strong>Records In Contexts</strong>, ou RiC pour les intimes, est disponible depuis peu en 2 variantes sur le site du Conseil International des Archives : <a href="https://www.ica.org/fr/egad-ric-conceptual-model"><strong>RiC-CM</strong>, le modèle conceptuel</a>, et <a href="https://www.ica.org/fr/egad-ric-ontology"><strong>RiC-O</strong>, son implémentation sous forme d&rsquo;ontologie OWL</a> (dont une bonne introduction est donnée sur la page de l&rsquo;ontologie elle-même à <a href="https://www.ica.org/standards/RiC/ontology">https://www.ica.org/standards/RiC/ontology</a>). Ce modèle conceptuel a été élaboré au sein du groupe <a href="https://www.ica.org/fr/groupes-dexperts/groupe-d-experts-sur-la-description-archivistique-egad">EGAD</a> (Expert Group on Archival Description) du CIA, créé fin 2012. Il succède, et donc vise à unifier et à remplacer, les normes actuelles que sont l&rsquo;ISAD-G, l&rsquo;ISAAR(CPF), l&rsquo;ISDF et l&rsquo;ISDIAH. Une bonne perspective de contexte historique est donné dans le document <em>&laquo;&nbsp;<a href="https://www.ica.org/sites/default/files/EGAD_French.pdf">Toward an International Conceptual Model for Archival Description: A Preliminary Report from the International Council on Archives</a>&laquo;&nbsp;</em> publié peu après le début des travaux de l&rsquo;EGAD.</p>
<p>Les sources de l&rsquo;ontologie RiC-O sont dans Github à <a href="https://github.com/ICA-EGAD/RiC-O"><strong>https://github.com/ICA-EGAD/RiC-O</strong></a>.</p>
<h2>4 entités au coeur de RiC-CM</h2>
<p>RiC-CM défini 4 entités &laquo;&nbsp;noyaux&nbsp;&raquo; du modèle conceptuel : la <strong><a href="https://www.ica.org/standards/RiC/ontology#RecordResource">Record Resource</a></strong>, ses <strong><a href="https://www.ica.org/standards/RiC/ontology#Instantiation">Instantiations</a></strong>, des <strong><a href="https://www.ica.org/standards/RiC/ontology#Agent">Agents</a></strong> et des <strong><a href="https://www.ica.org/standards/RiC/ontology#Activity">Activités</a></strong>. La <em>RecordResource</em> est une description intellectuelle qui peut avoir plusieurs matérialités (typiquement document original vs. numérisation), ses <em>Instantiations</em>. Une &laquo;&nbsp;Record Resource&nbsp;&raquo; peut se préciser soit en <strong><a href="https://www.ica.org/standards/RiC/ontology#RecordSet">Record Set</a></strong> (ensemble de notices), en <strong><a href="https://www.ica.org/standards/RiC/ontology#Record">Record</a></strong> (notice seule) ou en <strong><a href="https://www.ica.org/standards/RiC/ontology#RecordPart">Record Part</a></strong> (partie de notice), la frontière entre ces 3 notions n&rsquo;étant pas toujours facile.</p>
<p>Sous la notion générique d&rsquo;Agent, RiC-CM déclare les 3 types d&rsquo;agents archivistiques classiques <strong>Person</strong>, <strong>Family</strong> et <strong>Corporate Body</strong>, mais introduit également comme des Agents les &laquo;&nbsp;<strong>Position</strong>s&nbsp;&raquo; (Fonctions dans un organigramme) et les &laquo;&nbsp;<strong>Mechanism</strong>s&nbsp;&raquo; (typiquement les logiciels), qui peuvent donc être utilisés dans une relation de Provenance.</p>
<p>Ces 4 entités &laquo;&nbsp;noyaux&nbsp;&raquo; sont complétées par la notion de <strong>Rule</strong> (règle, loi, normes, <em>&laquo;&nbsp;contexts that establish the conditions for the performance of the activities&nbsp;&raquo;</em>) et les entités classiques de Date et Place.</p>
<p>Le modèle conceptuel RiC-CM défini un ensemble de <strong>78 relations</strong> majoritairement entre les 4 entités noyaux du modèle, et c&rsquo;est là que la notion de Contexte<span style="text-decoration: underline;">s</span> (au pluriel) prends tout son sens :</p>
<ol>
<li>Relations <strong>Partitives tout/partie</strong> : Record <em>has consituent</em> Record Part, Event <em>has subevent</em> Event, Group <em>has subdivision</em> Group, etc&#8230;</li>
<li>Relations <strong>Séquentielles avant/après</strong> : Record <em>is original of</em> Record, Instantiation <em>has derived instantiation</em> Instantiation, Agent <em>is antecedent of</em> Agent, etc..</li>
<li>Relations de <strong>Sujet</strong> : Record Resource <em>has subject</em> Thing ou Record Resource <em>describes</em> Thing, etc.</li>
<li>Relations <strong>inter-Record Resource</strong> : Record Resource <em>has copy</em> Record Resource, Record Set <em>includes</em> Record, etc.</li>
<li>Relations <strong>de Record Resource à Instantiation</strong> : Record Resource <em>has instantiation</em> Instantiation, etc.</li>
<li>Relations de <strong>Provenance (Record Resource à Agent)</strong> : Record Resource <em>created by</em> Agent, etc.</li>
<li>Relations <strong>inter-Instantiations</strong>, typiquement Instantiation <em>has derived instantiation</em> Instantiation (cas de la copie numérique d&rsquo;un orginal), etc.</li>
<li>Relations de <strong>Management</strong> : Group or Person or Position <em>is owner of</em> Thing, Agent <em>controls</em> Agent, etc.</li>
<li>Relations <strong>inter-Agent</strong> : Person <em>is leader of</em> Group, Person <em>has child</em> Person, Person <em>occupies</em> Position, Person <em>knows</em> Person, etc.</li>
<li>Relations <strong>des Events/Activities</strong>, typiquement Activity <em>performed by</em> Agent</li>
<li>Relations <strong>des Rules</strong> : Rule <em>regulates</em> Thing, Mandate <em>authorizes</em> Agent, etc.</li>
<li>Relations de <strong>Datation</strong></li>
<li>Relations <strong>Spatiales</strong></li>
</ol>
<p>Ce diagramme (tiré de <a href="https://f.hypotheses.org/wp-content/blogs.dir/2167/files/2020/02/20200128_2_RecordsInContexts.pdf">cette présentation de RiC-CM aux Archives Nationales</a> et du <a href="https://github.com/ICA-EGAD/RiC-O/tree/master/diagrams/RiC-CM-overview">code source de RiC-O dans Github</a>) donne l&rsquo;aperçu haut-niveau de RiC-CM et des relations qui articulent les entités de haut-niveau du modèle :</p>
<div id="attachment_1286" style="width: 660px" class="wp-caption aligncenter"><a href="http://blog.sparna.fr/wp-content/uploads/2020/02/RiC-CM-02-overview-diagram.png" target="_blank"><img class="wp-image-1286 size-large" src="http://blog.sparna.fr/wp-content/uploads/2020/02/RiC-CM-02-overview-diagram-1024x774.png" alt="RiC-CM-02-overview-diagram" width="650" height="491" /></a><p class="wp-caption-text">Diagramme haut-niveau du Modèle Conceptuel Records in Contexts 0.2</p></div>
<h2>RiC dans la famille des modèles conceptuels</h2>
<p>RiC s&rsquo;inscrit dans la famille des modèles conceptuels développés depuis 3 décennies dans le domaine de l&rsquo;infodoc : <strong><a href="https://www.ifla.org/publications/functional-requirements-for-bibliographic-records">FRBR</a></strong> en 1992-1995 pour les notices bibliographiques des bibliothèques, puis le <strong><a href="http://www.cidoc-crm.org/">CIDOC-CRM</a></strong> à partir de 1996 pour la description des objets muséaux et patrimoniaux en général, puis l&rsquo;intégration de FRBR dans le CIDOC-CRM, à partir de 2003, qui donnera naissance à <strong><a href="http://www.cidoc-crm.org/frbroo/home-0">FRBRoo</a></strong> en 2008. Et plus récemment, en 2017, <a href="https://www.ifla.org/publications/node/11412"><strong>IFLA-LRM</strong></a> qui consolide les modèles de la famille FRBR.</p>
<p>On notera la temporalité longue pour l&rsquo;élaboration de ces standards internationaux : réunions internationales, disponibilité des participants, nécessaires discussions longues sur l&rsquo;identification des concepts fondamentaux du métier. On notera aussi le retard de la communauté des archives, avec le début du groupe EGAD en 2012 et la version 0.1 de RiC-CM publiée en 2016, sur cette réflexion au niveau conceptuel, par rapport aux bibliothèques et aux musées. Cela peut s&rsquo;expliquer par la présence d&rsquo;un standard technique unique et utilisé mondialement, l&rsquo;EAD, et par des moyens plus réduits dans la communauté archivistique.</p>
<p>La communauté du CIDOC-CRM <a href="http://lists.ics.forth.gr/pipermail/crm-sig/2020-January/004203.html">s&rsquo;est empressé de dénoncer la &laquo;&nbsp;secte des archivistes&nbsp;&raquo;</a> qui réinventent leur propre modèle conceptuel plutôt que de s&rsquo;appuyer sur les fondations théoriques du CIDOC-CRM. Mais cette phase de réflexion où sont réexaminés l&rsquo;existence, le périmètre, la pertinence et l&rsquo;articulation de de chaque concept métier est bien nécessaire à une communauté de pratique avant que celle-ci ne puisse proposer un éventuel accostage avec le point de vue &#8211; certes générique et théoriquement fondé, mais issu d&rsquo;une autre communauté de pratiques &#8211; du CIDOC-CRM. Le document &laquo;&nbsp;Toward an International Conceptual Model for Archival Description&#8230;&nbsp;&raquo; mentionné plus haut mentionne déjà cela :</p>
<p><em>&laquo;&nbsp;Avant de collaborer, la communauté archivistique doit développer un modèle conceptuel qui réponde d&rsquo;abord et avant tout aux principes et aux besoins des archivistes. Une fois ce modèle élaboré, la communauté sera bien placée pour se joindre aux communautés professionnelles apparentées dans une quête commune pour fournir un accès intégré à l&rsquo;expression humaine sous toutes ses formes.&nbsp;&raquo;</em></p>
<p>Quelques années de patience, donc, avant une intégration RiC-CM / CIDOC-CRM  (RiCoo ? <img src="https://blog.sparna.fr/wp-includes/images/smilies/simple-smile.png" alt=":-)" class="wp-smiley" style="height: 1em; max-height: 1em;" /> )</p>
<h2>Ricoconverter : Un convertisseur EAD et EAC vers RiC-O, par les Archives Nationales</h2>
<p>Florence Clavaud, responsable de la mission Référentiels aux Archives Nationales, a largement développé l&rsquo;ontologie RiC-O <a href="https://www.ica.org/en/egad-steering-committee-0">au sein du groupe EGAD</a>. Sous son impulsion avait déjà été développé en 2017-2018 le <a href="http://piaaf.demo.logilab.fr/">prototype PIAFF</a> (Pilote d’interopérabilité pour les Autorités Archivistiques françaises), incluant 276 notices d&rsquo;autorités des AN, de la BNF et du SIAFF, converties dans la première version de RiC-CM et RiC-O qui datait de 2016.</p>
<p>Les Archives Nationales ont souhaité un passage à l&rsquo;échelle après le succès de PIAFF, pour la conversion de l&rsquo;intégralité des <strong>28000 instruments de recherche et 15000 notices d&rsquo;autorité</strong> des Archives Nationales, dans la version la plus récente de RiC-O. Le travail a été confié à votre serviteur. Le résultat est <a href="https://github.com/ArchivesNationalesFR/rico-converter"><strong>ricoconverter</strong></a>, un logiciel opensource, permettant de lancer simplement en ligne de commande une conversion d&rsquo;un ensemble de fichiers EAD ou EAC vers du RDF/XML structuré en RiC-O. Ricoconverter est essentiellement basé sur 2 feuilles de style XSLT qui font l&rsquo;essentiel du travail, enrobées dans un script Java. La feuille de style convertissant l&rsquo;EAC est assez générique et transposable dans d&rsquo;autres contextes probablement assez directement, la feuille de style EAD répond à l&rsquo;implémentation spécifique de l&rsquo;EAD aux AN et demandera plus d&rsquo;adaptions; mais l&rsquo;objectif de Ricoconverter est bel et bien de <strong>pouvoir être adapté et utilisé pas d&rsquo;autres services d&rsquo;archives pour produire des graphes de données RiC-O</strong>.</p>
<p>Les sources de ricoconverter sont disponibles dans Github à <a href="https://github.com/ArchivesNationalesFR/rico-converter">https://github.com/ArchivesNationalesFR/rico-converter</a>.</p>
<p>Cerise sur le gâteau, quand on a un joli graphe RiC-O, on peut avoir un joli <a href="https://github.com/sparna-git/Sparnatural/">Sparnatural</a> (voir <a href="http://blog.sparna.fr/2019/06/13/sparnatural-ecrire-des-requetes-sparql-tout-naturellement/">ce billet de blog</a>) qui permet de naviguer dans le graphe et de chercher par exemple <em>&laquo;&nbsp;toutes les archives numérisées des organisations ayant succédé à la Direction des Beaux Arts (1848-1852)</em>&nbsp;&raquo; (cliquer sur l&rsquo;image pour voir le screencast) :</p>
<h2><a href="http://blog.sparna.fr/wp-content/uploads/2020/02/Peek-18-02-2020-15-35.gif"><img class="aligncenter wp-image-1282 size-large" src="http://blog.sparna.fr/wp-content/uploads/2020/02/Peek-18-02-2020-15-35-1024x483.gif" alt="sparnatural-demo-rico" width="650" height="307" /></a>Présentations de RiC-CM et RiC-O aux Archives Nationales le 28/01/2020</h2>
<p>Pour aller plus loin on peut consulter <a href="https://labarchiv.hypotheses.org/1495">les présentations sur RiC-CM, RiC-O, ricoconverter et plus encore</a> faites lors de la journée d&rsquo;étude du 28 janvier 2020 aux Archives Nationales.</p>
<p><em>Illustration : <a href="https://gallica.bnf.fr/ark:/12148/btv1b530807279/f1.item"><span id="documentAuthorText">Institut, [salle des] archives : [photographie de presse] / [Agence Rol] Agence Rol. Agence photographique</span></a> depuis Gallica.</em></p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2020/04/20/rico-records-in-contexts-archives-modele-conceptuel/">RiC-CM, RiC-O : les Archives se dotent de leur modèle conceptuel (Records in Contexts)</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2020/04/20/rico-records-in-contexts-archives-modele-conceptuel/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Penser, modéliser (pour le web de données) &#8211; 2/2</title>
		<link>https://blog.sparna.fr/2014/05/26/penser-modeliser-web-de-donnees-2/</link>
		<comments>https://blog.sparna.fr/2014/05/26/penser-modeliser-web-de-donnees-2/#comments</comments>
		<pubDate>Mon, 26 May 2014 11:36:09 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Ontologies]]></category>
		<category><![CDATA[OWL]]></category>
		<category><![CDATA[archives]]></category>
		<category><![CDATA[modèle]]></category>
		<category><![CDATA[modélisation]]></category>
		<category><![CDATA[ontologie]]></category>
		<category><![CDATA[thesaurus]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=579</guid>
		<description><![CDATA[<p>Je donnais précédemment quelques retours d&#8217;expérience sur la création d&#8217;une ontologie OWL de description des fonds d&#8217;archives, initiée par la société Anaphore. Je voulais ici mettre en avant quelques points précis de ce modèle, quelques-uns des choix de modélisation qui ont été faits pour répondre à certaines questions que nous nous sommes posées, et qui&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2014/05/26/penser-modeliser-web-de-donnees-2/">Penser, modéliser (pour le web de données) &#8211; 2/2</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">Je donnais précédemment <a title="Penser, modéliser (pour le web de données) (1/2)" href="http://blog.sparna.fr/penser-modeliser-web-de-donnees-1/">quelques retours d&rsquo;expérience sur la création d&rsquo;une ontologie OWL de description des fonds d&rsquo;archives</a>, initiée par la société <a href="http://anaphore.eu/">Anaphore</a>. Je voulais ici mettre en avant quelques points précis de ce modèle, quelques-uns des choix de modélisation qui ont été faits pour répondre à certaines questions que nous nous sommes posées, et qui peuvent se retrouver dans d&rsquo;autres cas. Pour ceux qui s&rsquo;intéresseraient plus largement aux motifs de conception en OWL (&laquo;&nbsp;ontology design patterns&nbsp;&raquo;), je renvoie au site <a href="http://ontologydesignpatterns.org" target="_blank">ontologydesignpatterns.org</a> (dont je dois admettre que je ne me sers pas moi-même).</p>
<p><span id="more-712"></span></p>
<hr />
<h2>Réutiliser d&rsquo;autres vocabulaires/modèles</h2>
<p style="text-align: justify;">Le web de données permet de partager et relier des données sur le web, et il permet également de partager et relier des <em>modèles</em> de données. Réutiliser un modèle déjà existant pour exprimer ses données permet 1/ de bénéficier de la réflexion et des bonnes pratiques de modélisation qui ont sédimenté dans ce modèle et 2/ de rendre les données ainsi exprimées plus facilement compréhensibles et compatibles avec d&rsquo;autres applications.</p>
<p style="text-align: justify;">Il est donc tout à fait possible pour modéliser son domaine de &laquo;&nbsp;faire son marché&nbsp;&raquo; parmi les modèles déjà publiés, par exemple en parcourant l&rsquo;<a href="http://lov.okfn.org" target="_blank">annuaire du LOV (Linked Open Vocabularies)</a>. Trois modèles notamment sont réutilisables presque à tous les coups : <a href="http://lov.okfn.org/dataset/lov/details/vocabulary_foaf.html" target="_blank">FOAF</a> pour décrire des personnes, des organisations et des documents, <a href="http://lov.okfn.org/dataset/lov/details/vocabulary_dcterms.html" target="_blank">DCTerms</a> pour des métadonnées qui s&rsquo;appliquent largement (&laquo;&nbsp;creator&nbsp;&raquo;, &laquo;&nbsp;subject&nbsp;&raquo;, &laquo;&nbsp;publisher&nbsp;&raquo;, etc.), et <a href="http://lov.okfn.org/dataset/lov/details/vocabulary_skos.html" target="_blank">SKOS</a> (dont je re-mentionne au passage <a title="Traduction française de SKOS" href="http://blog.sparna.fr/traduction-francaise-skos/" target="_blank">la traduction française</a>) pour tout ce qui est liste contrôlée. Ces 3 vocabulaires sont d&rsquo;ailleurs <a href="http://lov.okfn.org/dataset/lov/stats/" target="_blank">les plus réutilisés dans l&rsquo;écosystème des modèles du web de données</a>.</p>
<p style="text-align: justify;">Outre ces 3 vocabulaires, nous avons également pour le modèle de description des fonds d&rsquo;archives réutilisé <a title="OWL Time" href="http://www.w3.org/TR/owl-time/" target="_blank">OWL Time</a> pour la représentation des dates et des intervalles temporels, <a title="wgs84" href="http://www.w3.org/2003/01/geo/wgs84_pos" target="_blank">wgs84_pos</a> pour l&rsquo;expression des latitudes/longitudes, et une seule propriété de <a title="Provenance ontology" href="http://www.w3.org/TR/prov-o/" target="_blank">PROV-O</a>, le modèle de description de la provenance récemment recommandé par le W3C (voir plus bas).</p>
<hr />
<h2>Qualifier les propriétés</h2>
<p style="text-align: justify;">Si vous lisez ceci je ne vous apprendrai rien en disant que RDF est un modèle de triplets, sujet-prédicat-objet (dans le cas contraire, voir <a href="http://fr.slideshare.net/thomasfrancart/rdf-une-introduction" target="_blank">cette introduction</a>). Donc en RDF on dit : &laquo;&nbsp;L&rsquo;entreprise Lafarge (sujet) possède un siège social (prédicat) en France (objet)&nbsp;&raquo;. Le problème, dans les descriptions archivistiques, c&rsquo;est que les entités sont décrites, par définition, au passé. Et que, dans le passé, il s&rsquo;en est passé des choses, justement, et que les informations relatives à une entité ont évolué. Il faut donc être capable, pour toutes les informations composant la description d&rsquo;une entité (nom, siège social, liens avec d&rsquo;autres entités&#8230;), de les qualifier avec des dates de validité (et pourquoi pas également des lieux de validité). C&rsquo;est-à-dire qu&rsquo;au lieu de dire &laquo;&nbsp;Lafarge possède un siège social en France&nbsp;&raquo;, on dit &laquo;&nbsp;Lafarge entretient une relation de siège social avec la France, relation qui était valable jusqu&rsquo;en avril 2014&Prime; (le cimentier Français ayant décidé de <a href="http://www.slate.fr/story/86137/siege-social-exil" target="_blank">déplacer son siège social en Suisse après sa fusion avec Holcim</a>).</p>
<p style="text-align: justify;">On dit qu&rsquo;on <em>réifie</em> la relation, on la transforme en ressource à part entière pour pouvoir exprimer des choses dessus. Autant dire que cela complexifie nettement le modèle. Mais c&rsquo;est le prix à payer pour structurer ces informations complexes. Dans la syntaxe RDF <a href="http://www.w3.org/TR/2014/REC-turtle-20140225/" target="_blank">Turtle</a>, on passe, sans qualification de dates, de :</p>
<pre>ex:Lafarge mdfa:pays ex:France .</pre>
<p>à ceci, avec une date de validité exprimée à la fois comme date structurée (&laquo;&nbsp;2014-04-11&Prime;) et à la fois comme chaine de caractères (&laquo;&nbsp;jusqu&rsquo;en avril 2014&Prime;) :</p>
<pre>ex:Lafarge mdfa:pays _:b .
_:b rdf:type mdfa:RelationLieu .
_:b mdfa:lieu ex:France .
_:b mdfa:dateValidite _:c .
_:c time:hasEnd _:d .
_:c rdfs:label "jusqu'en avril 2014" .
_:d time:inXSDDateTime "2014-04-11"^^xsd:date .</pre>
<p>Ou, en notation Turtle abbréviée :</p>
<pre>ex:Lafarge mdfa:pays [
  rdf:type mdfa:RelationLieu ;
  mdfa:lieu ex:France ;
  mdfa:dateValidite [
    time:hasEnd [ 
      time:inXSDDateTime "2014-04-11"^^xsd:date ;
    ] ;
  ] ;
  rdfs:label "jusqu'en avril 2014";
]</pre>
<hr />
<h2>Prendre en compte les valeurs textuelles</h2>
<p style="text-align: justify;">J&rsquo;espère qu&rsquo;aucun archiviste qui lit ceci ne sera vexé si je dis que les descriptions d&rsquo;archives actuelles ne sont pas très structurées. J&rsquo;entends par là que, de ce que j&rsquo;ai pu en voir, le contenu des descriptions est essentiellement textuel, et que peu de listes contrôlées ou de thesaurus sont utilisés pour structurer les valeurs que l&rsquo;on renseigne dans les différents champs de la description. D&rsquo;autre part, par la force des choses, certains éléments d&rsquo;information sont manquants, ou imprécis, et il peut être difficile ou impossible de leur donner une valeur contrôlée. Quelques exemples :</p>
<ul style="text-align: justify;">
<li>Pour indiquer la plage de date couverte par un fonds d&rsquo;archives : &laquo;&nbsp;1923-1932, 1936-1945 (manque 1933 à 1935)&nbsp;&raquo; (tiré de la norme <a href="http://www.icacds.org.uk/fr/ISAD%28G%29.pdf" target="_blank">ISAD(G)</a>);</li>
<li>Pour indiquer la modalité d&rsquo;entrée d&rsquo;un fonds aux services d&rsquo;archives : &laquo;&nbsp;Don de la Société ardoisière de l&rsquo;Anjou (exploitation de Renazé) aux Archives départementales de la Mayenne, 1969&Prime; (tiré de la norme <a href="http://www.icacds.org.uk/fr/ISAD%28G%29.pdf" target="_blank">ISAD(G)</a>);</li>
<li>Pour indiquer une source complémentaire à un fonds (un autre fonds d&rsquo;archives, géré dans un autre service, pouvant donner des informations supplémentaires sur les mêmes institutions/personnes/lieux) : &laquo;&nbsp;Archives départementales de la Savoie $ SA 243-244 : collèges d&rsquo;Avignon (dont celui d&rsquo;Annecy)&nbsp;&raquo;;</li>
</ul>
<p style="text-align: justify;">La création d&rsquo;un modèle de description des fonds d&rsquo;archives ayant pour objectif de structurer de telles descriptions se doit à la fois de les amener à plus de structuration pour améliorer l&rsquo;accès et la gestion de l&rsquo;information, et en même temps se doit de rester compatible avec les données telles qu&rsquo;elles sont aujourd&rsquo;hui; c&rsquo;est-à-dire qu&rsquo;il faut tout à la fois conserver la valeur de date &laquo;&nbsp;1923-1932, 1936-1945 (manque 1933 à 1935)&nbsp;&raquo; sans perte, et en même temps permettre de structurer cette valeur si possible, pour donner la possibilité de rechercher les fonds en utilisant une plage de dates que l&rsquo;on sélectionne dans des calendriers, ce qui n&rsquo;est pas possible si les informations de dates sont laissées textuellement.</p>
<p style="text-align: justify;">Cela a eu des conséquences à plusieurs endroits dans le modèle :</p>
<ul style="text-align: justify;">
<li>Première conséquence, lorsqu&rsquo;il est nécessaire d&rsquo;indiquer une <strong>référence</strong> à un autre fonds d&rsquo;archives, géré par un autre service d&rsquo;archives, il faut pouvoir y faire référence même si ce fonds ne possède pas (encore) d&rsquo;URI sur le web de données. RDF propose pour cela un mécanisme de <a href="http://fr.wikipedia.org/wiki/Ressource_anonyme" target="_blank">noeuds blancs, ou noeuds anonymes</a>, permettant d&rsquo;associer des informations à une ressource dont on ne connait pas l&rsquo;identifiant, ou qu&rsquo;on ne souhaite pas identifier avec une URI. Cependant ce n&rsquo;est pas vraiment ce que l&rsquo;on veut faire ici. Lorsque l&rsquo;on indique comme source complémentaire &laquo;&nbsp;Archives départementales de la Savoie $ SA 243-244 : collèges d&rsquo;Avignon (dont celui d&rsquo;Annecy)&nbsp;&raquo;, il ne s&rsquo;agit pas nécessairement du titre exact ou de la cote exacte d&rsquo;un autre fonds, mais simplement d&rsquo;une <em>référence textuelle </em>à quelque chose (peut-être à plusieurs choses d&rsquo;ailleurs) dont le titre par exemple, est différent de ce que l&rsquo;on indique en y faisant référence. Le modèle contient donc un mécanisme de <em>référence textuelle</em> pour faire référence à un fonds ou à une entité, qui permet :</li>
</ul>
<ol style="text-align: justify;">
<li>de rester compatible avec les valeurs textuelles existantes dans les données actuelles;</li>
<li>de pouvoir faire référence à un fonds ou à une entité dont on ne connait pas précisément le titre, l&rsquo;intitulé ou l&rsquo;URI;</li>
<li>de pouvoir travailler dans un mode &laquo;&nbsp;on exprime la relation d&rsquo;abord, et on essaie de résoudre la valeur contrôlée ensuite&nbsp;&raquo;;</li>
<li>de pouvoir travailler à un niveau de granularité et de finesse que l&rsquo;on choisit (trouver/sélectionner la bonne valeur contrôlée prend du temps, en rester à une référence pas/peu contrôlée est plus simple);</li>
</ol>
<p style="padding-left: 30px; text-align: justify;">Prenons l&rsquo;exemple d&rsquo;un fonds d&rsquo;archives qui serait la copie d&rsquo;un autre, et dont on veut indiquer l&rsquo;original :</p>
<p style="padding-left: 30px;">On peut indiquer cette référence sous forme de texte ainsi :</p>
<pre style="padding-left: 30px;">ex:fondsArchives_1 mdfa:aPourOriginal [
        mdfa:referenceTextuelle "collège Saint-Nicolas d'Annecy (1642-1785)." ;
]</pre>
<p style="padding-left: 30px;">Ou bien résoudre la référence, trouver la bonne URI contrôlée, et l&rsquo;indiquer :</p>
<pre style="padding-left: 30px;">ex:fondsArchives_1 mdfa:aPourOriginal [
        mdfa:referenceTextuelle "collège Saint-Nicolas d'Annecy (1642-1785)." ;
        mdfa:ressource ex:uriUnAutreFondArchives ;
]

</pre>
<ul>
<li style="text-align: justify;">Deuxième conséquence sur la <strong>description des dates</strong> : les dates mentionnées dans les descriptions de fonds sont soit : 1/ compliquées à décrire (&laquo;&nbsp;1923-1932, 1936-1945 (manque 1933 à 1935)&nbsp;&raquo;) ou 2/ imprécises (&laquo;&nbsp;milieu du XIXème siècle&nbsp;&raquo;). On ne peut donc pas se contenter de 2 propriétés de dates (début et fin), il faut également pouvoir associer à l&rsquo;information de date une description textuelle, et donner la possibilité, lorsque cela est possible/souhaitable, de structurer l&rsquo;information. Pour cela nous avons réutilisé l&rsquo;ontologie <a href="http://www.w3.org/TR/owl-time/">OWL Time</a> qui permet de décrire des intervalles de dates, et d&rsquo;associer à l&rsquo;intervalle lui-même, ou bien à une date de début ou de fin d&rsquo;intervalle, une description textuelle aussi bien qu&rsquo;une information de date contrôlée;</li>
</ul>
<p style="padding-left: 30px;">Premier exemple, pour décrire les dates de contenu d&rsquo;un fonds :</p>
<pre style="padding-left: 30px;">:fondsArchives_1 mdfa:datesContenu [
        rdfs:label "Du 1er janvier 1920 jusqu'aux environs de 1951"
        time:hasBeginning [ time:inXSDDateTime "1920-01-01"^^xsd:dateTime ] ;
        time:hasEnd [ time:inXSDDateTime "1951-01-01"^^xsd:dateTime ] ;
  ]
</pre>
<p style="padding-left: 30px;">Deuxième exemple, pour décrire les dates de naissance et de décès d&rsquo;une personne :</p>
<pre style="padding-left: 30px;">:personne_1 mdfa:datesExistence [
        rdfs:label "Date de naissance inconnue, mort le 23/10/1873"
        time:hasEnd [ time:inXSDDateTime "1873-10-23"^^xsd:dateTime ] ;
]</pre>
<ul style="padding-left: 30px;">
<li style="text-align: justify;">Troisième conséquence sur des <strong>propriétés tantôt littérales, tantôt contrôlées</strong>; RDF et OWL permettent, on a un peu tendance à l&rsquo;oublier, de déclarer des propriétés sans préciser si leur valeur sera une valeur contrôlée ou une valeur littérale. C&rsquo;est ce que fait SKOS par exemple, pour les propriétés de notes descriptives : une note SKOS peut être une valeur littérale, ou une référence à une entité représentant la note (voir le <a href="http://www.w3.org/TR/2009/NOTE-skos-primer-20090818/#secadvanceddocumentation">SKOS PRIMER</a>). De telles propriétés sont des <a href="http://www.w3.org/TR/owl-ref/#Header">Annotation Properties</a>. C&rsquo;est ce mécanisme que nous avons utilisé pour déclarer par exemple les propriétés correspondant au statut juridique, à la modalité d&rsquo;entrée ou au support d&rsquo;une ressource archivistique. Cela veut donc dire par exemple que, dans le cadre de cette ontologie, on laisse le choix de décrire les statuts juridiques comme une liste de valeurs contrôlées par un thesaurus en SKOS, ou bien comme une valeur textuelle libre.</li>
</ul>
<p style="padding-left: 30px;">On pourra donc dire tout aussi bien, pour indiquer la langue en utilisant une valeur contrôlée :</p>
<pre style="padding-left: 30px;">ex:notice_de_fonds_archives_1 dcterms:language &lt;http://lexvo.org/id/iso639-3/lat&gt; .</pre>
<p style="padding-left: 30px;">(on utilise dans cet exemple l&rsquo;identifiant de langue latine issu de <a href="http://www.lexvo.org/" target="_blank">Lexvo</a>, mais tout autre thesaurus contrôlé des langues peut faire l&rsquo;affaire).</p>
<p style="padding-left: 30px;">Ou bien ceci, en utilisant une description textuelle :</p>
<pre style="padding-left: 30px;">ex:notice_de_fonds_archives_1 dcterms:language "Latin. Ecriture insulaire 
(noter en particulier l'abréviation utilisée pour per)" .</pre>
<hr />
<h2>Spécialiser les entités</h2>
<p style="text-align: justify;">La vision du monde RDF et OWL comporte un présupposé majeur : il existerait dans le monde réel des &laquo;&nbsp;choses&nbsp;&raquo; que l&rsquo;on peut identifier de manière certaine, que l&rsquo;on peut isoler des autres, et auxquelles on peut donner une URI. C&rsquo;est une vision où le monde se &laquo;&nbsp;discretise&nbsp;&raquo; pour mieux se manipuler. Une manipulation du monde sans le langage. Mais il n&rsquo;est pas du tout sûr que des &laquo;&nbsp;entités&nbsp;&raquo; que l&rsquo;on puisse identifier et isoler existent ailleurs que dans notre tête (je crois que <a href="http://www.imdb.com/title/tt1817287/" target="_blank">Chomsky et Gondry parlent de ça</a>, si j&rsquo;ai bien compris, mais il faudrait que je revoie le film). Et une vision du monde qui ne prend pas en compte l&rsquo;aspect temporel. Alors que tout change. Qu&rsquo;on ne se baigne jamais deux fois dans la même eau. Que seul le changement est permanent. etc.</p>
<p style="text-align: justify;">Mais revenons à nos archives pour replacer ce problème en contexte : l&rsquo;archiviste décrit toujours une entité (comme une société par exemple) en regardant dans le rétroviseur, au passé. On ne décrit donc pas <em>&laquo;&nbsp;une société&nbsp;&raquo;</em>, on décrit <em>&laquo;&nbsp;la vie de la société&nbsp;&raquo;</em>. Est-on en droit de dire que l&rsquo;on parle de <em>la même</em> société lors de son immatriculation et 30 ans plus tard quand elle est devenue une multinationale ? Est-ce que la société Apple au début des années 1980 et la société Apple en 2014 sont <em>la même chose</em> ? peut-être pas. Ou pas complètement. Tout ce qui se rapporte à &laquo;&nbsp;Apple au début des années 1980&Prime; ne se rapporte pas forcément à &laquo;&nbsp;Apple en 2014&Prime;.</p>
<p style="text-align: justify;"><strong>On ne peut pas se contenter d&rsquo;assigner une seule URI unique pour identifier une entité dont on souhaite rendre compte de l&rsquo;évolution. Il nous en faut <em>plusieurs</em>.</strong> Et autant le point de départ de ce paragraphe nous a emmené dans des questions philosophiques théoriques, autant la solution pragmatique à ces questions est simple. Le modèle d&rsquo;ontologie proposé par le W3C pour décrire la &laquo;&nbsp;provenance&nbsp;&raquo; (on dirait plutôt l&rsquo; &laquo;&nbsp;origine&nbsp;&raquo; ou l&rsquo; &laquo;&nbsp;historique&nbsp;&raquo;, en français), <a href="http://www.w3.org/TR/prov-o/" target="_blank">PROV-O</a>, propose 2 notions intéressantes : la notion d&rsquo; <a href="http://www.w3.org/TR/prov-o/#Entity" target="_blank">&laquo;&nbsp;Entité&nbsp;&raquo;</a> (qui peut être ce qu&rsquo;on veut : &laquo;&nbsp;An entity is a physical, digital, conceptual, or other kind of thing with some fixed aspects; entities may be real or imaginary.&nbsp;&raquo;) , et la notion de <a href="http://www.w3.org/TR/prov-o/#specializationOf" target="_blank">&laquo;&nbsp;spécialisation d&rsquo;entité&nbsp;&raquo;</a>. Et c&rsquo;est cette dernière notion qui va particulièrement nous intéresser : la &laquo;&nbsp;spécialisation&nbsp;&raquo; d&rsquo;une entité <em>&laquo;&nbsp;en possède toutes les caractéristiques et présente en plus certains aspects spécifiques de cette entité. En particulier la plage de validité (lifespan) de l&rsquo;entité qui est spécialisée contient les plages de validité de ses spécialisations. Des exemples de spécialisation peuvent être une période de temps ou un certain contexte.&nbsp;&raquo;</em></p>
<p style="text-align: justify;">On pourra donc par exemple avoir 1/ une URI pour désigner &laquo;&nbsp;Apple&nbsp;&raquo; en tant qu&rsquo;entité générique 2/ une URI pour chaque grande période de la vie de société, comme par exemple les 6 grandes périodes décrites dans l&rsquo;historique de la <a href="http://en.wikipedia.org/wiki/Apple_Inc.#History" target="_blank">page Wikipedia :</a></p>
<pre>ex:Apple_entre_1976_et_1980 prov:specializationOf ex:Apple_en_general .
ex:Apple_entre_1981_et_1989 prov:specializationOf ex:Apple_en_general .
ex:Apple_entre_1990_et_1999 prov:specializationOf ex:Apple_en_general .
etc...</pre>
<p style="text-align: justify;">La finesse du découpage de la vie de l&rsquo;entité en périodes historiques est laissée à l&rsquo;appréciation de chacun. Les ressources archivistiques peuvent alors se rapporter soit à l&rsquo;entité &laquo;&nbsp;générique&nbsp;&raquo;, soit à l&rsquo;une de ses &laquo;&nbsp;spécialisations&nbsp;&raquo;. Chacune des spécialisations portera ses caractéristiques propres (nombre d&rsquo;employés, siège social, organigramme, etc.). On gagne en finesse de description de l&rsquo;entité, et en finesse d&rsquo;indexation des ressources.</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2014/05/26/penser-modeliser-web-de-donnees-2/">Penser, modéliser (pour le web de données) &#8211; 2/2</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2014/05/26/penser-modeliser-web-de-donnees-2/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Penser, modéliser (pour le web de données) (1/2)</title>
		<link>https://blog.sparna.fr/2014/05/12/penser-modeliser-web-de-donnees-1/</link>
		<comments>https://blog.sparna.fr/2014/05/12/penser-modeliser-web-de-donnees-1/#comments</comments>
		<pubDate>Mon, 12 May 2014 17:14:04 +0000</pubDate>
		<dc:creator><![CDATA[Thomas Francart]]></dc:creator>
				<category><![CDATA[Ontologies]]></category>
		<category><![CDATA[OWL]]></category>
		<category><![CDATA[archives]]></category>
		<category><![CDATA[modélisation]]></category>
		<category><![CDATA[ontologie]]></category>

		<guid isPermaLink="false">http://blog.sparna.fr/?p=560</guid>
		<description><![CDATA[<p>J&#8217;ai récemment eu le plaisir de collaborer avec la société Anaphore à la mise au point d&#8217;un modèle d&#8217;ontologie pour décrire des fonds d&#8217;archives. S&#8217;il ne m&#8217;appartient pas de dévoiler le contenu de ce modèle qui sera je l&#8217;espère rendu public dans quelques semaines, je voulais donner quelques retours d&#8217;expérience sur le processus de modélisation&#8230;</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2014/05/12/penser-modeliser-web-de-donnees-1/">Penser, modéliser (pour le web de données) (1/2)</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p style="text-align: justify;">J&rsquo;ai récemment eu le plaisir de collaborer avec la société <a href="http://labs.anaphore.eu/les-travaux-recents-danaphore/" target="_blank">Anaphore</a> à la mise au point d&rsquo;un modèle d&rsquo;ontologie pour décrire des <a href="http://fr.wikipedia.org/wiki/Fonds_d%27archives" target="_blank">fonds d&rsquo;archives</a>. S&rsquo;il ne m&rsquo;appartient pas de dévoiler le contenu de ce modèle qui sera je l&rsquo;espère rendu public dans quelques semaines, je voulais donner quelques retours d&rsquo;expérience sur le processus de modélisation lui-même, ainsi que sur quelques motifs de conception que nous avons mis en oeuvre (dans un second article). <span id="more-560"></span></p>
<h2>Pour quoi modélise-t-on ?</h2>
<p style="text-align: justify;">La question n&rsquo;est pas aussi simple qu&rsquo;il n&rsquo;y parait, et il y a tout à gagner à mettre à plat dès le début du travail de modélisation la distinction entre :</p>
<ul style="text-align: justify;">
<li>un modèle/format de travail;</li>
<li>un modèle/format d&rsquo;échange;</li>
<li>et un modèle conceptuel;</li>
</ul>
<p style="text-align: justify;">Est-ce que l&rsquo;on cherche à définir un modèle de travail qui sera utilisé <em>à l&rsquo;intérieur</em> d&rsquo;un système logiciel (le schéma des tables de sa base de données, pour faire simple) ? ou bien est-ce qu&rsquo;on cherche à définir un modèle d&rsquo;échange qui sera fait pour publier les données <em>à l&rsquo;extérieur</em> du système logiciel, sur le web de données ? La distinction est empruntée à <a href="http://www.utc.fr/~bachimon" target="_blank">Bruno Bachimont</a> (dans <a href="http://www.lavoisier.fr/livre/documentation/ingenierie-des-connaissances-et-des-contenus-le-numerique-entre-ontologies-et-documents/bachimont/descriptif-9782746213692" target="_blank"><em>Ingénierie des connaissances et des contenus : le numérique entre ontologies et documents</em></a> (Lavoisier, 2007)) :</p>
<blockquote><p>&laquo;&nbsp;Les formats d’échange permettent de rendre lisibles par différentes applications les mêmes données. Les formats de travail permettent à une application d’effectuer tous les traitements nécessaires et de créer les structures à cet effet.&nbsp;&raquo;</p></blockquote>
<p style="text-align: justify;">Ou bien encore, et c&rsquo;est un peu différent, est-ce que l&rsquo;on cherche à esquisser un modèle conceptuel du domaine, c&rsquo;est-à-dire se mettre d&rsquo;accord sur les principales entités de ce domaine et les relations qu&rsquo;elles entretiennent entre elles, sans rentrer dans les détails d&rsquo;implémentation ? <a href="http://www.bnf.fr/fr/professionnels/modelisation_ontologies/a.modele_FRBR.html#SHDC__Attribute_BlocArticle0BnF" target="_blank">FRBR</a> par exemple est un modèle conceptuel, et <a href="http://www.bnf.fr/fr/professionnels/rda/s.rda_objectifs.html" target="_blank">RDA</a> est une implémentation de FRBR en tant que modèle d&rsquo;échange; et rien n&rsquo;implique qu&rsquo;un logiciel compatible avec ce format d&rsquo;échange l&rsquo;utilise effectivement en tant que format de travail; il y a même toutes les chances que non.</p>
<p style="text-align: justify;">La distinction entre ces 3 objectifs est importante car chacun va apporter ses contraintes : par exemple, faire le modèle de travail d&rsquo;une application implique de prendre en compte des contraintes de facilité de saisie ou de navigation dans les données pour l&rsquo;utilisateur, ou de traçabilité des informations (quel utilisateur a créé quoi). Faire un modèle de publication pour le web de données amène des contraintes de facilité de compréhension, et de réutilisation du modèle. Faire un modèle de domaine ne demande pas de rentrer dans le détail de chaque propriété et de chaque relation, mais d&rsquo;être tout à fait clair sur la définition de chaque entité.</p>
<p style="text-align: justify;"><strong>Retour d&rsquo;expérience numéro 1 : déterminer précisément l&rsquo;objectif du modèle : modèle interne à une application, modèle de publication, ou modèle conceptuel.</strong></p>
<h2>&laquo;&nbsp;Be real&nbsp;&raquo;</h2>
<p style="text-align: justify;">Les modèles, les ontologies et tous ces bazars conceptuels ont ce côté rassurant des arrières-mondes que l&rsquo;on fabrique pour s&rsquo;échapper du douloureux réel. Tant que l&rsquo;on reste dans le modèle, tout va bien, mais quand on commence à regarder les données, les vraies données qui existent réellement pour de vrai, ça fait toujours un peu mal : on a oublié de prendre en compte telle colonne dans le fichier de données, telle autre contient du texte alors qu&rsquo;on avait prévu une référence contrôlée, etc. Pour paraphraser la boutade philosophico-geek &laquo;&nbsp;le réel, c&rsquo;est ce qui fait mal quand on éteint l&rsquo;ordinateur&nbsp;&raquo;, on pourrait dire &laquo;&nbsp;les données, c&rsquo;est ce qui fait mal quand on a fini le modèle&nbsp;&raquo;. &laquo;&nbsp;Reality is broken&nbsp;&raquo;, par essence.</p>
<p style="text-align: justify;">Non content de faire un modèle avec des boîtes et des flèches, il faut travailler le plus tôt possible dans le processus de modélisation sur les vraies données. Les exemples de données existantes exprimées suivant le modèle conçu doivent faire partie des livrables, autant que le modèle lui-même.</p>
<p style="text-align: justify;"><strong>Retour d&rsquo;expérience numéro 2 : travailler sur des exemples de vraies données, en les exprimant dans le modèle cible.</strong></p>
<h2>Modéliser c&rsquo;est communiquer</h2>
<p style="text-align: justify;">Tous les modèles sont imparfaits, on a beau le savoir il faut se le redire sans cesse pour ne pas oublier la réalité que ce modèle tente de capturer. Ce n&rsquo;est pas la réalité qui est cassée (&laquo;&nbsp;reality is broken&nbsp;&raquo;), ce sont nos modèles. Ou plutôt, la réalité est cassée <em>parce qu&rsquo;on en fait des modèles</em>.</p>
<p style="text-align: justify;">Tous les modèles sont imparfaits, car, malgré toutes les précautions que vous aurez prises pour faire émerger une objectivité, celle-ci ne restera finalement que votre vision du monde, la vôtre personnellement, ou celle du groupe de gens qui ont participé à sa mise au point. Eternelle subjectivité. Et c&rsquo;est précisément parce que votre modèle est subjectif qu&rsquo;il faut être capable de l&rsquo;expliciter, de l&rsquo;expliquer, de le communiquer aux autres. Le modèle doit servir de moyen, de support à la communication de votre vision du domaine métier. Il doit permettre d&rsquo;instaurer un dialogue. Eternelle inter-subjectivité. Dès lors, il faut s&rsquo;appliquer à rendre le modèle communicable :</p>
<ul style="text-align: justify;">
<li>99% des modèles OWL que l&rsquo;on trouve sur le web utilisent des URIs et des libellés en anglais. Mais pourquoi ne pas faire un modèle en français, si on le voit comme un support de communication à destination d&rsquo;acteurs francophones ? c&rsquo;est le parti que nous avons pris avec Anaphore. Pensons local avant de penser universel, il sera toujours temps, le jour où le modèle aura un succès international, de le traduire ;</li>
<li>un fichier d&rsquo;ontologie OWL ne suffit pas; c&rsquo;est incompréhensible. Faites des diagrammes, des schémas, dès le début du processus de modélisation, pour vous mettre d&rsquo;accord et pouvoir parler du modèle. La communication autour du modèle commence dès sa conception ;</li>
<li>c&rsquo;est une évidence, mais documentez les classes et les propriétés du modèle, et le modèle lui-même, en suivant <a href="http://lov.okfn.org/dataset/lov/Recommendations_Vocabulary_Design.pdf" target="_blank">les pratiques de bon sens documentées dans le LOV </a>;</li>
<li>utilisez les outils de génération automatique de documentation à partir du fichier OWL, comme <a href="http://www.essepuntato.it/lode" target="_blank">LODE</a> ou <a href="http://ontorule-project.eu/parrot/parrot" target="_blank">Parrot</a>. Nous avons utilisé LODE pour son rendu propre et la possibilité d&rsquo;intégrer les images des diagrammes dans la documentation ;</li>
<li>prévoyez un moyen de recevoir du feedback une fois votre modèle publié; a minima une adresse e-mail, ou une mailing-list, un forum, un formulaire de suggestion, un hashtag, ce que vous voulez, mais permettez qu&rsquo;un dialogue s&rsquo;instaure.</li>
</ul>
<p style="text-align: justify;"><strong>Retour d&rsquo;expérience numéro 3 : penser dès le départ le modèle comme un moyen de communication, autant qu&rsquo;un moyen de structurer les informations dans un système informatique.</strong></p>
<h2>Un arbre plutôt que du marbre</h2>
<p style="text-align: justify;">Si vous vous placez dans la perspective de publier un modèle OWL sur le web, il faut envisager cela à la fois, bien sûr, comme l&rsquo;aboutissement d&rsquo;un travail de réflexion, mais aussi comme le début d&rsquo;un processus d&rsquo;évolution. Ne pensez pas que votre modèle va être figé une fois publié. Si, comme évoqué précédemment, vous avez tenu compte de la réalité des données, et que vous avez prévu les moyens de dialogue et de feedback, alors votre modèle évoluera en tenant compte des évolutions dans l&rsquo;expression des données et des retours de la communauté. Soyez donc prêt à prendre en compte ces retours, en prévoyant pourquoi pas un mécanisme de versioning, et en établissant clairement le processus de mise à jour; sans faire l&rsquo;erreur de <a href="http://xmlns.com/foaf/spec/#sec-evolution" target="_blank">FOAF</a> qui a incorporé un numéro de version dans son URI, en étant maintenant incapable de la changer sans embêter tous ses utilisateurs !</p>
<blockquote><p>&laquo;&nbsp;&#8230;the technical namespace ID [of FOAF] remains fixed and includes the original value of &laquo;&nbsp;0.1&nbsp;&raquo;. It long ago became impractical to update the namespace URI without causing huge disruption to both producers and consumers of FOAF data. We are left with the digits &laquo;&nbsp;0.1&nbsp;&raquo; in our URI. This stands as a warning to all those who might embed metadata in their vocabulary identifiers.&nbsp;&raquo;</p></blockquote>
<p style="text-align: justify;">Bref, pensez à votre modèle comme quelque chose de vivant, un arbre plutôt que quelque chose de figé dans le marbre. Une certaine automatisation dans son processus de publication sur le web peut donc être bienvenue.</p>
<p style="text-align: justify;">Evidemment, si votre modèle est un modèle de travail interne pour une solution logicielle, son évolution est moins aisée, la problématique est différente.</p>
<p style="text-align: justify;"><strong>Retour d&rsquo;expérience numéro 4 : penser à l&rsquo;évolution du modèle une fois sa mise en ligne, ne pas hésiter à le faire évoluer.</strong></p>
<p style="text-align: justify;">Le second volet de ces quelques réflexions, dont le titre &laquo;&nbsp;Penser, modéliser&nbsp;&raquo; s&rsquo;inspire du livre &laquo;&nbsp;<a href="http://livre.fnac.com/a1417192/Georges-Perec-Penser-classer" target="_blank">Penser, classer</a>&nbsp;&raquo; de Georges Perec, sera consacré aux motifs de conception (design pattern) utilisés pour construire ce modèle de description des fonds d&rsquo;archives.</p>
<p>Cet article <a rel="nofollow" href="https://blog.sparna.fr/2014/05/12/penser-modeliser-web-de-donnees-1/">Penser, modéliser (pour le web de données) (1/2)</a> est apparu en premier sur <a rel="nofollow" href="https://blog.sparna.fr">Sparna Blog</a>.</p>
]]></content:encoded>
			<wfw:commentRss>https://blog.sparna.fr/2014/05/12/penser-modeliser-web-de-donnees-1/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
