Epicherchell, nouvelle ressource liée au thésaurus PACTOLS

EpiCherchell est un programme de publication numérique de toutes les inscriptions antiques découvertes sur le site de Césarée de Mauritanie, ancienne capitale de la province romaine de Maurétanie Césarienne et aujourd’hui Cherchell, à une centaine de kilomètres à l’est d’Alger.

Ecran d'accueil du site EpiCherchell

Ces inscriptions épigraphiques, en grec et en latin, constituent un corpus de 1300 textes environ, portant sur des sujets variés, révélateurs de la position et de la richesse de la ville entre la fin du Ier s. av. J.-C. et le VIe s. ap. J.-C. Le programme, piloté par le Centre Camille Jullian (CCJ), bénéficie de l’appui de la TGIR Huma-Num qui héberge le site (http://ccj-epicherchel.huma-num.fr) et du soutien du consortium MASA.

L’édition des inscriptions repose sur un réseau international de 14 épigraphistes coordonné par Philippe Leveau, professeur d’archéologie émérite à l’université Aix Marseille et membre du CCJ. Chacun contribue à la publication des notices dans une base de données collaborative. Celle-ci présente plus de 1000 enregistrements, composés d’une fiche signalétique de l’inscription, sa transcription/traduction et une ou plusieurs images archivées à la photothèque du CCJ.

L’édition des inscriptions repose sur un réseau international de 14 épigraphistes coordonné par Philippe Leveau, professeur d’archéologie émérite à l’université Aix Marseille et membre du CCJ. Chacun contribue à la publication des notices dans une base de données collaborative. Celle-ci présente plus de 1000 enregistrements, composés d’une fiche signalétique de l’inscription, sa transcription/traduction et une ou plusieurs images archivées à la photothèque du CCJ. L’affichage du commentaire et de l’apparat critique est soumis à l’autorisation de son auteur. 170 notices sont aujourd’hui publiées. La structuration de l’information est inspirée des grands corpus épigraphiques avec un socle de données Dublin Core. Dès le départ, la volonté d’utiliser un vocabulaire contrôlé pour renseigner certains champs et rendre la recherche plus efficace a incité les concepteurs à s’appuyer sur le thésaurus PACTOLS. Ainsi, Type d’inscription, Type de support, Matériau, Lieu de conservation des concepts PACTOLS.

Jouant à plein la carte de l’ouverture et du collectif, les concepteurs ont souhaité d’abord faciliter l’indexation des notices épigraphiques par les chercheurs en les assistant dans leurs choix de mots-clés. Ensuite il était logique de signaler à PACTOLS l’usage qui est fait des concepts. Pour ce faire, EpiCherchell exploite toutes les fonctionnalités de l’API de Opentheso.

Opentheso est le gestionnaire du thésaurus PACTOLS. Outre les fonctionnalités étendues de gestion et d’affichage des concepts et de leurs branches, Opentheso met à disposition un environnement normalisé et ouvert dont une API ou Application Programming Interface/Interface de Programmation d’Application qui autorise la liaison dynamique (immédiate et permanente) entre le thésaurus et une ressource. Cette API est déjà pré-paramétrée pour plusieurs applications : AtoM, Drupal, Koha, Métopes, Oméka S. Elle est mise en œuvre dès le départ avec Koha, le système de gestion de bibliothèques sur lequel s’appuie le Catalogue collectif indexé (CCI) de Frantiq. Elle permet ainsi aux bibliothécaires de Frantiq de sélectionner les mots-clés nécessaires à l’indexation de la publication depuis la grille de catalogage en puisant directement dans PACTOLS. En échange, Koha signale à Opentheso que tel mot-clé a été sélectionné pour telle ou telle notice. Le résultat s’affiche dans la zone des Corpus liés de PACTOLS avec le nombre de notices indexées avec le concept : Catalogue Frantiq (N notices).

Ce fonctionnement présente deux avantages : d’un côté il donne accès à la version la plus à jour du thésaurus et de l’autre côté, il établit le poids d’un concept via son nombre d’occurrences dans le réservoir de données.

PACTOLS a quitté depuis plusieurs années le giron des bibliothèques pour servir à l’indexation d’autres ressources : articles de revues scientifiques, données et corpus de recherche, enregistrements de terrain, sites web valorisant le patrimoine, etc. Si certains de ces réservoirs exploitent déjà l’API de Opentheso, ils n’appliquent que la partie « entrante » pour l’indexation dynamique. EpiCherchell est donc le premier, en dehors du CCI, à ouvrir le flux de retour pour renvoyer ses informations à PACTOLS. Ainsi par exemple, le concept épitaphe annonce désormais deux corpus liés, le catalogue Frantiq avec 1738 notices et EpiCherchell avec 103 notices. Évidemment, les deux réservoirs sont mis en avant dans le thésaurus d’autant que l’information donne accès par simple clic aux ressources citées :

Les lecteurs les plus perspicaces auront compris tout l’intérêt de la nouveauté : à travers l’interrogation de PACTOLS, l’internaute peut naviguer d’un réservoir à l’autre, dans les sept langues du thésaurus, et enrichir sa recherche de données aux natures variées, bibliographique ou scientifique selon leur origine. Le tout s’effectue dans un environnement disciplinaire cohérent.

A l’heure de la science ouverte et cette démonstration à l’appui, les gestionnaires de données ne devraient pas être longs à se convaincre d’ouvrir les flux en entrée et en sortie de PACTOLS !

B. Nouvel avec la participation de S. Satre et E. Sinigaglia