-
Notifications
You must be signed in to change notification settings - Fork 4
API OAI PMH
#API OAI-PMH
OAI-PMH est le sigle de l'Open Archives Initiative - Protocol for Metadata Harvesting, ce qui signifie « protocole pour la collecte de métadonnées de l'Initiative pour les Archives ouvertes ».
Le protocole OAI-PMH est un moyen d'échanger sur Internet des métadonnées entre plusieurs institutions, afin de multiplier les accès aux documents numériques.
Son utilisation est libre, tout comme ses spécifications, disponibles sur le site http://www.openarchives.org . Le fonctionnement de base du protocole OAI-PMH repose sur une communication de client à serveur. Le client envoie des requêtes au serveur en http, le serveur répond par un flux de données en XML.
La BnF offre deux entrepôts OAI exposant deux ensembles de notices bien différents.
-
Le premier ensemble correspond aux notices des documents numériques dont la consultation est ouverte à tout public. Un sous-ensemble important de ces notices est consultable via Gallica en particulier. Cet entrepôt contient l’ensemble des notices des documents numériques consultables dans Gallica et pour lesquels la BnF possède les fichiers numériques. La granularité de cet entrepôt est le document numérique « unitaire », tel que consulté dans Gallica : un document numérique consultable identifié par un identifiant ark unique, un enregistrement (« record » ).
-
On appellera cet entrepôt OAINUM. L’interrogation de cet entrepôt permet d’obtenir simplement les métadonnées d’un document numérique dont l’identifiant ark a par exemple été trouvé dans Gallica ; il est également possible entre autres possibilités d’obtenir une liste d’identifiants de documents appartenant à un ensemble prédéfini dans l’entrepôt (appelé « set » dans OAI).
-
Adresse de l’entrepôt OAINUM (requête à compléter): http://oai.bnf.fr/oai2//OAIHandler?verb=...
-
Le deuxième ensemble correspond aux notices du Catalogue, BnF Catalogue général.
-
La granularité de cet entrepôt est la notice bibliographique. On appellera cet entrepôt OAICAT. L’interrogation de cet entrepôt permet d’obtenir simplement les métadonnées « simplifiées » issues de la notice bibliographique. Il est possible entre autres d’obtenir une liste d’identifiants de documents appartenant à un ensemble prédéfini dans l’entrepôt (appelé « set » dans OAI), à partir de laquelle on peut obtenir les notices Dublin Core associées .
-
Adresse de l’entrepôt OAICAT (requête à compléter): http://catoai.bnf.fr/oai2/OAIHandler?verb=...
Les deux entrepôts proposés fournissent au minimum des notices au format OAI_DC, Dublin Core non qualifié (15 types d’attribut différents) (http://dublincore.org/documents/dces/), et au format TEL_AP (The European Library Application Profile). La page http://www.bnf.fr/fr/professionnels/donnees_bnf_recuperables/a.notices_gallica.html#SHDC__Attribute_BlocArticle1BnF décrit succinctement ces formats.
Les notices Dublin Core de l’OAICAT et celles de l’OAINUM, bien que toutes conformes au Dublin Core, contiennent des informations différentes : plus riches pour ce qui concernent OAICAT. Par ailleurs l’ensemble des sets proposés sont bien différents.
Le contenu des entrepôts :
-
OAI-NUM http://oai.bnf.fr/oai2/OAIHandler?verb=ListIdentifiers&metadataPrefix=oai_dc
-
OAI-CAT http://catoai.bnf.fr/oai2/OAIHandler?verb=ListIdentifiers&metadataPrefix=oai_dc
Présentation générale : http://www.bnf.fr/fr/professionnels/protocoles_echange_donnees/a.proto_oai.html
Présentation BnF de l’OAI : http://www.bnf.fr/documents/oai_presentation.pdf
Site comportant la présentation complète du protocole OAI : http://www.openarchives.org/
Voir la page format Dublin Core
Il existe 6 requêtes et des paramètres
- Identify ; Pour obtenir des informations sur l’entrepôt interrogé
- ListIdentifiers ; Pour obtenir la liste des identifiants de notice de l’entrepôt. Il faut préciser des * paramètres complémentaires, comme le format DC
- ListMetadataFormats ; Pour obtenir la liste des formats présents dans l’entrepôt
- ListSets ; Pour obtenir la liste des sets (ensembles prédéfinis) de l’entrepôt
- ListRecords ; Pour obtenir la liste des enregistrements/notices de l’entrepôt. Il faut préciser le format attendu
- GetRecord Pour obtenir un enregistrement/notice de l’entrepôt. Il faut préciser le format attendu et l’identifiant du document.
Les requêtes sont précédées de « ?verb= »
Les requêtes commencent par une majuscule
Les paramètres sont introduits par « & »
Les paramètres commencent par une minuscule
Le nom du set est celui spécifié dans et non celui de
Il y a des paramètres obligatoires et optionnels pour chaque requête
Plus de précisions sur le langage d’interrogation : http://www.openarchives.org/OAI/openarchivesprotocol.html#HTTPRequestFormat
Les sets sont de 3 types différents :
- type de documents (monographies, images, manuscrits, cartes et plans ... )
- corpus (dossiers, Voyage en France, Voyages en Italie, Japon ... )
- par classes de la Dewey
Tous les documents consultables dans Gallica ont leur notice Dublin Core dans l’entrepôt OAINUM. Ils appartiennent tous au moins à un set dont le nom est préfixé par gallica:typedoc qui correspond au type de documents.
Exemple :
<setSpec>gallica:typedoc:monographies</setSpec>
correspond aux livres dans Gallica
Les sets sont de 3 types différents :
- type de documents
- Fonds
- Collections/département d’appartenance d’un exemplaire
Toutes les notice d’OAICAT appartiennent au moins à un set « type de document »
Remarque : les suppressions de notices dans un set ou dans l'entrepôt sont signalées par les identifiants, mais il n'y a pas de record associé
http://oai.bnf.fr/oai2//OAIHandler?verb=Identify
http://catoai.bnf.fr/oai2//OAIHandler?verb=Identify
http://oai.bnf.fr/oai2//OAIHandler?verb=ListIdentifiers&metadataPrefix=oai_dc
http://catoai.bnf.fr/oai2//OAIHandler?verb=ListIdentifiers&metadataPrefix=oai_dc
http://oai.bnf.fr/oai2//OAIHandler?verb=ListSets
http://catoai.bnf.fr/oai2//OAIHandler?verb=ListSets
http://oai.bnf.fr/oai2//OAIHandler?verb=ListRecords&metadataPrefix=oai_dc
http://catoai.bnf.fr/oai2//OAIHandler?verb=ListRecords&metadataPrefix=oai_dc
http://oai.bnf.fr/oai2//OAIHandler?verb=ListMetadataFormats
http://catoai.bnf.fr/oai2//OAIHandler?verb=ListMetadataFormats
Liste des enregistrements créés ou modifiés depuis le 15/10/2016 au format oai_dc
http://catoai.bnf.fr/oai2//OAIHandler?verb=ListRecords&from=2016-10-15&metadataPrefix=oai_dc
Liste des enregistrements créés ou modifiés depuis le 15/01/2016 appartenant au set thématique "gallica:theme:9:94" au format oai_dc
http://oai.bnf.fr/oai2//OAIHandler?verb=ListRecords&from=2016-01-15&set=gallica:theme:9:94&metadataPrefix=oai_dc
Recherche avec clé de reprise (Resumption token) : les longues listes sont récupérées par paquets avec Resumption token http://oai.bnf.fr/oai2/OAIHandler?resumptionToken=1%2168816%2124557098%212767325%21100%212826328%21oai_dc&verb=ListIdentifiers
- Page de test OAINUM avec exemples complémentaires