Projets

Les Archives Nationales passent au numérique

Commencée en 1998, la digitalisation des archives nationales vise à rendre plus disponibles celles-ci à l'attention des chercheurs et du public, ainsi qu'à faciliter leur préservation.

Publicité« Le seul site de Paris des Archives Nationales, qui couvre la période du Moyen Age à 1958 et conserve aussi les archives présidentielles ainsi que le Minutier central des notaires de Paris, comprend 90 kilomètres linéaires d'archives » confie François Merlin, responsable du département des NTIC aux Archives nationales, service de la Direction des Archives de France, au Ministère de la Culture. Depuis 1998, l'administration manifeste une volonté constante de numériser des fonds tant d'archives publiques que privées. Beaucoup de documents sont extrêmement fragiles et leur consultation demande donc de nombreuses précautions. « En numérisant nos fonds, notre objectif est à la fois d'en avoir une copie numérique, pour les protéger, et de faciliter leur consultation par des chercheurs, des généalogistes... » indique François Merlin. La numérisation est très progressive car elle est coûteuse et complexe. François Merlin précise : « nous commençons par les documents à valeur patrimoniale forte, ceux particulièrement fragiles et les plus demandés ». Chaque numérisation d'un fonds donné constitue un projet particulier : atlas de Trudaine, archives Napoléon,... A ce jour, un peu moins de deux millions de documents représentent 5 To de données, ces chiffres étant en forte croissance. En effet, les Archives Nationales privilégient la qualité : les documents sont si nécessaires démontés (reliure...) puis photographiés par des prestataires spécialisés (comme Jouve), avant une étape de contrôle très pointilleux de la qualité du résultat par l'atelier de photographie du département de la conservation (si nécessaire, la photographie est refaite), et enfin le cas échéant un remontage. Les archives originales doivent avoir été classées pièce à pièce avant d'être numérisées, faute de quoi la numérisation donne accès à un « vrac » d'images, presque inutilisable. Après numérisation, chaque image ou ensemble d'images est ensuite indexé par les documentalistes des Archives Nationales, qui les décrivent selon des métadonnées standardisées, souvent à partir des inventaires papier qui renseignaient les chercheurs sur le contenu des fonds avant leur numérisation. Les métadonnées sont stockées au format XML/EAD sous le logiciel libre Pleade (auparavant sous Mistral de Bull, Cindoc,...), avec des cotes permettant de retrouver les documents digitalisés ou originaux. La complexité tant du traitement physique de l'archive que de l'indexation explique la lenteur du procédé. La photographie de référence est au format TIFF, 64 millions de couleurs, 300 dpi. Une version dégradée au format JPEG est destinée à une consultation via le web. L'ensemble est hébergé par le service informatique du Ministère de la Culture. D'ici la fin 2007, les résultats des digitalisations non encore indexées seront consultables par les chercheurs dans les locaux des Archives Nationales sous la forme d'un feuilletage d'images classées par fonds et par cote. A terme, il est prévu que certaines archives soient traitées en OCR pour permettre des recherches « plein texte ». Pour l'instant, seules des expériences sont menées en la matière. Par ailleurs, dans le cadre de la construction d'un nouveau bâtiment pour les Archives nationales à Pierrefitte-sur -Seine, les Archives nationales veulent lancer une opération de dématérialisation des inventaires, clés d'accès aux documents originaux. L'ensemble à traiter est bien moindre que celui que constituent les fonds d'archives originaux, mais il reste considérable, aussi bien par son volume que par sa variété (écritures manuscrites du XIXème au XXème s., dactylogrammes, imprimés, dimension non standardisées,...) et pose de nombreux problèmes techniques. Les inventaires ainsi dématérialisés alimenteront une salle des inventaires virtuelle qui offrira aux chercheurs un service majeur en leur permettant de consulter à distance les instruments de recherche des Archives nationales et de préparer ainsi leur déplacement. Les images des fonds de documents originaux numérisés ultérieurement pourront progressivement être rattachées à la version numérique de leur inventaire. Enfin, la direction des Archives de France développe actuellement un pilote de plateforme d'archivage électronique afin d'accueillir des archives nativement numériques produites par les administrations centrales de l'Etat.

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis

    La question du moment
    Dans votre organisation, est-il exclu de transférer certaines données dans le cloud public, pour des raisons réglementaires ou par choix ?