Le projet en tant que tel durera neuf ans et consistera en l'indexation de quelque quarante millions de pages de la bibliothèque, qui existe depuis 1475 déjà, mais qui contient des pièces qui sont encore nettement plus anciennes que la bibliothèque elle-même. Lorsque tout sera terminé, l'on estime que quelque 2,8 péta-octets de données auront été nécessaires.

"Nous voulions y parvenir avec une interopérabilité garantie, afin que l'on puisse encore et toujours utiliser le résultat de notre travail dans cinquante ans, voire plus", prétend Luciano Ammenti, Chief Information Officer du Saint-Siège. C'est ainsi que le Vatican recourt à Fits en tant que format d'image, un standard relativement méconnu, qui est surtout utilisé pour conserver les données scientifiques (notamment en astronomie).

Ses avantages sont grands, selon Ammenti. C'est ainsi que Fits tourne sur 64 bits, accepte une taille de fichier illimitée, supporte la visualisation 3D et est l'open source par défaut, qui est en outre régulièrement étendu au fur et à mesure que la technologie évolue. "Ce qui facilite les choses, c'est que Fits contient quasiment toutes les données possibles d'un document. Certaines pièces intègrent de l'or, de l'argent ou d'autres matières délicates qu'il faut aussi pouvoir saisir lorsqu'on scanne un document."

Mais tout ne sera pas numérisé. C'est ainsi qu'une équipe de spécialistes décide de ce qui peut être digitalisé sans risque de dommage. "Ensuite, il convient de choisir l'appareil de numérisation, mais après le scan, nous contrôlons également l'ensemble du fichier." Selon Ammenti, il s'agit là d'une étape cruciale car plus la numérisation est précise, plus le fichier de données gardera sa valeur dans les années qui suivront.

Il n'empêche que la numérisation ne va pas sans risque. Il peut y avoir une perte de qualité au fil du temps. "C'est pourquoi chaque fichier que nous créons, est contrôlé tous les six mois." Le format Fits est aussi régulièrement actualisé. Mais cela ne pose aucun problème, selon Ammenti. "C'est comparable à Unix, qui existe depuis des décennies déjà, qui a évolué aujourd'hui et qui est disponible sous plusieurs formes, mais qui, intrinsèquement, fonctionne encore de la même manière."

Les scanners eux-mêmes sont également soumis à un contrôle approfondi. "Toutes les deux milles images, chaque scanner est recalibré, par exemple pour vérifier la qualité des couleurs." Les scans sont aussi conservés en plusieurs endroits, afin de ne pas perdre l'ensemble de la bibliothèque numérique en cas de catastrophe.

"Nous voulions créer quelque chose et ce, non pas pour nous, mais pour les générations futures, quelque chose qui sera encore et toujours lisible et consultable dans cent ans par tout un chacun dans le monde", conclut Ammenti.

Pieterjan Van Leemputten, Data News, Roularta Media Group

Le projet en tant que tel durera neuf ans et consistera en l'indexation de quelque quarante millions de pages de la bibliothèque, qui existe depuis 1475 déjà, mais qui contient des pièces qui sont encore nettement plus anciennes que la bibliothèque elle-même. Lorsque tout sera terminé, l'on estime que quelque 2,8 péta-octets de données auront été nécessaires. "Nous voulions y parvenir avec une interopérabilité garantie, afin que l'on puisse encore et toujours utiliser le résultat de notre travail dans cinquante ans, voire plus", prétend Luciano Ammenti, Chief Information Officer du Saint-Siège. C'est ainsi que le Vatican recourt à Fits en tant que format d'image, un standard relativement méconnu, qui est surtout utilisé pour conserver les données scientifiques (notamment en astronomie). Ses avantages sont grands, selon Ammenti. C'est ainsi que Fits tourne sur 64 bits, accepte une taille de fichier illimitée, supporte la visualisation 3D et est l'open source par défaut, qui est en outre régulièrement étendu au fur et à mesure que la technologie évolue. "Ce qui facilite les choses, c'est que Fits contient quasiment toutes les données possibles d'un document. Certaines pièces intègrent de l'or, de l'argent ou d'autres matières délicates qu'il faut aussi pouvoir saisir lorsqu'on scanne un document." Mais tout ne sera pas numérisé. C'est ainsi qu'une équipe de spécialistes décide de ce qui peut être digitalisé sans risque de dommage. "Ensuite, il convient de choisir l'appareil de numérisation, mais après le scan, nous contrôlons également l'ensemble du fichier." Selon Ammenti, il s'agit là d'une étape cruciale car plus la numérisation est précise, plus le fichier de données gardera sa valeur dans les années qui suivront. Il n'empêche que la numérisation ne va pas sans risque. Il peut y avoir une perte de qualité au fil du temps. "C'est pourquoi chaque fichier que nous créons, est contrôlé tous les six mois." Le format Fits est aussi régulièrement actualisé. Mais cela ne pose aucun problème, selon Ammenti. "C'est comparable à Unix, qui existe depuis des décennies déjà, qui a évolué aujourd'hui et qui est disponible sous plusieurs formes, mais qui, intrinsèquement, fonctionne encore de la même manière." Les scanners eux-mêmes sont également soumis à un contrôle approfondi. "Toutes les deux milles images, chaque scanner est recalibré, par exemple pour vérifier la qualité des couleurs." Les scans sont aussi conservés en plusieurs endroits, afin de ne pas perdre l'ensemble de la bibliothèque numérique en cas de catastrophe. "Nous voulions créer quelque chose et ce, non pas pour nous, mais pour les générations futures, quelque chose qui sera encore et toujours lisible et consultable dans cent ans par tout un chacun dans le monde", conclut Ammenti.Pieterjan Van Leemputten, Data News, Roularta Media Group