Correct est un projet dont l’ambition est d’expérimenter la correction collaborative des documents numérisés provenant de Gallica, la bibliothèque numérique de la BnF.
Pourquoi une correction collaborative ?
Des documents et livres anciens conservés par la Bibliothèque nationale de France sont numérisés pour être publiés sur Gallica, dont le site web est www.gallica.bnf.fr. La numérisation est réalisée dans un format image (comme s’il s’agissait d’une photo). Un logiciel va ensuite identifier les caractères et chercher à les convertir en texte. Cette étape de reconnaissance optique des caractères est appelée « océrisation ». Elle est indispensable pour faciliter les accès au texte car une fois le document en format texte, une indexation peut être réalisée et permettre d’effectuer des recherches par mots-clés par exemple. Les numérisations de documents et livres anciens sont mis librement à disposition sur Gallica, ils s’adressent aussi bien au grand public qu’aux étudiants, chercheurs, érudits…
Cette phase d’océrisation n’est cependant pas satisfaisante à 100%. En effet, les programmes informatiques ne savent pas toujours bien identifier chaque caractère surtout si l’impression n’est pas de bonne qualité ou lorsqu’il s’agit de livres anciens, avec des défauts d’impression ou des taches sur le papier. Le résultat comporte souvent trop d’imperfections pour obtenir un document parfaitement conforme à l’original. Le seul moyen d’y parvenir est de passer par une phase de correction manuelle. Correct est la plateforme de crowdsourcing où différents utilisateurs vont pouvoir collaborer pour détecter, analyser et corriger les erreurs restantes et ainsi participer à l’amélioration des documents patrimoniaux.
Sur la plateforme Correct sont mis à la disposition des utilisateurs (de tous les utilisateurs ! Elle est ouverte à tous) des outils intuitifs permettant de corriger facilement les documents. La plateforme s’appuie sur un réseau social dédié pour favoriser l’entraide et soutenir l’organisation de la collaboration au sein de petits groupes de correction.
Correct cherche des volontaires pour amplifier ces travaux de correction collaborative.
Et si à votre tour vous vous lanciez ? C’est ici : http://www.reseau-correct.fr
Vous pourriez ainsi concilier votre amour des livres avec une vraie mission d’amélioration des documents patrimoniaux numériques.
Marco Valdo