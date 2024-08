ntic

La Société AureXus, présente sa contribution à la numérisation et l’indexation d’articles de presse anciens à l’occasion de l’exposition "1918, fin d’une guerre" qui se tient à la Villa Saint-Hilaire de Grasse jusqu’au 12 janvier 2019, dans le cadre des événements et commémorations du centenaire de l'Armistice de la guerre de 14-18.



AureXus a numérisé au format ALTO (Analyzed Layout and Text Object) plus de 80 000 pages d’articles de presse qui couvrent toute la période 14-18 et mettent l’accent sur la petite histoire dans la grande, en s’intéressant à l’impact de la Grande Guerre sur la société provençale.



"Nous sommes très fières d’avoir pu contribuer à la préservation de ces documents et grâce à la conversion au format ALTO, de rendre facile la fouille plein texte de leur contenu et la consultation en ligne des documents eux-mêmes", dit Thierry Léger, Directeur Général d’AureXus.



Le fonds numérisé par AureXus inclut aussi les radiographies militaires réalisées par Pierre Goby l’un des inventeurs de la microradiographie. Les radiographies médicales numérisées montraient, pour la première fois à l’époque, les dégâts causés par les éclats d’obus et les balles.



Les coupures de presse patiemment accumulées dans 219 classeurs par Oleg-Eugène Tripet-Skrypitzine, (1848-1935) officier de cavalerie et peintre, sont maintenant facilement accessibles par Internet sur le site de la bibliothèque de la ville de Grasse.



"Avant même de pouvoir se lancer dans la numérisation au format ALTO, il y a eu un important travail de manipulation et de compréhension de ces documents. Après la numérisation, les équipes d’AureXus ont corrigé les mots clés et noms propres de chaque article pour permettre des recherches précises plein texte sur ce fonds" dit Mme Garra, responsable du projet pour la Ville de Grasse, "De plus, ce format, est compatible avec Gallica, la grande bibliothèque numérique de la BnF".



Le format ALTO utilisé est un standard XML, maintenu par la Bibliothèque du Congrès et la Bibliothèque nationale de France (BnF) pour la numérisation de la presse. Il combine l’image numérique des anciennes pages de presse avec une couche de code qui conserve l’intégralité du contenu (textes, photographies, graphiques) et la position de chaque mot. Les textes des documents sont reconnus automatiquement par l’OCR (Reconnaissance Optique de Caractères) et éventuellement corrigés. La structure des pages et des articles est reconstituée électroniquement. AureXus, dispose d'un outil très performant, DocWorks, pour réaliser la conversion au format Alto, standard BnF.





Correction des mots clés - Aurexus Traitement ALTO de la presse



A propos d'AureXus

AureXus, spécialiste de la conservation, la diffusion et la consultation du contenu numérique offre aux bibliothèques, archives et musées tous les services pour transformer, cataloguer et indexer le contenu existant (fichiers index, catalogues, instruments de recherche, livres, articles de presse, photographies, ...) en contenu numérique TIF, JG2, XML/EAD, MARC, pdf multicouche, ALTO, et propose également la création de modèles 3D pour les musées et l’industrie.



Active dans plusieurs pays, l’entreprise compte de nombreux projets et clients prestigieux dont les Nations Unies, le Rockefeller Center, la Bibliothèque National de France (BnF), le Ministère des Armées, etc.