Agrégateur de flux

Mesures et ‘valeurs’ : autour de la question des poids et mesures

Huma-Num - 26 Septembre, 2018 - 17:20

Groupe de travail « Mesures et ‘valeurs’ » – responsable Armand Jamme (CNRS -Ciham)

Les interrogations sur les mesures et ce qu’elles signifient sont depuis le début des études historiques un vrai serpent de mer. Les valeurs enregistrées dans les sources médiévales n’ont pas en effet la claire évidence arithmétique que paraît recouvrir leur expression chiffrée, non seulement parce qu’elles n’ont de sens que replacées dans un contexte économique et culturel précis, mais aussi à cause de la diversité des systèmes de comptes utilisés, sans évoquer ici le fameux « système monastique » étudié par David King. A cette complexité, vient s’ajouter la diversité des formes de restitution des abréviations et des chiffres par les éditeurs de textes médiévaux.

Les projets que le groupe M&V entendait développer, dans le cadre du consortium COSME2 orienté vers la création de référentiels, sont au nombre de trois :

  • bâtir un système permettant de dresser les soldes intermédiaires et finaux d’un registre de comptes édité en ligne et ses traductions graphiques ;
  • constituer une base de données décrivant les exercices comptables, dans toute leur diversité génétique, aujourd’hui conservés pour l’espace français du XIIIe siècle ;
  • réfléchir à la constitution d’un glossaire des monnaies médiévales offrant pour chaque espèce, outre sa description et son histoire, son poids réel en métal plus ou moins précieux.

Le premier est, à mi-parcours, en bonne voie, puisqu’un script résultant de l’invention d’un mécanisme permettant de totaliser des chiffres romains, exprimés parfois en recourant à des sommes exposées (VIXXXIII, par exemple), et bien évidemment intégrant les égalités qui sont à la base du système livre, sous, denier, sera adapté à titre de test sur une édition électronique à la fin 2018. Ceci peut laisser présager en fin de programme la création d’un système de traitement mathématique d’un grand nombre d’éditions numériques de textes comptables, même si les handicaps demeurent à ce jour importants.

Les échanges, longs mais nécessaires à l’élaboration des paramètres d’inventorisation ont abouti pour le second objectif à un plan de travail sous excel, qui permet de lancer à l’automne 2018 la production de la base et son interface de saisie. A terme cette BDD qui doit recevoir les analyses d’exercices comptables de diverses origines géographiques, institutionnelles et donc culturelles, devrait être publiée sur Thelma.

En revanche, le développement d’un projet de glossaire des monnaies, a été freiné par l’existence parallèle et simultané d’un projet de portail des monnaies françaises actuellement développé par l’EPHE et la BnF. Tout ceci nécessite de nouvelles discussions et une reconfiguration tant des objectifs que des méthodes pour parvenir à une vraie complémentarité des deux structures qui, pour avoir le même objet  et donc de nombreux éléments communs, n’en ont pas moins des paramètres d’analyse différents.

Membres de l’équipe :

Armand Jamme (CNRS)

Philippe Bernardi (CNRS),

Didier Boisseuil (Univ. Tours),

Marc Bompaire (EPHE),

Gaël Chenard (Arch. Dép. Vienne),

Florence Codine (BnF),

Harmony Dewez (Univ. Poitiers),

Christelle Loubet (Univ. Lorraine),

Shinya Mukai (Osaka Univ.)

G. Porte

A. Sablon du Corail (Arch. Nat.),

D. Sassu Normand

TELMA

Huma-Num - 26 Septembre, 2018 - 16:37

Traitement Électronique des Manuscrits et des Archives

Porteur principal et responsable du projet : IRHT – Paul Bertrand (UCLouvain – Université de Louvain, membre associé à l’IRHT)

Membres IRHT, à titre principal : Paul Bertrand, Cyril Masset.

Partenaires : TGE Adonis puis COSME (Consortium Sources Médiévales), EnC jusqu’en 2009.

Dates : 2005-

Objectifs

TELMA –Traitement électronique des manuscrits et des archives– est une collection de l’IRHT, dédiée aux éditions critiques électroniques et à la publication de répertoires numériques de sources médiévales. Née en 2005 comme un centre de ressources numériques du CNRS en collaboration avec l’École nationale des Chartes, TELMA est devenu en 2009 une plate-forme de services (de l’aide et conseil jusqu’à la réalisation entière du corpus) et de diffusion (avec respect des normes et standards, interopérabilité entre les corpus et archivage pérenne des données). Son objectif est de mettre en ligne, à la disposition de la communauté scientifique, des corpus de sources et les instruments de recherche nécessaires à leur exploitation.

TELMA met à la disposition des chercheurs qui le souhaitent une expertise et des outils, afin de les aider à produire eux-mêmes des corpus édités et des outils d’érudition, de manière ergonomique et intuitive, en fonction des besoins et des nécessités des enquêtes.   La structure des corpus publiés est conçue avec les chercheurs, en suivant un modèle TEI de manière assez libre.

Un conseil scientifique valide et encadre désormais les projets en cours de publication ainsi que les choix techniques et scientifiques de la plate-forme. En 2017-2018, l’infrastructure technique mise en place en 2005 et revue en 2010-2011 a été complètement mise à jour (par G. Porte) pour favoriser l’interopérabilité des données. A cette occasion, plusieurs séries ont été constituées et les corpus de la série « Sources Diplomatiques » ont été rapprochés davantage encore pour des interrogations croisées plus fructueuses.

 

Résultats

Série « Sources Diplomatiques »

  • Chartae Galliae – base de données consacrée aux actes écrits relatifs à la France (dans ses frontières actuelles) jusqu’à la fin du XIIIe siècle, éd. B. Tock (UStrasbourg) http://www.cn-telma.fr/chartae-galliae
  • Chartes originales antérieures à 1121 conservées en France, base de données qui présente le texte, et bientôt les reproductions photographiques, de l’ensemble des chartes originales antérieures à 1121 conservées en France. La base de données permet la recherche des actes en fonction de leur auteur, de leur bénéficiaire et la recherche lexicale. Ed. CRULH, U. Lorraine. http://www.cn-telma.fr//originaux/index/
  • Chartes originales (1121-1220) conservées en France : Dans la continuité du projet « chartes originales antérieures à 1121 conservées en France », l’équipe de l’Axe Diplomatique du CRUHL a souhaité mettre à disposition des chercheurs les actes originaux produits entre 1120 et 1220 actuellement conservés en Lorraine. . Ed. CRULH, U. Lorraine. http://www.cn-telma.fr//originaux2/index/
  • Cartulaire de Nesle : cartulaire laïque de la seigneurie de Nesle (Côte-d’Or, arr. Montbard, cant. Laigne) est conservé au Musée Condé à Chantilly (série GB, XIV F 22). Ed. X. Hélary (CIHAM). http://www.cn-telma.fr//nesle/index/
  • Actes royaux – dans le cadre du Corpus Philippicum, la présente édition intègre des actes de Philippe III et de Philippe IV encore inédits, aussi bien en analyses qu’en éditions. A ce noyau initial, viendront s’ajouter d’autres éditions d’actes royaux au fur et à mesure de l’avancement des travaux des chercheurs. Ed. Corpus Philippicum, IRHT. http://www.cn-telma.fr//actesroyaux/index/
  • Ordonnances de l’Hôtel – dans le cadre du Corpus Philippicum, édition d’ordonnances inédites du registre JJ 57 du Trésor des chartes – Ed. Corpus Philippicum, IRHT – http://www.cn-telma.fr//ordonnances/index/
  • Enquêtes menées sous les derniers Capétiens – toujours dans le cadre du Corpus Philippicum, près de 150 enquêtes administratives datant du règne des derniers Capétiens. Notamment de Philippe IV le Bel avec quelques textes du règne de Philippe III et quelques textes datant des règnes des fils de Philippe IV. Ces enquêtes du Corpus Philippicum furent copiées dans la plupart des fonds d’archives de France. Il ne s’agit ici que d’un échantillon de l’ensemble des copies réalisées. Ed. Corpus Philippicum, IRHT. http://www.cn-telma.fr//enquetes/index/
  • Testaments royaux – édition de testaments royaux français édités et inédits. Ed. Corpus Philippicum. A paraître, 2018.
  • APOSCRIPTA database – Lettres des papes [telles qu’elles sont connues par leurs destinataires et non par les registres pontificaux, des origines à nos jours] (Ed. Julien Théry, CIHAM, 2018, en cours de publication).
  • Inventaire sommaire des chartes de la collection Moreau, BnF (Ed. Benoît-Michel Tock, U. Strasbourg, 2018, en cours de publication)
  • Projet « Bullaire franciscain » et « documentation franciscaine concernant l’Orient et la ‘‘Terre sainte’’ », Ed. I. Heullant-Donat, Université de Reims, CERHIC-EA 2616, 2016-2018, en cours de mise en ligne.
  • Ethiopian Manuscripts Archive : Un ensemble de textes issus des archives manuscrites du royaume chrétien d’Éthiopie. Cette édition est un projet collectif mené par des historiens et philologues travaillant sur la documentation manuscrite produite par le royaume chrétien d’Éthiopie entre le xe et le xxe siècle. Ed. A. Wion (IMAF). En cours de publication.

Série « Outils et Répertoires »

  • CartulR – Répertoire des cartulaires médiévaux et modernes – Répertoire évolutif de plus de huit mille cinq cents cartulaires manuscrits français médiévaux et modernes. Ed. P. Bertrand (IRHT-UCLouvain) – http://www.cn-telma.fr//cartulR/index/
  • Catalogue de manuscrits liturgiques médiévaux et modernes – Ce répertoire propose une série de notices de manuscrits liturgiques conservés en France, notamment ceux qui ne figurent pas dans les catalogues du chanoine Leroquais. Ed. J.-B. Lebigue (IRHT) – http://www.cn-telma.fr//liturgie/index/
  • Luxury Bound – corpus de près de 3700 manuscrits illustrés aux anciens Pays-Bas au Bas Moyen Âge, qui a été compilé, entretenu et mis à jour dans une base de données dans les années 1997-2010, éd. H. Wijsman (IRHT) http://www.cn-telma.fr//luxury-bound/index/
  • Base de données « Légendiers » (IRHT –Soc. Bollandistes –UNamur), 2015-2018, à mettre en ligne.
  • Leges Populi Romani : LEPOR (LEges POpuli Romani) est une base de données en cours d’élaboration qui, lorsqu’elle sera achevée, comprendra environ 880 notices, dont chacune sera consacrée à une loi comitiale du peuple romain. Ed. J.-L. Ferrari (AIBL).

Série « Textes »

  • Fruit d’une collaboration étroite entre spécialistes des textes antiques et spécialistes de l’iconographie gréco-romaine, la base CALLYTHEA met à disposition du public des textes poétiques de l’époque hellénistique, d’accès parfois difficile, qui évoquent ou relatent un épisode mythologique. Ed. ANR CAIM http://www.cn-telma.fr//callythea/index/
  • Le statut légal des minorités religieuses dans l’espace euro-méditerranéen – base de données des textes normatifs relatifs au statut juridique des minorités religieuses dans les sociétés chrétiennes et islamiques médiévales. Ed. projet européen RELMIN, John Tolan, U. Nantes. http://www.cn-telma.fr//relmin/index/
  • Lettres d’Yves de Chartres (Ed. Geneviève Giordanengo, 2018), à paraître en 2018.

Huma-Num participe à une table-ronde autour de ses consortiums à DHNord 2018

Huma-Num - 26 Septembre, 2018 - 09:43

Les 15 et 16 octobre prochains aura lieu le colloque annuel DHNord organisé par la Maison Européenne des Sciences de l’Homme et de la Société (MESH) de Lille, en partenariat avec l’association Humanistica. Cette année, la thématique choisie est celle des « Matérialités de la recherche en sciences humaines et sociales », le programme est consultable ici et
L’intégralité de ce colloque sera enregistré.

Dans ce cadre, la TGIR Huma-Num a été conviée à coordonner une table-ronde impliquant plusieurs de ses consortiums et intitulée « Les consortiums: quelles interactions dans l’environnement d’une Très grande infrastructure de recherche? »

Celle-ci aura lieu le lundi 15 octobre de 10h45 à 12h30. 

Elle sera modérée par Adeline Joffres (TGIR Huma-Num) et accueillera les interventions de Thomas Lebarbé (Université Grenoble-Alpes) pour le consortium Cahier, de Mehdi Chayani et de Xavier Granier (Université Bordeaux Montaigne) pour le consortium 3D-SHS; et de Caroline Abela (Centre Regards CNRS – UMR 5319 Passages) pour le consortium ImaGEO.  

D’Autrice à Zlataner : enrichissement linguistique et exploration des sites de presse dans les archives de l'internet à la Bibliothèque nationale de France (2010-2017)

Calenda / Digital humanities - 26 Septembre, 2018 - 00:00
Lors de la demi-journée d'étude du lundi 15 octobre, la Bibliothèque nationale de France (BnF), l'équipe Représentation des connaissances et langage naturelle du Laboratoire d'informatique et de Paris Nord (LIPN-RCLN) de l'université Paris XIII et le laboratoire Linguistique, langues, Parole (LILPA) de l'université de Strasbourg présenteront les principaux résultats du projet Néonaute. Ce projet, soutenu par la Délégation générale à la langue française et aux langues de Franc (DGLFLF) dans le cadre de l'appel à projet 2017 « Langues et numérique », vise à doter les observateurs de la langue française d’un moteur de recherche s'appuyant sur la collection « Actualités » du dépôt légal du web conservée à la BnF depuis 2010.

Connaître les dénaturalisés de Vichy

Calenda / Digital humanities - 26 Septembre, 2018 - 00:00
Les Archives nationales organisent le 2 octobre 2018 une journée d'étude sur le site de Pierrefitte-sur-Seine autour des retraits de nationalité opérés par le régime de Vichy. Depuis l'achèvement de la base de données Dénat, un corpus exhaustif d'individus frappés par la dénaturalisation est disponible pour les chercheurs. Plusieurs intervenants aborderont les exploitations variées qui peuvent être faites de cette base et des riches dossiers de demande de naturalisation auxquels elle donne accès. La journée se cloturera sur la projection du film Natan, le fantôme de la rue Francœur, qui retrace le parcours de Bernard Nathan, touché par cette mesure et déporté.

Scriptorium.be

Huma-Num - 21 Septembre, 2018 - 07:59

Scriptorium.be : base de données bibliographiques de la revue Scriptorium et du Bulletin codicologique, bibliographie courante des études relatives aux manuscrits médiévaux d’Europe

Scriptorium.be est la base de données bibliographiques de la revue Scriptorium, principale revue internationale relative aux manuscrits médiévaux d’Europe, et de sa partie bibliographique, le Bulletin codicologique, bibliographie courante recensant les publications scientifiques (articles de revue, monographies, ouvrages collectifs, catalogues et inventaires de manuscrits, catalogues d’exposition, etc.) publiées sur les manuscrits médiévaux depuis 1959. Mis en ligne en 2004, elle contient actuellement les données bibliographiques de plus de 26.000 publications signalées dans le Bulletin codicologique entre 1975 et 2017. 

Les utilisateurs peuvent effectuer des requêtes soit par mots clés sur un ou plusieurs champs (auteur, éditeur scientifique, titre, titre de revue, année d’édition, ISBN, etc.), soit par cote de manuscrit (ca 260.000 cotes encodées provenant des index des manuscrits cités dans Scriptorium et dans le Bulletin codicologique).

La base de données est gérée par le Centre International de Codicologique (CIC) ASBL (Groupe de contact « Codicologie » du FNRS) hébergé à la Bibliothèque royale de Belgique à Bruxelles.

Objectifs du soutien de COSME

Depuis 2013, le soutien du Consortium Sources Médiévales a pour objectif de :

  • Poursuivre l’encodage rétrospectif des anciens numéros du Bulletin codicologique (environ35.000 publications recensées entre 1959 et 2000) et des cotes de manuscrit.
  • D’améliorer l’interface de recherche et le système de gestion de la base de données SQL.
  • D’encoder les données bibliographiques des articles parus dans la partie Scriptorium (1946-2017).

Résultats et perspective d’achèvement

Entre 2013 et 2017, les différents techniciens engagés dans le cadre du projet ont permis d’avancer significativement dans l’encodage. 15.030 publications tirées Bulletin codicologique et 20.279 cotes de manuscrits ont été introduites dans la base de données. Les années 1983-2000 et 1976-1978 ont été complétement couvertes. Il reste environ 20.500 notices à encoder (+/- 205 jours d’encodage). Pour 2018, l’objectif est de réaliser la refonte complète de Scriptorium.be et d’encoder l’ensemble des articles de la partie Scriptorium.

Site web : www.scriptorium.be

Recherche par cote de manuscrit : http://www.scriptorium.be/search_manuscript.php

Recherche par mots-clés : http://www.scriptorium.be/search_review.php

Les cotes des manuscrits : construire un référentiel commun

Huma-Num - 21 Septembre, 2018 - 06:49

Groupe de travail « Alignement des cotes de manuscrits » – 
Responsable : François Bougard (IRHT)

Le groupe de travail sur les cotes des manuscrits médiévaux et modernes se fixe pour objectif d’œuvrer à un meilleur repérage de cet élément d’identification essentiel des volumes qu’est la cote qui leur est assignée par les établissements de conservation (bibliothèques, archives, musées). L’enjeu est d’abord quantitatif étant donné le grand nombre de témoins. Mais il s’agit surtout de faire en sorte d’éliminer les ambiguïtés qui dérivent de l’hétérogénéité des libellés et surtout de leur côté changeant. Un même manuscrit peut avoir reçu pas moins d’une demi-douzaine d’appellations différentes en des temps récents, sans parler bien sûr de la stratigraphie des cotes anciennes antérieures au dépôt dans les fonds actuels. Cette diversité a pour effet que les recherches liées aux différents manuscrits sur internet ne donnent souvent que des résultats partiels et décevants, faute de pouvoir établir des liens faciles entre des informations pourtant disponibles.

La construction d’un référentiel commun passe par une opération d’alignement des cotes entre les différentes bases de données nationales et internationales. L’ÉquipEx Biblissima réalise ce travail pour les bases dont elle met en œuvre l’agrégation des données. La plupart de celles de l’IRHT sont concernées (Bibale, Initiale, Jonas, Fama, Pinakes, Iter liturgicum Italicum), et leur alignement se règle sur celui de la base Medium, répertoire informatisé centralisé des manuscrits reproduits ou recensés par l’IRHT, qui sert de réservoir commun.

COSME, de son côté, soutient depuis plusieurs années l’alignement non seulement des cotes mais aussi des établissements de conservation de la base scriptorium.be, qui rassemble les informations bibliographiques relatives à chaque manuscrit depuis la création de la revue homonyme en 1946 (Scriptorium. Revue internationale des études relatives aux manuscrits, est commune à la Bibliothèque royale de Belgique et à l’IRHT ; elle publie chaque année deux fascicules complémentaires du Bulletin codicologique, sous les auspices du Centre international de codicologie). Depuis l’été 2017, scriptorium.be est hébergé sur les serveurs de l’IRHT à Orléans, ce qui facilite le travail. Il s’agit d’une opération de longue haleine, qui concernera à terme 263 000 cotes et 35 000 références bibliographiques.

De même, COSME a soutenu la mise en place d’un outil de « recherche floue », qui permet de se libérer de la contrainte des points, des espaces ou de l’ordre dans le libellé des éléments constitutifs de la cote. Il s’agit pour l’instant d’une amélioration pour la consultation et la gestion interne des différentes bases et surtout de Medium.

En 2018 et 2019, le groupe de travail sur les cotes poursuit le soutien à l’alignement des informations de scriptorium.be (récupération et traitement des données de manière rétrospective selon le rythme de parution de la revue). Il élargit les opérations d’alignement des cotes vers d’autres « réservoirs », de façon à améliorer leur accessibilité. Un accord est en cours de finalisation avec les éditions Brepols pour les cotes des manuscrits renseignées dans la Bibliographie du Moyen Âge tardif (BAMAT, 26 fascicules parus depuis 1991, appelée à devenir eBAMAT) et dans l’incipitaire latin In Principio (un million d’entrées) : le but est d’offrir une clé d’entrée à ces stocks d’information par cote, en intégrant chacune d’elle, alignée, dans la base Medium, avec le lien correspondant.

Le travail de longue haleine sur les cotes s’inscrit aussi dans la réflexion internationale sur la mise au point d’un identifiant unique pour les manuscrits (ISMI : International Standard Manuscript Number). Ce projet, évoqué lors de trois rencontres à Paris en 2017 et 2018, est encore embryonnaire et suscite de multiples discussions. Il débouchera peut-être sur la mise au point d’une norme internationale ISO, comparable à celle qui existe pour l’ISBN et l’ISSN.

Membres du groupe :

François Bougard (IRHT),

Mickaël Lefèvre (KBR)

Cyril Masset (IRHT)

Véronique Trémault (IRHT)

Récits d’expériences d’un archivage sur le long terme, 21 septembre, CINES

Huma-Num - 17 Septembre, 2018 - 18:58
Le CINES (Centre Informatique National de l’Enseignement Supérieur et de la recherche) est un établissement public à caractère administratif national, placé sous la tutelle du ministère chargé de l’Enseignement supérieur et de la Recherche....

Huma-Num Bar : calendrier des séances 2018-2019

Huma-Num - 14 Septembre, 2018 - 09:59

Photo : S. Pouyllau

Huma-Num reprend cette année ses réunions d’information à destination des enseignants-chercheurs, ingénieurs, documentalistes et bibliothécaires qui se lancent ou participent à des projets numériques en SHS. Dans une atmosphère conviviale — le Huma-Num Bar accueille une fois par mois, pendant 2 heures, ceux qui souhaitent découvrir et travailler avec les services et communautés d’Huma-Num. L’équipe présentera les possibilités offertes par les services numériques d’Huma-Num et répondra aux questions des porteuses et porteurs de projets. Un certain nombre de séances peut être thématique afin de répondre au plus près aux besoins des porteuses et porteurs de projet.

Le calendrier des séances est le suivant :

  • lundi 8 octobre (thématique ERC)
  • vendredi 7 décembre
  • mardi 8 janvier
  • vendredi 8 février
  • vendredi 8 mars
  • lundi 8 avril (thématique pour l’ANR 2019)
  • mercredi 8 mai
  • lundi 10 juin
  • lundi 8 juillet (sous réserve)

Ces séances ont lieu à la fois en présentiel, dans le forum de la Bibliothèque-Laboratoire de la Fondation Maison des sciences de l’homme (FMSH, 54, Bd Raspail 75006 Paris, 1er étage) et sont retransmise en direct sur CanalU pour celles et ceux qui souhaiteraient participer à distance.

Prochaine séance, le 8 octobre 2018. Sur place, le nombre de places étant limité, merci de bien vouloir vous inscrire en envoyant un email à hnbar@huma-num.fr.

Informations générales sur les services Huma-Num :
Site web : https://www.huma-num.fr/services-et-outils
Base de connaissance : https://documentation.huma-num.fr.

Huma-Num à l’université Paris Diderot-Paris 7

Huma-Num - 4 Septembre, 2018 - 06:50

Le Pôle Image – Centre de ressources dédié à l’image et au numérique en Sciences Humaines de l’université Paris Diderot – Paris 7 a invité la TGIR Huma-Num à venir présenter ses services lors d’une matinée d’information le 10 octobre 2018 de 10h à 12h30. L’inscription se fait en ligne la présentation aura lieu dans l’amphithéâtre Turing de l’université Paris Diderot-Paris 7, 8 Place Aurélie Nemours, Paris 13e.

Le Pôle Image est une plateforme humaine et technique destinée à servir quatorze laboratoires en géographie, histoire et anthropologie et dédiée à la donnée numérique et à l’image comme objet d’étude dans le secteur des sciences humaines et sociales (SHS).

Kit de survie en milieu numérique pour l’étudiant en sciences humaines et sociales

Calenda / Digital humanities - 4 Septembre, 2018 - 00:00
Cette troisième édition de cette journée de formation est conçue comme une initiation à des ressources et à des outils numériques pour la recherche en sciences humaines.

Enseignement/apprentissage de langue de spécialité, professionnelle ou générale : quels besoins, objectifs, approches et supports ?

Calenda / Digital humanities - 29 Août, 2018 - 00:00
L’objectif de cette journée d'étude est d’engager une réflexion pédagogique et scientifique en lien avec l’enseignement/apprentissage des langues dans l’enseignement supérieur. Cette journée d’étude sera aussi l’occasion d’approfondir la réflexion collective autour des différents enjeux sociaux, économiques et pédagogiques de l’enseignement des langues au vingt-et-unième siècle.

Corpus épigraphique bourguignon

Huma-Num - 27 Août, 2018 - 17:32

Responsables Eliana Magnani (CNRS – LaMOP), Estelle Ingrand-Varenne (CNRS – CESCM)

Avec le soutien de COSME2, deux équipes partenaires supportant des programmes de recherches consolidés, le Corpus des Inscriptions de la France Médiévale (CIFM) et le Corpus Burgundiae Medii Aevi (CBMA) ont mis en place le projet commun de réalisation du « Corpus épigraphique bourguignon ».

En 2018, les inscriptions épigraphiques du VIIIe au XIIIe siècle, publiées entre 1997 et 2000 dans les volumes 19 (Jura, Nièvre, Saône-et-Loire), 20 (Côte-d’Or) et 21 (Yonne) du Corpus des Inscriptions de la France Médiévale ont été extraites, corrigées et complétées par les inscriptions répertoriées par l’équipe d’épigraphistes poitevins mais qui demeuraient inédites, notamment celles des XIIIe, XIVe et XVe siècles[1]. Par ce travail préliminaire à l’intégration des textes à la base des données des CBMA, 1 418 inscriptions en latin et en français ont été réunies (417 publiées et 947 inédites)[2]. Le traitement de cet ensemble (dont sa lemmatisation), alors qu’il pose la question des corpus plurilinguistiques, figure parmi les chantiers qui seront développés dans les prochains mois.

[1] R. Favreau, J. Michaud, B. Mora, Jura, Nièvre, Saône-et-Loire, Paris, 1997 (Corpus des inscriptions de la France médiévale, 19) – http://www.persee.fr/doc/cifm_0000-0000_1997_cat_19_1 ; Id., Côte-d’Or, Paris, 1999 (Corpus des inscriptions de la France médiévale, 20) http://www.persee.fr/doc/cifm_0000-0000_1999_cat_20_1; R. Favreau, J. Michaud, Yonne, Paris, 2000 (Corpus des inscriptions de la France médiévale, 21) – http://www.persee.fr/doc/cifm_0000-0000_2000_cat_21_1.

[2] L’extraction des textes et des métadonnées à partir des volumes océrisés disponibles en ligne, a été réalisée par Pierre Brochard (CNRS-LaMOP). Aurore Menudier (CESCM-Poitiers, avec le soutien de COSME2) a assuré la révision et a complété le corpus.

Les ateliers du groupe « Lemmes »

Huma-Num - 27 Août, 2018 - 17:17

Groupe de travail « Lemmes » – responsable Eliana Magnani (CNRS -LaMOP)

Le groupe de travail « Lemmes » s’est donné pour objectif initial l’aide au développement des outils de lemmatisation des langues médiévales (latin, français, anglais…) et l’incitation à la diffusion des corpus textuels lemmatisés. En effet, encore très peu connue et pratiquée par la communauté des historiens médiévistes, cette opération fondamentale à toute approche des grands corpus est pourtant indispensable dans le cas des langues médiévales très flexionnées et à très grande variation orthographique.

Quatre équipes françaises partenaires de COSME2 (Biblissima, EnC, IRHT, LaMOP) ainsi qu’une équipe allemande (Univ. de Francfort) qui s’est également associée aux travaux du groupe, développent actuellement des « tagueurs » et/ou des paramètres pour des tagueurs préexistants. Avec d’autres partenaires (comme le CESCM), ces équipes diffusent aussi des corpus textuels lemmatisés ou en projet de lemmatisation.

Le groupe de travail compte réunir un à deux ateliers par an pour décider en commun et mettre en œuvre son activité.

Dans ce cadre, le premier atelier (novembre 2017[1]) visait à faire le bilan des outils existants, des points d’achoppement des applications et des orientations et actions à développer. Différents « lemmatiseurs » ont été présentés : Collatinus (Y. Ouvrard, Ph. Verkerk), Pandora (J.-B. Camps), CompHistSem (T. Geelhaar), OMNIA (R. Alexandre), PALM (M. Aouini, C. Fletcher, A. Mairey), avec le constat que, quels que soient leurs objectifs (pédagogiques, lexicographiques, textométriques) ou leurs structures (lexique plus entrainement ; réseau de neurones), tous les outils (tagueurs et/ou paramètres) présentés sont estimés performants à environ 90% (±5%). Ce sont donc les 5-15% d’erreurs qui demandent réflexion, comme la reconnaissance des noms propres (personnes et lieux) qui figurent parmi les erreurs récurrentes d’étiquetage. Par ailleurs, il est apparu nécessaire de réaliser l’évaluation systématique et comparative des outils de lemmatisation.

Le deuxième atelier  (juin 2018[2]) s’est articulé autour de ces points : la présentation de deux recherches doctorales sur les entités nommées (M. Auoini, S. Torres), du projet « Opera latina » du LASLA (Univ. de Liège) (D. Longrée, M. Fantoli) et la discussion sur les modalités à adopter pour l’évaluation des outils de lemmatisation. Les débuts des tests donneront l’occasion à la tenue d’un troisième atelier (décembre 2018).

Le groupe s’est engagé également à développer des activités de diffusion (tableau comparatif de la structure des outils et paramètres de lemmatisation) et de formation, à mettre en place à partir de 2019.

[1] Voir le programme : Étaient présents à cet atelier : Renaud Alexandre, Mourad Aouini, Pierre Brochard, Jean-Baptiste Camps, Chris Fletcher, Simon Gabay, Łukasz Gagala, Tim Geelhaar, Jean-Philippe Genet, Marlène Helias-Baron, Estelle Ingrand-Varenne, Fabrice Jejcic, Anne-Françoise Leurquin, Eliana Magnani, Aude Mairey, Yves Ouvrad, Nicolas Perreaux, Coraline Rey, Evgeniya Shelina, Sergio Torres, Philippe Verkerk.

[2] Voir le programme : Étaient présents à cet atelier : Renaud Alexandre, Mourad Aouini, Bruno Bon, Olivier Canteaut, Thibault Clérice, William Diakité, Margherita Fantoli, Simon Gabay, Christopher Geekie, Jean-Philippe Genet, Dominique Longrée, Eliana Magnani, Aude Mairey, Krzysztof Nowak, Yves Ouvrard, Nicolas Perreaux, Coraline Rey, Michał Rzepiela, Sergio Torres, Philippe Verkerk.

« Rétro-numérisation de documents historiques et partage dans le Web sémantique : l’exemple de la lexicographie » – Atelier de formation annuel du consortium CAHIER – Compte-rendu synthétique

Huma-Num - 23 Août, 2018 - 10:53
Dates : 26 au 29 juin 2018 Lieu : Université Paul-Valéry Montpellier L’atelier de formation annuel de CAHIER s’est tenu cette année à Montpellier, dans les locaux de l’Université Paul Valéry, sur trois jours et demi, du 26 au 29 juin. L’édition de cette année a été dédiée à la rétro-numérisation de documents historiques, et plus particulièrement à la constitution de corpus lexicographiques. Le programme complet est consultable ici : https://cahier.hypotheses.org/3640 Dans le cadre de l’implication de la TGIR Huma-Num dans diverses activités d’infrastructure au […]

Les lundis numériques de l'Institut national d'histoire de l'art

Calenda / Digital humanities - 17 Août, 2018 - 00:00
L’Institut national d'histoire de l'art (INHA) effectue depuis plusieurs années une veille active dans le domaine des humanités numériques avec un accent porté sur ce qui touche au domaine visuel. De nombreux contacts et échanges sont régulièrement établis entre les différentes composantes de l’établissement et diverses équipes sur des problématiques et des projets concernant les enjeux, les représentations, les aspects techniques ou les questions juridiques liées à l’histoire de l’art et à l’image.

Youtubeurs : invention d’une énonciation subjective ?

Calenda / Digital humanities - 10 Août, 2018 - 00:00
La revue Études Digitales prépare un numéro consacré aux youtubeurs et youtubeuses dans leurs modalités d'expression. Ce dossier propose de constituer le premier ensemble interdisciplinaire de travaux en langue française sur les youtubeurs et les youtubeuses. Il articulera approches socio-économiques, sociologiques, esthétiques, sémiologiques et communicationnelles, anthropologiques et ethnographiques, voire économiques et historiques, pour saisir les enjeux et les textures de cette « nouvelle » forme de communication digitale.

Views from inside the linked Open Data (LOD) cloud

Calenda / Digital humanities - 8 Août, 2018 - 00:00
Linked Pasts is an annual symposium dedicated to facilitating practical and pragmatic developments in Linked Open Data (LOD) in History, Classics, Geography, and Archaeology. It brings together leading exponents of Linked Data from academia, the Cultural Heritage sector as well as providers of infrastructures and library services to address the obstacles to, and issues raised by, developing a digital ecosystem of projects dedicated to interlinking online resources about the past.

Les présentations des Rencontres Huma-Num 2018

Huma-Num - 3 Août, 2018 - 09:54

La très grande infrastructure de recherche Huma-Num a organisé du 11 au 14 juin 2018 ses deuxièmes Rencontres. Elles ont permis à une centaine de participants et de partenaires des communautés de recherche, d’institutions et d’infrastructures de recherche d’échanger sur le domaine des humanités numériques et des SHS à l’ère numérique.

L’objectif des Rencontres est de créer un espace de rencontre entre les consortiums et services d’Huma-Num, les Maisons des Sciences de l’Homme et les partenaires français et internationaux de la communauté des Lettres, Sciences Humaines et Sociales.

Photo : S. Pouyllau

Cette deuxième édition a porté sur :

  • Présenter les travaux et réalisations majeures des consortiums d’Huma-Num.
  • Échanger entre consortiums existants mais aussi avec les Maisons des Sciences de l’Homme et les autres partenaires d’Huma-Num.
  • Découvrir les nouveaux services développés par Huma-Num ainsi que les nouveaux développements des services et outils existants.
  • Discuter et travailler avec les partenaires européens impliqués dans les infrastructures de recherche DARIAHet CLARIN, et dans les projets H2020 Humanities at Scale et PARTHENOS.

Vous pouvez consulter et télécharger les présentations faites lors de cette édition 2018 sur le site des Rencontres : https://rhn2018.sciencesconf.org.

Lier recherche et formation professionnelle : des corpus à l’interface

Calenda / Digital humanities - 2 Août, 2018 - 00:00
L’objectif de cette journée d’étude se veut exploratoire et pluridisciplinaire. Il s’agit d’établir un état des lieux des pratiques de l’utilisation des corpus notamment multimodaux en formation professionnelle - que ce soit dans le domaine de la santé, de la rééducation du langage ou de la formation des enseignants de différentes disciplines -, d’identifier les besoins qui émergent chez les formateurs / formatrices dès lors que l’on envisage l’exploitation de corpus en formation de même que les freins qui peuvent exister à l’utilisation de ces mêmes corpus.

Pages