Un petit tour d'Allemagne des Digital Humanities - 2

Interview de Torsten Schaßan, Herzog August Bibliothek, Wolfenbüttel.

A la HAB, le 21 mars 2011.

Torsten Schaßan

Bonjour Torsten Schaßan. Nous sommes ici à Wolfenbüttel, merci beaucoup pour cette interview ! Peux-tu tout d'abord te présenter ainsi que tes activités pour les collègues français ?

Mon nom est Torsten Schaßan, je travaille à la Bibliothèque Herzog August (HAB) au département des manuscrits, mais l'activité qui est inscrite sur ma porte, c'est « Editions numériques » (digitale Editionen). Cela signifie qu'au sein de la HAB, je suis la personne référente sur à peu près tous les aspects qui concernent les données numériques qui sont produites par les collègues. Je conseille également les collègues pour qu'ils utilisent de bonnes méthodes de production de ces données - en particulier par l'application de la TEI ; je suis aussi en charge de l'exploitation de ces données produites par d'autres, de la publication des résultats, je dois vérifier que tout est fait de manière cohérente. Je peux faire le cas échéant des propositions d'amélioration... mais tout cela toujours sur le plan de la qualité des données, pas des contenus. Voilà ce que je fais ici.

Ce que je fais également, c'est d'assurer pour ainsi dire la formation continue des collègues : les aider à connaître XML, les conseiller sur des questions pratiques, les informer sur les moyens de travailler de manière efficiente, sur les outils qui existent, d'être au fait des standards... Nous avons notre propre définition, ou pour parler en langage TEI, notre propre customisation pour la description de manuscrits, une manière de documenter l'information pour nous-mêmes, et préparer ces schémas, cela aussi fait partie de mes tâches ici.

Donc tu interviens sur la gestion de projet, sur la qualité des données...

Sur la qualité des données, exactement.

D'accord. Il y a bien sûr beaucoup beaucoup de projets ici mais, à titre d'exemple, quels sont les éditions numériques ou les corpus dont tu t'occupes actuellement ?

Je travaille donc au département des manuscrits, et nous avons des projets ici qui produisent des données XML : le projet de catalogage des manuscrits, qui travaille avec le module Manuscript Description de la TEI, dont je m'occupe, mais il y a aussi toute une palette de projets d'éditions en cours dans la maison, de nature très différente, tant dans leurs objectifs que dans leurs matériaux sources. Par exemple, nous venons de terminer un projet d'édition électronique d'archives sur la vie et l'œuvre de Peter Paul Rubens. Cela est lié au fait que la HAB a acquis une bonne réputation en Allemagne en ce qui concerne l'édition numérique, et qu'un chercheur qui a travaillé sur Rubens a mis ses archives à notre disposition. Il a produit une édition traditionnelle de ces archives, il nous les a données, et nous les avons transformées en édition électronique (http://diglib.hab.de/edoc/ed000083/startx.htm). Nous avons fait des choses comme lier des ressources entre elles, standardiser les noms propres en les liant au PND- le PND, Personennamendatei est un standard pour identifier les personnes et harmoniser les formes des noms, comme le VIAF tu sais ? Le Virtual International Authority File (http://viaf.org/).

Des listes d'autorités...

Exactement. Il s'agit donc d'organiser cette normalisation et de numériser toutes les sources qui sont à notre disposition et de les rendre accessibles sous forme d'édition numérique sur le portail web de la HAB. Voilà l'un des projets.

Un autre projet concerne les travaux que l'on appelle les Magdeburger Centurien, les premiers écrits historiques protestants sur l'Eglise. Ceux qu'on appelle les Centuriators, donc les auteurs de ces écrits, ont travaillé à différents endroits, à Bâle, à Weimar, dans différents endroits, et ils ont échangé des lettres. Ils se sont envoyés ces textes les uns aux autres avec des commentaires en regard, « peut-être faudrait-il changer ceci ou cela », et donc nous avons non seulement les textes imprimés, les Magdeburger Centurien eux-mêmes, mais aussi les sources de la constitution de ces écrits, les communications qui ont eu lieu sur ces travaux...

les débats entre eux

oui, les débats, ce qui est important du point de vue des Centuriators, qu'ils veulent changer dans les textes... Le débat fut très vif et ces lettres, cette phase préparatoire manuscrite des Centurien - qui eux ont été finalement imprimés - est également produite sous forme d'une édition électronique, à savoir que les lettres sont par exemple liées par des registres, que des mots-clés sont ajoutés aux lettres et que le contenu de ces lettres est transcrit. Donc nous avons là un mélange de matériaux de lettres, de manuscrits et de tas de choses différentes. Le module genetic edition n'est pas encore dans TEI et nous ne l'utilisons pas encore dans ce cas précis, mais en fait avec cette manière de travailler, nous voyons comment les textes évoluent, où sont les annotations dans les lettres, comment tous ces éléments tiennent ensemble. Voici donc encore un projet où il est question par exemple actuellement de lier les lettres, les registres des lettres et les transcriptions des lettres, de les montrer en parallèle.

Un troisième projet porte sur les travaux de traduction de Lessing. Lessing fut très actif en tant que traducteur de littérature en langues étrangères vers l'allemand, et ce projet travaille à exposer en parallèle le texte en langue originale et la traduction de Lessing, à souligner les concepts importants de part et d'autre, et à de mettre en évidence les relations entre ces textes. Et nous avons donc là un troisième aspect de l'information.

Un autre projet encore auquel j'ai travaillé et que j'ai conçu est une édition critique dans un sens très classique, mais qui pose des problèmes particuliers en ce qu'il s'agit d'un palimpseste. Il y a donc plusieurs textes l'un sur l'autre : comment doit-on organiser les transcriptions, quels rapports entretiennent ces textes entre eux, comment ces sources complexes doivent-elles éditées électroniquement avec les images, les différentes transcriptions, les traductions, la littérature secondaire, comment cette édition fonctionne en tant qu'ensemble complexe, quelle visualisation proposer ? Voilà un autre projet. Et avec cela je crois que nous avons couvert à peu près tous les types de projets que nous menons ici à la bibliothèque.

Et tous les projets sont en ligne ?

Aussi... Il y a un gros penchant ici pour le travail traditionnel. C'est-à-dire que quasiment tous les projets donnent lieu à la fois à une édition imprimée et à une édition numérique. Dans le projet Rubens, l'édition imprimée existait préalablement, puisque comme je l'ai dit c'était le résultat des travaux d'un autre chercheur, pour son habilitation, et nous avons mis en ligne les matériaux dans un second temps. L'édition du palimpseste est exclusivement en ligne. Les Centurien donneront lieu dans tous les cas à une publication, mais on se dirige plus vers un travail scientifique, une monographie, que vers l'édition papier des sources elles-mêmes. Mais nous avons aussi des collègues qui travaillent de manière très traditionnelle. Par exemple les éditions du célèbre poète baroque et scientifique Martin Opitz se font de manière traditionnelle, on verra si dans le futur on peut obtenir quelque chose d'un peu plus électronique, et pas seulement papier. Mais on verra. Donc en règle générale, les projets ont les deux aspects simultanément, avec des choses imprimées et des choses électroniques.

D'accord. Une autre question était : avec qui travailles-tu ? Quels sont les autres métiers, les autres rôles nécessaires ici pour réussir à produire tout cela ?

Nous numérisons beaucoup les sources ici, ce qui signifie qu'en tant que membre du département des manuscrits, il fait aussi partie de mes tâches, entre autres choses, d'être en lien avec l'atelier photo, pour nous assurer notamment que la qualité des images est bonne, puis pour réaliser la finition, car une fois la numérisation effectuée, les images ne sont qu'une masse et on y a pas accès. Donc il s'agit, à l'étape suivante, de produire des descriptions des contenus, ou de lier les images aux descriptions de manuscrits que nous avons déjà, et de rassembler d'autres informations encore. Donc voilà pour les collaborations qui concernent la numérisation.

Naturellement, c'est toujours dans le même temps un travail en commun avec les restaurateurs : un manuscrit peut-il être numérisé ? Comment doit-il l'être ? Ce sont des aspects qui ont à voir avec la numérisation.

Ensuite, je travaille avec tous ceux qui travaillent électroniquement, en ce que je les conseille, que je les aide ou que j'effectue des post-traitements sur leurs productions numériques, donc cela dépasse les frontières du département des manuscrits : je travaille notamment avec le département de la recherche, avec le département des éditions. Nous travaillons ensemble, nous discutons car nous essayons de régler les problèmes collectivement, nous cherchons des solutions communes à nos problèmes spécifiques d'édition. Il y a donc un groupe de travail spécifique au sein de la maison, une communauté qui se réunit régulièrement pour discuter de ce type de questions. Voilà pour mes collaborations au sein de la maison.

A l'extérieur j'ai tout autant d'interlocuteurs également importants, comme par exemple la collaboration très active qui s'effectue au sein du consortium TEI pour continuer à développer le standard : lorsque nous résolvons un problème en interne, nous en faisons un retour dans la communauté TEI, lorsque nous cherchons soit à trouver une solution à travers des discussions ou en développant la TEI, nous essayons d'aboutir à quelque chose d'utile pour toute la communauté.

Et mon activité de formation ne se limite pas non plus à l'interne, car comme je suis en fait venu à la bibliothèque depuis un cursus universitaire, et comme j'aime enseigner, j'interviens dans de nombreux cursus de formation, dans des écoles d'été, des écoles de printemps, dans les universités, dans l'idée de transmettre tous ces savoirs liés à : comment encode-t-on les textes ? Comment peut-on décrire un manuscrit et ensuite comment organiser tout cela ? Comment utilise-t-on la TEI pour une édition ? Etc. Il y a par exemple une coopération officielle entre la HAB et l'Université de Erlangen pour un programme d'études intitulé SCRIPTO (http://www.mittellatein.phil.uni-erlangen.de/scripto/scripto_IV_en.html) où il s'agit de paléographie et de science des manuscrits au sens large : à Erlangen est dispensé un enseignement de paléographie, de science des textes, d'histoire des textes, d'histoire des manuscrits... Mais au cours de ce cursus, l'étudiant vient une semaine à Wolfenbüttel pour étudier les aspects électroniques : comment je fais une description en TEI, comment fonctionne XML, quels post-traitements puis-je appliquer à l'information ? L'enseignement de toutes ces techniques constitue donc une autre grosse partie de mon travail.

D'accord. Tu n'évoques pas les informaticiens ? Tu n'as pas vraiment de coopération avec des informaticiens ?

Le problème, c'est qu'il n'y a pas tant d'informaticiens que ça, déjà ici à la Bibliothèque. Bien entendu, j'ai affaire au département du système d'information (EDV), mais il est en charge de tout ce qui touche à l'infrastructure. Donc quand il s'agit de questions comme : de quel logiciel avons-nous besoin pour réaliser tel ou tel travail, alors bien sûr je parle avec le département EDV. Mais du côté des contenus scientifiques, il n'y a personne à la Bibliothèque soit vraiment en charge de ces questions, parce que le département du système d'information s'occupe de l'infrastructure et ne peut pas vraiment traiter des questions liées aux contenus scientifiques. Il n'y a que deux ou trois collègues qui collaborent au design du système lorsque nous voulons diffuser des textes dans la bibliothèque numérique. Il y a deux autres collègues, qui sont bibliothécaires : Thomas Stecker par exemple, le directeur de la bibliothèque, qui a bâti la bibliothèque numérique. Je travaille assez étroitement avec lui, car nous discutons de la manière dont nous voulons structurer les choses, dont nous voulons organiser la bibliothèque. Mais malheureusement, nous n'avons pas d'informaticien à qui nous pourrions nous adresser pour éclaircir certaines questions. Pour ces questions, nous devons nous tourner vers l'extérieur, sur des listes de discussion, comme la liste xsl ou la liste eXist, ou demander aux collègues qui dans d'autres institutions sont chargés de choses similaires... on échange via la voie hiérarchique la plus courte possible pour rechercher la manière dont certains problèmes doivent être réglés.

Et tu penses que ce serait bon d'avoir un informaticien dans l'équipe ou ça fonctionne ainsi ?

Pour certaines questions, on aurait éventuellement besoin d'un informaticien, dès lors qu'il est question par exemple de passage à l'échelle d'infrastructures. Mais en fait, nous n'avons pas été vraiment confrontés à ces problèmes car nous avons de grosses masses de données, mais ce sont essentiellement des images et la question de la capacité de stockage des serveurs et de la bande passante pour diffuser ces images, n'est en réalité pas une question pour laquelle on a vraiment besoin d'un informaticien. Et pour le travail directement lié aux contenus scientifiques, ou bien nous, avec ces trois collègues qui y travaillent, avons les compétences, ou bien nous essayons d'acquérir ces compétences à travers nos discussions. Pour la plus grande part des projets, nous avons trop peu de personnel en mesure de régler ces questions techniques. Dans le cadre d'une coopération avec l'Université de Göttingen, nous allons peut-être accueillir du personnel chargé de ce type de projets, et qui pourront peut-être nous aider encore davantage dans ce domaine.

Est-ce que cela signifie qu'il n'y a pas besoin de tant de travail de programmation, de développement que cela, finalement ?

Il y aurait sans doute assez de travail mais il n'y a pas assez de personnes qui sont en mesure de le faire. De plus pour nous, c'est une part relativement réduite de notre tâche. Nous plaçons en premier la production de ressources, par exemple le suivi des collègues et la présentation des résultats. Tout ce qui relève de la programmation est « relativement simple » entre guillemets. Mes qualités de design sont relativement limitées, peut-être serait-il nécessaire, pour présenter certaines informations, de faire appel à un designer ou d'acheter quelque chose. Cela aussi est une qualification qu'il faudrait avoir et que personnellement je n'ai pas. On peut certainement utiliser de l'aide extérieure. Mais le fait est qu'on doit véritablement prendre ces designers par la main, par exemple pour organiser l'utilisabilité des ressources, car la question de savoir comment sont rédigées les url de ces services ou de ces offres web - sont-elles vraiment citables ? leur structure est-elle vraiment intuitive ? ... ce sont des questions auxquelles en règle générale les designers ne sont pas du tout sensibles, alors que pour moi en tant que quelqu'un qui s'intéresse tant aux contenus qu'au côté technique, cela m'importe énormément. Quand parfois je discute avec des collègues d'autres institutions qui produisent ce genre de ressources, par exemple le « Marburger Handschriftencensus » (le répertoire des manuscrits établi à Marburg), que je vois que les url utilisent des identifiants xml comme 1, 2, 3, 4, 5... et que je leur demande si on ne pourrait pas rendre cela un peu plus intuitif, un peu plus centré sur l'utilisateur, on reçoit des réponses assez différentes. Donc la perception du fait que cela pourrait avoir du sens d'afficher un nom ou une signature ou quelque chose comme ça, plutôt que des nombres, cela n'est pas encore largement répandu. Il y a encore des disputes ou des discussions, y compris avec des collègues dans d'autres institutions.

Ma question suivante était : comment s'est transformé ton métier avec le passage au numérique ?

Mon métier, pas tant que cela, en ceci que j'ai toujours travaillé dans le numérique en fait, dès mes études. Au cours de mes études je commençais déjà à tester comment on pouvait utiliser les média numériques pour faire ce qu'on a à faire en tant que chercheur en lettres et sciences humaines (Geisteswissenschafter) : éditer des textes, représenter des sources. Concrètement je travaillais déjà avec la TEI durant mes études, j'ai expérimenté mes premières éditions numériques avec des collègues, c'était vraiment des premiers pas très simples car ça a commencé au milieu des années 90, où il n'y avait en particulier pas encore de XML, et où ces techniques étaient en train d'apparaître. Donc j'ai plutôt accompagné ces choses et peut-être, pour ce qui est de la TEI, je les ai développées. Bien sûr les choses se sont transformées autour de moi. Mais mon sentiment n'est pas que ces choses m'ont transformé, plutôt que nous nous sommes développés ensemble. Donc, en ceci que je suis historien à la base mais que je me suis retrouvé impliqué dans ce domaine des humanités numériques depuis longtemps, que c'est depuis toujours mon « chez-moi », mon métier ne s'est vraiment pas transformé. Nous avons bien entendu tenté de transformer le métier des historiens traditionnels et des philosophes traditionnels qui font des éditions, à travers par exemple les activités de transmission et d'enseignement dont je viens de parler.

Bien sûr, il faut rester au courant de l'état de l'art, quand certains développements apparaissent, arrivent à maturité et peuvent être utilisés en production, comme eXist (une solution d'autant plus intéressante qu'on peut la coupler à Lucene, qui offre un très bon index plein texte). Tout cela, ce sont bien sûr des choses que je dois apprendre, mais bon, je crois que la « formation tout au long de la vie » est un mot-clé de notre époque, et donc évidemment, j'en suis aussi.

Très bien ! Alors je dois modifier un peu ma question suivante : d'après toi, pour accompagner ces changement auprès des historiens ou des éditeurs traditionnels, comment les institutions académiques se transforment, ou devraient se transformer ?

Tout d'abord, c'est un fait qu'apparaissent actuellement dans de nombreuses institutions des formations, des cursus universitaires qui prennent en considération ces aspects du numérique. Ces cours apparaissent à Würzburg, à Trèves, dans de nombreux endroits encore, à Göttingen aussi... Cela signifie donc que visiblement, il y a dans de nombreux endroits et dans de nombreuses têtes une sensibilité au fait que quelque chose se transforme. Et d'autant plus avec Google et ce type d'initiative, se répand l'idée que ce qui n'est pas en ligne n'existe pas. En cela, le travail traditionnel se transforme donc factuellement déjà.

Dans le même temps, j'ai l'impression que les gens, les étudiants et les scientifiques, ont toujours le sentiment qu'ils peuvent continuer à faire comme avant : alors même lorsqu'ils utilisent des ressources numériques, ils ne les citent pas du tout en note de bas de page ou en remarque, parce qu'ils sont d'avis que ces ressources ne sont pas stables, qu'on ne peut pas les citer... « Je cite malgré tout l'édition imprimée !». Donc il y aurait des choses à changer sur l'acceptation, mais aussi parfois sur la structure des ressources numériques, afin qu'elles soient perçues comme citables, pérennes. Là il y a visiblement quelque chose à faire.

La deuxième chose, mais qui est du moins partiellement acceptée de plus en plus, y compris à travers certaines institutions de financement de la recherche, comme la Deutsche Forschungsgemeinshaft (DFG) par exemple, c'est le fait suivant : concrètement, tout le monde travaille avec le numérique. Mais la question est : comment travaille-t-on avec le numérique. Tout le monde utilise l'ordinateur, la plupart écrivent leurs textes avec Word et formatent leurs textes avec du gras et de l'italique et le retour chariot pour faire des paragraphes. Et très peu indiquent : ceci est un titre, ceci est une citation, ceci est une référence bibliographique, ceci a telle qualité sémantique,... Ce qu'XML, que la TEI, et que tous ces médias numériques rendent si intéressant, c'est justement le fait que je peux dire beaucoup plus sémantiquement. Je ne fais pas qu'écrire un texte cursif, mais j'ai un incipit, un explicit, telle ou telle sorte de texte, je peux relier des ressources entre elles, tel nom de personne, je peux aussi le relier à telle liste d'autorité. Je peux relier mes références bibliographiques avec l'OPAC, pour accéder peut-être à une numérisation...

Se demander comment travailler de manière effective et efficace pour ne plus seulement écrire un texte, mais écrire un bon texte, un texte structuré sémantiquement, un texte réutilisable, se sensibiliser à cela, au fait que quand j'écris un texte, je produis une ressource qui pourrait se retrouver quelque part sur le web, et qu'on aimerait bien pouvoir réutiliser, qu'on voudrait peut-être pouvoir citer, de laquelle on aimerait pouvoir tirer des éléments. Prendre conscience qu'on participe au web, qu'on participe à la productions des sources qu'on trouve sur le web... J'aimerais voir plus d'attention portée à ces questions, et je pense que les formations, même dans les institutions traditionnelles, pourraient ou devraient développer la sensibilité à ce qu'on fait. Qu'Internet n'est pas seulement quelque chose qu'on utilise, qu'Internet ne se résumé pas à « ce que je ne trouve pas avec Google n'existe pas », mais qu'on y contribue, et qu'on doit se dire : « Ok, si j'ai ce poste, alors je dois faire en sorte que ce que je produis, je le présente aussi de manière à ce que les autres puissent l'utiliser ». Il faut assumer plus fortement un rôle actif dans la production des ressources.

Cela nécessite bien sûr des techniques, et il est clair que ça pose problème car naturellement c'est une question de ressources. Et les gens qui travaillent de manière traditionnelle craignent que le travail numérique capte ces ressources. Cela est compréhensible. Mais bon, si on veut conserver ou se donner un avenir, il faut peut-être tout de même y réfléchir.

Une toute autre question était : les digital humanities sont-elles un sujet de débat et un champ d'expérimentation en Allemagne actuellement ? Y a-t-il une expression allemande pour digital humanities et si oui, a-t-elle exactement la même signification que l'expression anglaise ?

Si on parle d'institutionalisation, comme je l'ai dit il y a toute une série d'établissements qui écrivent sur le sujet, mais la chose s'appelle digital humanities. On trouve soit digital humanities, soit e-humanities, au sens de electronic, parfois aussi au sens de enhanced humanities :e-humanities est parfois utilisé comme concept, pas au sens d'humanités électroniques mais d'humanités enhanced, au sens où nous faisons les choses précisément de façon à les rendre réutilisables de nombreuses manières. Mais comme dit, c'est un problème que les ressources soient limitées, et les « traditionnalistes » et les « progressistes » si on peut le dire ainsi...

Les anciens et les modernes ?

Oui, parfois peuvent être amenés à s'affronter sur ces choses. C'est ce que Foucault en son temps à décrit avec la notion de paradigme. Il est clair que quand on est entré dans la discipline historique par la voie traditionnelle, on est dans le paradigme d'écrire des livres, de publier sous forme imprimée, de travailler d'une certaine manière. Et quand le paradigme évolue vers des applications électroniques, digitales, vers la technique XML, le développement logiciel, Internet..., alors naturellement apparaissent des conflits, des tensions, car on ne peut dépenser l'argent qu'une fois. Et c'est exactement ce qui se passe actuellement en Allemagne, dans de nombreux endroits. Par exemple sur la question du copyright, où les « traditionalistes » s'affrontent de manière particulièrement dure aux « progressistes » dès qu'il est question d'open access. L'affaire des google books a ouvert des fossés très grands, a provoqué un très grand conflit, dans lequel les éditeurs Allemands, ainsi que certains scientifiques, sont assez... oui, disons, agressifs. Ils sont sous pression car ils se sentent attaqués. C'est toute une cosmologie traditionnelle, un environnement traditionnel - sur la manière dont les livre sont fabriqués, dont le savoir apparaît... - qui est tout à coup en danger. Et là, ce sont de gros conflits qui jouent un rôle jusque dans la sphère politique et au sein des agences de financement de la recherche.

Et la science est ici ambivalente. D'un côté, on voudrait voir beaucoup d'expériences et de résultats scientifiques publiés rapidement sur le web, et on aimerait bien les utiliser, mais naturellement dans le même temps chacun aimerait bien être celui qui vend des livres et celui qui est lu, celui qui est cité... Il y a donc un conflit entre l'institution qui pousse plutôt à la plus grande publicité et la libre utilisation des connaissances, et les personnes, les individus qui disent : « Mais mon livre doit être publié, et personne ne doit le numériser ni le mettre sur le net ! » Ce sont souvent les mêmes personnes qui sont aussi les représentants des institutions, donc ce n'est pas simple.

Et tu dis que ça s'exprime jusque dans la sphère politique, dans les débats électoraux par exemple ?

Oui parce que bien sûr la politique est responsable du cadre législatif. La politique dit à quoi doit ressembler la loi sur le copyright, qui a le droit de numériser et de mettre en ligne quels livres et quand ou, à l'inverse, qui a le droit de retenir quelque chose, et combien de temps. Et bien sûr il y a des intérêts économiques purs et durs en jeu, des éditeurs, des sociétés d'exploitation des ressources. Les choses doivent rester protégées et on ne doit pas les numériser, et les contrats très stricts qui sont conclus avec les auteurs disent: « Nous publions le livre, donc nous possédons l'information ! ».

Et de l'autre côté il y a la science, les représentants de l'open access, qui disent : « Mais la science vit justement du fait que l'information s'échange rapidement, et cela fonctionne encore plus vite et encore mieux si nous le faisons sous forme électronique que si nous lisons des livres », ce que nous avons toujours fait et que nous ferons toujours, mais cela va bien au-delà de cela : il faut également que les informations soient accessibles. Là s'affrontent les intérêts économiques, comme les maisons d'éditions par exemple, et les intérêts scientifiques, et la politique doit trouver une solution à cela en faisant une loi. Et la loi va favoriser plutôt les intérêts des uns ou plutôt ceux des autres, ou établir un équilibre entre les deux.

Actuellement, les lois allemandes sont plutôt favorables aux intérêts économiques, et les intérêts des sciences sont actuellement fortement négligés. Peut-être que cela changera dans les années à venir, mais actuellement, les lois sur le copyright sont très favorables aux intérêts économiques, à l'utilisation économique des savoirs. Les éditeurs sont en position très forte, et les auteurs, les scientifiques, l'utilisation scientifique des savoirs ne sont pas dans une très bonne position actuellement. Les dernières lois promulguées n'ont rien donné de bon, elles penchent actuellement très fortement du côté économique.

Malgré la Déclaration de Berlin sur l'open access ?

Oui, cela n'a eu aucun effet. Cela tient un peu au fait que parfois ces lois sont faites si rapidement, et qu'elles comportent des tas de détails très fins qu'on aurait dû regarder de très très près. Mais on prend les décisions trop vite. Bon, et puis le lobbying est très fort dès qu'il s'agit d'intérêts économiques. Des gros éditeurs comme De Gruyter ou […] ont un pouvoir incroyable pour faire prendre en compte leurs propres intérêts. Donc même si ce sont les institutions scientifiques les plus importantes qui se réunissent pour signer la Déclaration de Berlin, ça reste la sphère scientifique. Tout autour il y a tellement d'autres livres, des livres de cuisine aux littératures en tous genres. La production scientifique n'est qu'une toute petite part de cette production. Et donc là, oui, on a un problème !

D'accord, merci beaucoup. Eh bien je ne sais pas, aimerais-tu encore ajouter quelque chose pour nos collègues français ?

Eh bien, dans le domaine des digital humanities... Pour moi en fait, le plus important est d'arriver à percevoir qu'actuellement on peut contribuer à quelque chose : le web 2.0 n'a pas lieu seulement sur Facebook, et pas seulement parce qu'on peut vendre ses livres d'occasion sur Amazon, ou parce qu'on participe à Wikipédia... Cela fonctionne aussi au niveau scientifique en ce qu’on doit regarder si on peut dépasser, dans un sens positif, la prédominance de certains journals ou revues importants, par exemple à travers des revues « open access » ou bien tout simplement en cherchant à être un modèle pour d'autres.

Mais bien sûr, c’est toujours aussi la question de savoir comment nos activités sont évaluées. Tant que le travail traditionnel, la publication d’un livre papier est tellement plus valorisée que le dépôt du même livre, du même texte, comme eBook sur le serveur d’une université, alors inutile de se faire des idées sur la manière dont on va progresser dans la mise à disposition libre des sources, l’interconnexion des ressources... - car le niveau traditionnel est encore très fort.

Ce que j’aimerais dire encore, et qui concerne aussi un peu aussi ce plan institutionnel, c’est que j’ai rencontré, ici à Wolfenbüttel, un trait très positif, à savoir que la bibliothèque est bien consciente qu’elle est dans une bonne position pour la conservation de l’information historique. Depuis toujours nous rassemblons toute l’information que nous pouvons obtenir concernant nos manuscrits. Avant c’étaient des éditions, ou de la littérature secondaire, ou des livres sur nos manuscrits. Nous avons toujours tout acheté et tout conservé, en complément des manuscrits, en complément des collections elles-mêmes. Et, à la HAB du moins, on est très conscient que de telles ressources apparaissent aussi dans le champ numérique, et que nous voulons nous en occuper aussi. C’est-à-dire que nous rassemblons les ressources numériques, lorsqu’elles nous concernent, lorsqu’elles concernent nos manuscrits, exactement comme nous l’avons toujours fait avec les œuvres imprimées. Et c’est pour cela qu’existe le poste que j’occupe actuellement : parce que nous nous efforçons d'avoir des documents structurés de manière sûre et pérenne. Et nous y invitons systématiquement les utilisateurs : si quelqu’un possède quelque chose, une transcription par exemple, qui présente un intérêt pour nous, nous pouvons nous en occuper, nous la recueillons volontiers, car nous nous disons : « Cela fait partie de nos missions ! Nous avons les originaux, nous avons les sources, nous avons la littérature, ce qu’on appelle la littérature secondaire, nous avons les instruments de mise en valeur, nous cataloguons nous mêmes, donc nous devons prendre aussi les ressources numériques. »

Ce genre de point de vue n’est pas encore très répandu dans les « institutions de la mémoire » (Gedächnisinstitutionen) comme on les appelle joliment en Allemagne : les archives, les bibliothèques. Les autres bibliothèques de manuscrits ne sont pas encore tout à fait de l’avis qu’elles devraient faire ainsi. Nous appartenons à des cercles qui rassemblent ce type de bibliothèques, nous nous rencontrons environ deux fois par an, et lorsque nous avons présenté notre opinion dans ce cadre, lorsque nous avons dit que nous voulions faire des éditions nous-mêmes ou encore sauvegarder des éditions pour d’autres qui n’ont pas les ressources pour le faire, eh bien les autres institutions étaient assez étonnées et ont écarté ce type d’orientation pour elles-mêmes, car il leur semble que la recherche se fait à l’université, et que nous sommes des bibliothèques.

Mais mon avis, c’est que nous avons toujours rassemblé et conservé les résultats de la recherche qui se fait à l’université. Les choses ne sont accessibles que parce les livres, les imprimés, sont bien conservés et traitées : mis en valeur, catalogués mais aussi tout simplement bien conservés physiquement. Et c’est exactement cela que nous souhaitons pour la vie électronique des données, de l’information, du savoir. Mais nous sommes encore presque seuls à en être là, du moins en Allemagne. Je ne sais pas si c’est différent dans les autres pays. Pourtant le désir de parvenir à cela est bien présent du côté des universités. Les bibliothèques sont les institutions les plus pérennes que nous ayons, bien plus que les universités, où le chercheur va d’une université à l’autre, termine un projet en laissant les données quelque part dans un service informatique où plus personne ne s’occupe d’elles. Et c’est précisément de cette question que devraient s’emparer les bibliothèques de manière beaucoup plus résolue. C’est une exigence de la science, mais les institutions n’en sont pas encore toutes là. Parfois les universités elles-mêmes sont prêtes à assurer cette tâche. Mais nous savons que la bibliothèque universitaire est plus pérenne que l’université, parce qu’il y a là quelque chose de concret, de réel à conserver, alors qu’à l’université les savoirs, les personnes, sont éphémères. Elles partent dans une autre université, elles meurent. Mais ce qu’elles ont écrit, ça reste, et ça doit être conservé. Et c’est ce qu’on demande aux bibliothèques et aux archives. Et fort heureusement, la HAB le fait, je trouve cela très bien. A mon sens, du point de vue de leur qualité administrative, les autres institutions devraient l'entreprendre également.

D’accord. Et concrètement comment cela se passe ici ? Par exemple, un chercheur a transcrit l’un de vos manuscrits, mais pas de manière structurée, par exemple il a fait ça en Word, pas en TEI. Comment ça se passe, vous prenez en charge le recodage ?

Actuellement, nous développons cette offre. Je ne suis pas là depuis tellement longtemps...

Depuis quand es-tu là ?

Depuis 2004. Mais j’ai d’abord travaillé dans différents petits projets, comme par exemple une adaptation de la TEI et en particulier les questions de description de manuscrits pour la base de données allemande « Manuscripta Mediaevalia » (http://www.manuscripta-mediaevalia.de/). Je suis titulaire depuis 2007 et je m’occupe de ces diverses choses. Donc ça se développe peu à peu. Mais d’ores et déjà, quelqu’un qui a fait quelque chose, sait que chez nous il a la possibilité de sauvegarder ce travail, comme nous l’avons fait avec ce chercheur qui a travaillé sur Rubens et nous a laissé tout son matériau de recherche. Bien sûr nous pourrons toujours faire plus en termes de retraitements. Et comme nous n’avons pas beaucoup de personnel ni de ressources, nous pensons que nous allons définir un certain standard : des documents TEI, du XML, un certain niveau de qualité de l'encodage. Peut-être que nous ferons des exceptions pour des matériaux qui présentent un fort intérêt pour nous, mais nous voulons établir un standard et dire aux gens : nous prenons vos textes s’ils ont une certaine qualité, si votre TEI peut être traitée de telle ou telle manière. Exactement comme une bonne maison d’édition a une feuille de style et dit : si vous voulez soumettre un article, alors merci d’utiliser ce format ! Et nous voulons faire la même chose avec les éditions ou autres textes, pour pouvoir ensuite les intégrer du mieux possible à nos autres ressources, et afin aussi de pouvoir servir de plate-forme de publication et d’archivage. Mais nous sommes une petite institution, la HAB compte 160 employés, dont seulement 80 sont titulaires, et comme dit, seulement deux personnes s’occupent des éditions numériques. Ce n’est pas beaucoup mais cependant, il y a ces deux personnes et nous allons voir au fur et à mesure ce nous voulons et pouvons développer.

Mais de toute façon il y a toujours des chercheurs qui viennent à nous pour nous dire : « Nous avons telle chose, ne voulez-vous pas l’avoir ? » Et nous devons alors examiner si cela se rapporte à nos manuscrits et aux choses que nous avons déjà. Si c’est le cas nous nous en occupons volontiers, pour les autres matériaux nous devons vérifier que nous n’aurons si possible pas beaucoup de travail, que par exemple un standard est respecté, ou alors parfois nous disons : non, nous ne pouvons pas nous occuper de vos matériaux.

Oui, ou alors s’il y a de l’argent ?

Oui bien sûr, s’il y a de l’argent. Quand on nous apporte de l’argent, tout de suite beaucoup de choses deviennent possibles ! (Rires)

D’accord. Merci beaucoup pour cette interview !

Propos recueillis et traduits de l'allemand par Maud Ingarao.
Traduction revue et corrigée par Christof Schöch.

Crédits photo
Herzog August Bibliothek.
Source : Wikimedia Commons
Auteur : User:Brunswyk
Date : Janvier 2006.