Objectifs

Le théâtre dialectal en alsacien représente une tradition dans laquelle les genres populaires et humoristiques sont prédominants. Quelles sont les tendances majeures de cette tradition en termes de technique dramatique et types de personnages ? Quels sont les lieux géographiques pertinents ? Dans quelle mesure les pièces permettent-elles de documenter les pratiques sociolinguistiques de leur époque?

Afin de répondre à ces questions et d’effectuer des analyses quantitatives, un corpus de grande taille représentatif de la tradition est requis, ainsi qu’une annotation du corpus qui reflète les variables à étudier : origine géographique des pièces et auteurs, lieux où se déroulent les pièces, période et genre dramatique. Concernant les personnages, des attributs comme leur profession, position sociale, origine, sexe ou âge doivent être disponibles. Il est également nécessaire de formaliser la structure des pièces, en indiquant les divisions en actes ou scènes, les répliques et les personnages, et les didascalies.

Notre projet vise à créer un corpus possédant de telles caractéristiques, encodé en format TEI (Text Encoding Initiative), dont le module Performance est adapté à ces besoins. Nous travaillons sur un ensemble représentatif de pièces, récemment numérisées par la Bibliothèque Nationale et Universitaire de Strasbourg, dont nous avons commencé l’océrisation et encodage TEI.

Un corpus de ce type permettra une approche de distant reading ou macroanalyse sur le théâtre alsacien. Ces approches ont été appliquées aux principales traditions dramatiques européennes, comme en témoigne le numéro monographique sur ce sujet dans la Revue d’Historiographie du Théâtre (2017). Or, elles ne sont pas possibles à l’heure actuelle pour l’alsacien, en raison du manque du corpus approprié. Le projet MeThAL cherche à combler ce vide.

À cette fin, nous appliquerons des techniques de traitement automatique des langues et de représentation documentaire ainsi que des technologies web qui contribueront à la navigabilité du corpus.

Défis

L’énorme variation orthographique de l’alsacien présente, comme pour toute langue peu dotée, des défis spécifiques en Traitement automatique des langues (TAL). Ces défis soulignent des besoins imparfaitement couverts par les outils d’analyse textuelle existants, orientés prioritairement vers les langues majoritaires. Dans ce sens, le projet exploitera et contribuera aux ressources du projet RESTAURE pour les langues régionales de France.

Productions

Publications

Corpus

Présentations

  • Pablo Ruiz au séminaire thématique de LiLPa, Décembre 2019 : [pdf]

Participants

Les participants au projet sont membres du laboratoire LiLPa : Pablo Ruiz (responsable du projet), Delphine Bernhard, Pascale Erhart, Dominique Huck et Carole Werner.

Nous sommes également en lien avec le Datalab de la BNU et le projet a fait l’objet d’un premier examen par GIS Corpus de la BNU.

Ailleurs sur le web

  • Le carnet de recherche de la BNU parle du projet

  • La plate-forme DraCor (Drama Corpora) a accepté d’accueillir les pièces encodées, rendant ainsi des premières analyses disponibles :

    • dracor.org/als : Lecture des pièces encodées, réseaux et relations entre les personnages

    • shiny.dracor.org : Visualisation de différentes métriques d’interaction entre les personnages. P. ex. la matrice d’interaction ci-dessous pour les personnages de Der Pfingstmontag (Arnold, 1816).

Pfingstmontag

Rejoignez-nous

Vous êtes intéressé.e par un stage en océrisation et encodage TEI, application de technologies linguistiques à l’alsacien, édition électronique, linguistique et littérature alsaciennes ou développement de base de données et interface web ?

Vous avez une autre question sur le projet ?

Contactez-nous !

D’r Candidat
Couverture pour D’r Candidat. Source: Internet Archive