Discipline(s) : Arts- Lettres- Langues

SLT0804T - Méthodes, ressources et applications du TAL 2

Semestre Semestre 2
Crédits ECTS 4
Volume horaire total 25

Domaine(s) LMD

ARTS, LETTRES ET LANGUES

Langue(s) d'enseignement

Français

Responsables


Lydia-Mai Ho-Dac

Enseignants : Lydia-Mai Ho-Dac, Josette Rebeyrolle et Cécile Fabre

Objectifs

Cette UE poursuit l’enseignement de l’UE « SLT0703T Méthodes, ressources et applications du TAL 1 ». Cette seconde partie poursuivra le questionnement sur le rôle et l’apport des connaissances linguistiques dans les applications du TAL en proposant un panorama du type de données relatives à la langue, accessibles dans un format électronique, et utilisées pour le développement des systèmes de traitement automatique des langues (corpus – nus ou enrichis -, base de données lexicales, terminologies, grammaires, jeux de données conçus pour une tâche spécifique, etc.). Les étudiants seront initiés à certain nombre de méthodes et techniques concernant l’annotation de corpus et l’acquisition automatique de ressources terminologiques et sémantiques.

Contenu

Contenu

Plusieurs aspects concernant la place des ressources en TAL seront abordés, notamment :

  • la mise en place de campagnes d’annotation outillées qui offrira une poursuite de la formation au langage XML initiée au premier semestre
  • l’extraction automatique de termes pour la création de ressources terminologiques
  • les méthodes d’acquisition de ressources sémantiques à partir de grands corpus

Ce cours est composé de cours magistraux complétés par des travaux individuels des étudiants pour chacun des aspects enseignés.

Bibliographie

  • BALVET, A. (2021), Introduction : numéro spécial sur les ressources lexicales. Revue Lexique, 27, 5-19. URL :https://lexique.univ-lille.fr/numero27-2020.html
  • Bel, N. & Sagot, B. (2011) Introduction : Ressources linguistiques libres. Revue TAL, 52(3).
  • CANDITO, M. & LIBERMAN, M. (Ed.) (2019). Corpus annotés. Revue TAL, n.s., 60(2).
  • DOJCHINOVSKI, M., HERNANDEZ, J., ACKERMANN, M., Kirschenbaum, A. & Hellmann S. (2018) DBpedia NIF: Open, Large-Scale and Multilingual Knowledge Extraction Corpus. arXiv preprint arXiv:1812.10315, 2018.
  • L'HOMME, M.-C. (2004) La terminologie : principes et techniques. Montréal : Les Presses de l’Université de Montréal, Coll. « Paramètres ».
  • L ‘HOMME, M.-C. (2008). Ressources lexicales, terminologiques et ontologiques: une analyse comparative dans le domaine de l’informatique. Revue française de linguistique appliquée, XIII, 1, 97-118.
  • Leech, G (2005) Adding Linguistic Annotation. In M. Wynne (Ed.) Developing Linguistic Corpora: a Guide to Good Practice. Oxford: Oxbrow Books, 17-29 .
  • Litkowski, K. C. (2005). Computational Lexicons and Dictionaries. In Encyclopedia of Language and Linguistics (2nd ed.). Oxford: Elsevier
  • Musen MA & Protégé Team. (2015) The Protégé Project: A Look Back and a Look Forward. AI Matters, 1(4):4-12.
  • Nazarenko, A., Zargayouna, H., Hamon, O. et van Puymbrouck, J. (2009). Evaluation des outils terminologiques: enjeux, difficultés et propositions. Revue TAL, 50 (1), 257-281.
  • Zeldes, Amir (2017) "The GUM Corpus: Creating Multilayer Resources in the Classroom". Language Resources and Evaluation 51(3), 581–612.