-
Partager cette page
SLT0804T - Méthodes, ressources et applications du TAL 2
Semestre | Semestre 2 |
---|
Crédits ECTS | 4 |
---|---|
Volume horaire total | 25 |
Domaine(s) LMD
Langue(s) d'enseignement
Responsables
Lydia-Mai Ho-Dac
Enseignants : Lydia-Mai Ho-Dac, Josette Rebeyrolle et Cécile Fabre
Objectifs
Cette UE poursuit l’enseignement de l’UE « SLT0703T Méthodes, ressources et applications du TAL 1 ». Cette seconde partie poursuivra le questionnement sur le rôle et l’apport des connaissances linguistiques dans les applications du TAL en proposant un panorama du type de données relatives à la langue, accessibles dans un format électronique, et utilisées pour le développement des systèmes de traitement automatique des langues (corpus – nus ou enrichis -, base de données lexicales, terminologies, grammaires, jeux de données conçus pour une tâche spécifique, etc.). Les étudiants seront initiés à certain nombre de méthodes et techniques concernant l’annotation de corpus et l’acquisition automatique de ressources terminologiques et sémantiques.
Contenu
Contenu
Plusieurs aspects concernant la place des ressources en TAL seront abordés, notamment :
- la mise en place de campagnes d’annotation outillées qui offrira une poursuite de la formation au langage XML initiée au premier semestre
- l’extraction automatique de termes pour la création de ressources terminologiques
- les méthodes d’acquisition de ressources sémantiques à partir de grands corpus
Ce cours est composé de cours magistraux complétés par des travaux individuels des étudiants pour chacun des aspects enseignés.
Bibliographie
- BALVET, A. (2021), Introduction : numéro spécial sur les ressources lexicales. Revue Lexique, 27, 5-19. URL :https://lexique.univ-lille.fr/numero27-2020.html
- Bel, N. & Sagot, B. (2011) Introduction : Ressources linguistiques libres. Revue TAL, 52(3).
- CANDITO, M. & LIBERMAN, M. (Ed.) (2019). Corpus annotés. Revue TAL, n.s., 60(2).
- DOJCHINOVSKI, M., HERNANDEZ, J., ACKERMANN, M., Kirschenbaum, A. & Hellmann S. (2018) DBpedia NIF: Open, Large-Scale and Multilingual Knowledge Extraction Corpus. arXiv preprint arXiv:1812.10315, 2018.
- L'HOMME, M.-C. (2004) La terminologie : principes et techniques. Montréal : Les Presses de l’Université de Montréal, Coll. « Paramètres ».
- L ‘HOMME, M.-C. (2008). Ressources lexicales, terminologiques et ontologiques: une analyse comparative dans le domaine de l’informatique. Revue française de linguistique appliquée, XIII, 1, 97-118.
- Leech, G (2005) Adding Linguistic Annotation. In M. Wynne (Ed.) Developing Linguistic Corpora: a Guide to Good Practice. Oxford: Oxbrow Books, 17-29 .
- Litkowski, K. C. (2005). Computational Lexicons and Dictionaries. In Encyclopedia of Language and Linguistics (2nd ed.). Oxford: Elsevier
- Musen MA & Protégé Team. (2015) The Protégé Project: A Look Back and a Look Forward. AI Matters, 1(4):4-12.
- Nazarenko, A., Zargayouna, H., Hamon, O. et van Puymbrouck, J. (2009). Evaluation des outils terminologiques: enjeux, difficultés et propositions. Revue TAL, 50 (1), 257-281.
- Zeldes, Amir (2017) "The GUM Corpus: Creating Multilayer Resources in the Classroom". Language Resources and Evaluation 51(3), 581–612.