Discipline(s) : Arts- Lettres- Langues

SLT0804T - Méthodes, ressources et applications du TAL 2

Semestre Semestre 2
Crédits ECTS 4
Volume horaire total 25

Domaine(s) LMD

ARTS, LETTRES ET LANGUES

Langue(s) d'enseignement

Français

Responsables


Lydia-Mai Ho-Dac

Enseignants : Lydia-Mai Ho-Dac, Josette Rebeyrolle et Cécile Fabre

Objectifs

Cette UE poursuit l’enseignement de l’UE « SLT0703T Méthodes, ressources et applications du TAL 1 ». Cette seconde partie poursuivra le questionnement sur le rôle et l’apport des connaissances et données linguistiques dans les applications du TAL en présentant 1) le fonctionnement de deux applications emblématiques du TAL : la RI et la EI, 2) les enjeux et techniques liés à l’extraction terminologique et 3) la question de l’éthique en TAL.

Contenu

  1. Présentation de deux applications emblématiques visant l’accès au contenu textuel :
    • recherche d'informations (RI)
    • extraction d'informations (EI)
    • Manipulation d'outils et de techniques associées à ces applications :
      • indexation d'une base de données textuelles
      • initiation à la plateforme Gate et au module d'extraction d'information ANNIE
  1. Extraction automatique de termes pour la création de ressources terminologiques
  2. La question de l’éthique dans les données manipulées en TAL

Ce cours est composé de cours magistraux complétés par des travaux individuels des étudiants pour chacun des aspects enseignés.

Bibliographie

  • BALVET, A. (2021), Introduction : numéro spécial sur les ressources lexicales. Revue Lexique, 27, 5-19. URL :https://lexique.univ-lille.fr/numero27-2020.html
  • Bel, N. & Sagot, B. (2011) Introduction : Ressources linguistiques libres. Revue TAL, 52(3).
  • Bassil, Y. (2012). A survey on information retrieval, text categorization, and web crawling. arXiv preprint arXiv:1212.2065.
  • Claveau, V. & Nie, J. (Ed.) (2016). Recherche d'information et traitement automatique des langues. Revue TAL, n.s., 56 (3).
  • Cunningham, H. et al. (2009). Developing Language Processing Components with GATE Version 5 (a User Guide). University of Sheffield, Sheffield. URL :https://gate.ac.uk/releases/gate-5.1-beta1-build3397-ALL/
  • CUNNINGHAM, H. (2005). Information extraction, automatic. In Encyclopedia of language and linguistics, 3(8).
  • DOJCHINOVSKI, M., HERNANDEZ, J., ACKERMANN, M., Kirschenbaum, A. & Hellmann S. (2018) DBpedia NIF: Open, Large-Scale and Multilingual Knowledge Extraction Corpus. arXiv preprint arXiv:1812.10315, 2018.
  • L'HOMME, M.-C. (2004) La terminologie : principes et techniques. Montréal : Les Presses de l’Université de Montréal, Coll. « Paramètres ».
  • L ‘HOMME, M.-C. (2008). Ressources lexicales, terminologiques et ontologiques: une analyse comparative dans le domaine de l’informatique. Revue française de linguistique appliquée, XIII, 1, 97-118.
  • Litkowski, K. C. (2005). Computational Lexicons and Dictionaries. In Encyclopedia of Language and Linguistics (2nd ed.). Oxford: Elsevier
  • Musen MA & Protégé Team. (2015) The Protégé Project: A Look Back and a Look Forward. AI Matters, 1(4):4-12.
  • Nazarenko, A., Zargayouna, H., Hamon, O. et van Puymbrouck, J. (2009). Evaluation des outils terminologiques: enjeux, difficultés et propositions. Revue TAL, 50 (1), 257-281.