Accès direct au contenu

Recherche avancée

Université Toulouse - Jean Jaurès


SLT0802V - Ressources linguistiques pour le TAL

Semestre Second semestre
Crédits ECTS 3
Volume horaire 25

Responsables

Lydia-Mai HO-DAC

Objectifs

Cette UE propose un panorama des différents types de ressources linguistiques développées pour le TAL. Ces ressources incluent tout type de données relatives à la langue, accessibles dans un format électronique, et utilisées pour le développement des systèmes de traitement automatique des langues (corpus – nus ou enrichis -, lexiques informatisés, grammaires, etc.). De plus, les étudiants sont initiés à certain nombre de techniques permettant la manipulation et l’acquisition des ressources étudiées (documents structurés et langage XML, méthodes d’acquisition de ressources sémantiques)

Contenu

Plusieurs aspects concernant la place des ressources en TAL seront abordés, notamment :

·         les ressources linguistiques développées pour la correction orthographique et les applications du web sémantique (intervention d'une professionnelle) ;

·         la manipulation de documents structurés et initiation au langage XML ;

·         les ressources terminologiques ;

·         les méthodes d’acquisition de ressources sémantiques.

NB. certains aspects des contenus développés peuvent varier d’une année sur l’autre en fonction des intervenants.

Ces présentations sont complétés par des travaux individuels des étudiants visant à se familiariser avec la diversité des ressources existantes - banques de données textuelles enrichies et ressources lexicales - depuis leur conception jusqu’à leur exploitation dans des systèmes de TAL 

Bibliographie

·         Cunningham, H. et al. (2009). Developing Language Processing Components with GATE Version 5 (a User Guide). University of Sheffield, Sheffield.

·         Habert, B. (2005) Instruments et ressources électroniques pour le français. Paris : Ophrys.

·         L'HOMME, M.-C. (2004) La terminologie : principes et techniques. Montréal : Les Presses de l’Université de Montréal, Coll. « Paramètres ».

·         Leech, G (2005) Adding Linguistic Annotation. In M. Wynne (Ed.) Developing Linguistic Corpora: a Guide to Good Practice. Oxford: Oxbrow Books, 17-29 .

·         Litkowski, K. C. (2005). Computational Lexicons and Dictionaries. In Encyclopedia of Language and Linguistics (2nd ed.). Oxford: Elsevier


Renseignements pratiques :

Je recherche d'un élément pédagogique

Je recherche d'un élément pédagogique