Accès direct au contenu

Recherche avancée

Université Toulouse - Jean Jaurès


SL0F601V - Linguistique et TAL

Semestre Second semestre
Crédits ECTS 6
Volume horaire 50

Responsables

Lydia-Mai HO-DAC

Objectifs

Cette UE introduit aux techniques et applications du TAL (Traitement Automatique des Langues), discipline qui mêle linguistique et informatique fait l'objet d'une offre de master spécifique, le master LITL (Linguistique, Informatique, Technologies du langage).

Les étudiants sont amenés à acquérir de façon conjointe des savoir-faire techniques via un apprentissage d'un langage de programmation et la manipulation d'outils TAL ; et une connaissance du domaine via un aperçu de différentes applications mettant en jeu différents niveaux d’analyse linguistique.

Contenu

Le domaine du TAL sera abordé à la fois du point de vue des applications TAL, des traitements linguistiques mis en œuvre dans ces applications et des ressources linguistiques nécessaires. Une partie plus technique amènera les étudiants à utiliser et développer des outils pour l’analyse de textes (étiqueteurs, programmes en langage Python, introduction au langage HTML). Les points suivants seront abordées :

  • Panorama des techniques du traitement automatique des langues et des différents niveaux d’analyse linguistique
  • Applications du traitement automatique des langues (traduction automatique, correction orthographique et grammaticale).
  • Outils d’étiquetage morphosyntaxique et d'analyse syntaxique
  • Apprentissage de la programmation (langage Python) pour le développement de programmes permettant d’exploiter des textes électroniques (bruts et annotés)
  • Introduction au langage HTML

 

Bibliographie

·         FABRE, C. (2010) Traitement automatique de textes : techniques linguistiques. Encyclopédie Techniques de lingénieur, numéro spécial « Documents numériques » sous la direction de J. André

·         HABERT, B., NAZARENKO, A. & SALEM, A. (1997) Les linguistiques de corpus, Paris, Armand Colin. (Chapitre 3 : Les ressources lexicales pour l'étiquetage sémantique)

·         HABERT B. (2005) Instruments et ressources électroniques pour le Français Ophrys. (Introduction, chapitres 1 et 2)

·         JACQUEMIN, C. & ZWEIGENBAUM, P (2000) Traitement automatique des langues pour l'accès au contenu des documents, in J. Le Maitre, J. Charlet , & C. Garbay (Eds.), Le document Multimédia en Sciences du Traitement de l'Information (pp. 71-110). Toulouse: CÉPADUÈS-Éditions

·         LALLICH-BOIDIN, G., & MARET, D. (2005) Recherche d'information et traitement de la langue : fondements linguistiques et applications. Lyon : ENSSIB

·         MITKOV, R. (éd.) (2002) Handbook of Computational Linguistics . Oxford : OUP

·         TANGUY, L. & FABRE, C. (2012) Évolutions de la linguistique outillée : méfaits et bienfaits du TAL. L'information grammaticale, Heck (pp. 15-23)


Renseignements pratiques :

Je recherche d'un élément pédagogique

Je recherche d'un élément pédagogique