SL0F601V - Linguistique et TAL

Semestre Second semestre
Crédits ECTS 6
Volume horaire total 50

Responsables


Responsable : Lydia-Mai HO-DAC

Enseignants : Lydia-Mai Ho-Dac & Ludovic Tanguy

Objectifs


Cette UE introduit aux techniques et applications du TAL (Traitement Automatique des Langues), discipline qui mêle linguistique et informatique fait l'objet d'une offre de master spécifique, le master LITL (Linguistique, Informatique, Technologies du langage).
Les étudiants sont amenés à acquérir de façon conjointe des savoir-faire techniques via un apprentissage d'un langage de programmation et la manipulation d'outils TAL ; et une connaissance du domaine via un aperçu de différentes applications mettant en jeu différents niveaux d’analyse linguistique.

Contenu


Le domaine du TAL sera abordé à la fois du point de vue des applications TAL, des traitements linguistiques mis en œuvre dans ces applications et des ressources linguistiques nécessaires. Une partie plus technique amènera les étudiants à utiliser et développer des outils pour l’analyse de textes (étiqueteurs, programmes en langage Python, introduction au langage HTML). Les points suivants seront abordées :
• Panorama des techniques du traitement automatique des langues et des différents niveaux d’analyse linguistique
• Applications du traitement automatique des langues (traduction automatique, correction orthographique et grammaticale)
• Outils d’étiquetage morphosyntaxique et d'analyse syntaxique
• Évaluation de l’efficacité des applications et outils du TAL
• Apprentissage de la programmation (langage Python) pour le développement de programmes permettant d’exploiter des textes électroniques (bruts et annotés)
• Introduction au langage HTML


Bibliographie


• CORI, M & LEON, J. (2002) La constitution du TAL : Étude historique des dénominations et des concepts. Traitement Automatique des Langues, 43 (3), pp.21-55.URL : ⟨halshs-00158854⟩
• FABRE, C. (2010) Traitement automatique de textes : techniques linguistiques. Encyclopédie Techniques de l’ingénieur, numéro spécial « Documents numériques » sous la direction de J. André
• HABERT B. (2005) Instruments et ressources électroniques pour le Français. Ophrys. (Introduction, chapitres 1 et 2)
• LALLICH-BOIDIN, G., & MARET, D. (2005) Recherche d'information et traitement de la langue : fondements linguistiques et applications. Lyon : ENSSIB
• MITKOV, R. (éd.) (2002) Handbook of Computational Linguistics . Oxford : OUP
• TANGUY, L. & FABRE, C. (2012) Évolutions de la linguistique outillée : méfaits et bienfaits du TAL. L'information grammaticale, Heck (pp. 15-23)

Contrôles des connaissances