SLT0702T - Informatique pour le Traitement Automatique des Langues 1

Semestre Semestre 1
Crédits ECTS 6
Volume horaire total 25

Responsables

Ludovic Tanguy

Objectifs

Cette UE vise à donner des connaissances techniques et des compétences en informatique dans le cadre du traitement automatique du langage. Elle donne aux étudiants une vision précise des mécanismes mis en œuvre dans une application de TAL et la possibilité, à terme, d'en développer pour répondre à des besoins d'ingénierie linguistique ou d'outillage de l'investigation des données linguistiques.

Contenu

Dans cette UE sont présentées et mises en pratique les techniques fondamentales de manipulation des données linguistiques, et plus précisément des textes électroniques et des ressources lexicales. En partant des applications centrales pour le TAL (recherche d'information, indexation, segmentation et étiquetage morpho-syntaxique, extraction de structures syntaxiques et d'informations lexicales à partir de texte) les techniques fondamentales y sont expérimentées (programmation en Python 3 sous Linux).

Plan du cours :

  • Prise en main du système d'exploitation GNU/Linux
  • Utilitaires UNIX de manipulation de texte (formatage, extraction, modification, tri)
  • Bases de la programmation en langage Python : données, structures, manipulation de chaînes
  • Méthodes algorithmiques fondamentales du TAL :
    • segmentation de texte brut ;
    • recherche et extraction de chaînes en texte brut ;
    • recherche de séquences dans un texte annoté ;
    • calculs de fréquences ;
    • extraction et pondération des contextes et des collocations ;
    • stockage et projection de ressources lexicales.

Bibliographie

  • BIRD, S., KLEIN, E. and LOPER, E. (2010) Natural Language Processing with Python. O’Reilly, version mise à jour en ligne sur http://www.nltk.org/
  • DAYLEY, B. (2013) Python 3 : l’essentiel du code et des commandes. Pearson.
  • PEEK, J., TODINO, G. et STRANG, J. (2002) Introduction à UNIX. O'Reilly.
  • SWINNEN, G. (2012) Apprendre à programmer avec Python 3 (3e édition). Eyrolles.
  • TANGUY, L. et HATHOUT, N. (2007) Perl pour les linguistes. Hermès. (chapitres 1, 2 et 4)