SL00504V - Analyse de corpus

Accessible en Formation à distance
Semestre Premier semestre
Crédits ECTS 6
Volume horaire total 50

Responsables

Cécile FABRE

Objectifs

Il est devenu facile aujourd'hui de rassembler des données langagières sous forme électronique, produites dans différents contextes de communication (articles de journaux, conversations orales, discours politiques, textes littéraires, documents techniques, messages électroniques, etc.). Ces collections de textes, appelées corpus, permettent d'observer à grande échelle des usages langagiers attestés et diversifiés. Leur disponibilité a modifié la manière de faire de la linguistique. Des outils de traitement de corpus permettent d'explorer ces données, d'en extraire des informations, et d’en faciliter l’analyse. Le cours permet de découvrir ces méthodes, depuis la constitution des données jusqu'à leur analyse.  Il présente les notions importantes du champ de la linguistique de corpus (principes de constitution des corpus, notions de lexicométrie, critères de caractérisation des corpus) et forme les étudiants à l’utilisation d’outils dédiés au traitement de corpus.

A l’issue du cours, les étudiants savent en particulier produire des concordances, calculer la fréquence des unités lexicales et leurs associations lexicales significatives, étudier la répartition des formes entre sous-corpus, et intégrer ces observations dans le travail d’analyse linguistique. Ce cours s'accompagne de nombreux travaux pratiques sur ordinateur. Il s’appuie en particulier sur la manipulation d’un corpus contenant des textes de différents types (discours politiques, entretiens oraux, critiques de films, articles de presse, etc.), et sur la constitution par les étudiants d’un corpus personnel sur lequel ils mettent en œuvre les méthodes présentées en cours et en TD.

Contenu

En CM :

-        le champ de la linguistique de corpus : notions clés, méthodes et objectifs

-        la diversité des corpus : corpus de référence et corpus spécialisé, typologie externe et typologies linguistiques

-        les outils associés aux corpus : concordances, fréquences, cooccurrences, spécificités lexicales – analyses d’exemples

-        l’apport des corpus en sciences du langage

En TD (salle machine) :

-        manipulation d’un logiciel d’analyse de corpus (Antconc)

-        études linguistiques outillées d’un corpus diversifié

-        encadrement de l’activité de constitution et d’analyse d’un corpus personnel (dossier)

 

Bibliographie

·         Biber, D.; Conrad, S. & Reppen, R. (1998). Corpus linguistics: Investigating language structure and use. Cambridge University Press, Cambridge.

·         Blanche-Benveniste, C. (1996). De l’utilité du corpus linguistique, Revue française de linguistique appliquée, I(2), 25-42.

·         Habert, B. (2005). Instruments et ressources électroniques pour le français. Ophrys, collection l'Essentiel français, Gap/Paris.

·         Lüdeling, A. et Kytö, M. (eds.) (2007), Corpus linguistics: An international handbook, Berlin: Mouton de Gruyter.

Contrôles des connaissances