Discipline(s) : Sciences humaines et sociales

SOR0904T - Programmation et web scraping sous Python

Semestre Semestre 1
Crédits ECTS 4
Volume horaire total 25

Responsables

Cassia Trojahn Dos Santos

Objectifs

Initiation à l'usage de modules et de paquets Python orientés vers des objets de recherche spécifiques : le webscraping et la collecte de données numériques, le formatage et le nettoyage de corpus numériques, la visualisation et la représentation de données quantitatives, l'analyse d'opinions et de discours.
 

Contenu

•    Présentation Python, listes et fichiers CSV (module CSV)
•    Python et module Pandas (la notion de DataFrame)
•    Web scraping avec Python (libraries Pandas, BeautifulSoup, Selenium)
•    Traitement du langage avec Python (libraries Spacy, Stanza, NLKT)
•    Analyse d'opinions avec Python (libraries Spacy, Stanza)
•    Visualisation de données

Bibliographie

Webgraphie
•    https://docs.python.org/fr/3/
•    https://stanfordnlp.github.io/stanza/
•    https://spacy.io/
•    https://pandas.pydata.org/