Discipline(s) : Sciences humaines et sociales
-
Partager cette page
SOR0904T - Programmation et web scraping sous Python
Semestre | Semestre 1 |
---|
Crédits ECTS | 4 |
---|---|
Volume horaire total | 25 |
Responsables
Cassia Trojahn Dos Santos
Objectifs
Initiation à l'usage de modules et de paquets Python orientés vers des objets de recherche spécifiques : le webscraping et la collecte de données numériques, le formatage et le nettoyage de corpus numériques, la visualisation et la représentation de données quantitatives, l'analyse d'opinions et de discours.
Contenu
• Présentation Python, listes et fichiers CSV (module CSV)
• Python et module Pandas (la notion de DataFrame)
• Web scraping avec Python (libraries Pandas, BeautifulSoup, Selenium)
• Traitement du langage avec Python (libraries Spacy, Stanza, NLKT)
• Analyse d'opinions avec Python (libraries Spacy, Stanza)
• Visualisation de données
• Python et module Pandas (la notion de DataFrame)
• Web scraping avec Python (libraries Pandas, BeautifulSoup, Selenium)
• Traitement du langage avec Python (libraries Spacy, Stanza, NLKT)
• Analyse d'opinions avec Python (libraries Spacy, Stanza)
• Visualisation de données
Bibliographie
Webgraphie
• https://docs.python.org/fr/3/
• https://stanfordnlp.github.io/stanza/
• https://spacy.io/
• https://pandas.pydata.org/
• https://docs.python.org/fr/3/
• https://stanfordnlp.github.io/stanza/
• https://spacy.io/
• https://pandas.pydata.org/