The internet is a trove of information. A lot of it is publicly available and thus suitable for use in research. Extracting that information and putting it in an organized format for analysis can, however, be extremely tedious. Web scraping tools allow to automate parts of that process and R is a popular language for the task.
The hands-on workshop environment will only require a modern Web browser. A second screen is recommended to be able to follow instructions on one screen and execute code on a separate screen.
In this workshop, we will guide you through a simple example using the package rvest.
Please see https://hss23.netlify.app/ for more sessions in our Humanities and Social Sciences Winter 2023 Series.
************
Internet est non seulement un trésor riche en informations, mais une grande portion y est accessible publiquement, ce qui est propice à une utilisation pour la recherche. Cependant, extraire l’information de pages Web et la formater pour analyse peut rapidement devenir une tâche fastidieuse. Les outils de moissonnage du Web permettent d’automatiser en partie ce processus et le langage R est populaire pour réaliser cette tâche. Dans cet atelier, nous allons donc vous guider à travers un exemple simple utilisant le module rvest.
L’environnement interactif de cet atelier requiert uniquement un navigateur Web moderne. Un second écran est recommandé afin de pouvoir suivre les instructions sur un écran et pour exécuter du code sur un écran séparé.
Veuillez visiter https://hss23.netlify.app/ pour plus le programme complet de l’école hivernale des outils numériques pour la recherche en sciences humaines et sociales.