Séminaires |

Séminaire RUSS

R à l'Usage des Sciences Sociales

MàJ : 05/11/2019

Présentation du séminaire RUSS

logo_inedsms2.jpg
seminaireruss.jpg
ii_poleadr.gif

L'objectif de ce séminaire est d'échanger autour du logiciel de statistique libre, gratuit et multiplateforme R (http://www.r-project.org/). Il s'adresse aux praticiens impliqués dans le traitement quantitatif des données en sciences humaines et sociales (utilisateurs de données, chercheurs, ingénieurs ou étudiants) qu'ils aient ou non déjà utilisé le logiciel R.

Chaque séance est organisée autour de la présentation d'une expérience de traitement de données avec le logiciel (fonction spécifique et/ou packages). Le cadre de ces réunions est informel et les participants doivent se sentir libres d'intervenir afin de confronter leurs expériences.
Le nombre de places est limité l'inscription est obligatoire sur le site https://russ.site.ined.fr/fr/ .

Le séminaire est annoncé chaque année sur le programme des enseignements et séminaires de l'EHESS (cf séminaire RUSS 2019-2020). Le site du séminaire est accessible à l'adresse suivante: https://russ.site.ined.fr/fr/. Ce site récapitule indexe l'ensemble des séances du séminaire depuis 2014 et donne en général accès aux scripts et documents présentés en séance.

Programme prévisionnel des séances 2019-2020

Organisateurs: Élisabeth Morand, Bénédicte Garnier (INED, service Méthodes Statistiques), Timothée Giraud, ingénieur d’études au CNRS (UMS-RIATE) avec la collaboration Pascal Cristofoli (EHESS). Ce séminaire  associe le LaDéHiS et le service méthodes statistiques de l'INED.

Lundi 9 décembre 2019, 9h00-12h00 : (à l'INED, Salle 111, 133 boulevard Davout, Paris 20e): Intervention de Olivier Decourt , Formateur-consultant en statistiques et Data Mining (http://www.od-datamining.com) : Tiens Olivier, tant que tu es debout, tu peux nous expliquer comment travailler avec R ?.

Vous utilisez R et vous auriez besoin de quelques points de repère ? Pas de panique ! Récupération de données, filtres, requêtes, statistiques descriptives et graphiques, nous allons faire le tour du problème en une matinée et vous donner les clés pour comprendre les principaux concepts de R et coder les traitements du quotidien. Les packages que nous passerons en revue : {dplyr} et la suite {tidyverse}, {ggplot2}, {openxlsx}, {tabular} et sans doute quelques autres.

Au vu du nombre limité de places, l'inscription est obligatoire via le formulaire suivant : https://www.ined.fr/fr/actualites/rencontres-scientifiques/seminaires-colloques-ined/russ-9-12-19/

Jeudi 6 février 2020, 9h00-12h00 : (au Centre de colloques du Campus Condorcet, Salle N°1): Programme en cours de préparation.

Jeudi 2 avril 2020, 9h00-12h00 : (au Centre de colloques du Campus Condorcet, Salle N°1): Programme en cours de préparation.

Jeudi 4 juin 2020, 9h00-12h00 : (au Centre de colloques du Campus Condorcet, Salle N°1): Programme en cours de préparation.

Programme des séances 2018-2019

Organisateurs: Élisabeth Morand, Bénédicte Garnier (INED, service Méthodes Statistiques), Timothée Giraud, ingénieur d’études au CNRS (UMS-RIATE) avec la collaboration Pascal Cristofoli (EHESS). Ce séminaire  associe le LaDéHiS et le service méthodes statistiques de l'INED.

Le Jeudi de 9 h15 à 12 h à l’EHESS, 54 bd Raspail 75006 Paris

Jeudi 6 décembre 2018 :  Ronan Ysebaert (UMS RIATE) et Hugues Pécout (CIST) - Introduction au logiciel R et aux chaînes de traitements reproductibles

Début de la séance à 9h30, en salle BS1_05 [54 bd Raspail) - 

Cette séance s'adresse aux personnes souhaitant s'initier au logiciel-language R et aux démarches d'analyse reproductibles. Elle s'articulera tout d'abord autour d'une présentation de R, de son environnement Rstudio et des atouts de cet outil (polyvalence, extensibilité, reproductibilité...). Dans un second temps seront présentées plusieurs librairies utiles pour couvrir une chaîne de traitement, depuis l'import et la mise en forme des données, en passant par leur analyse et leur représentation (analyse statistique, spatiale, textuelle, cartographie, etc.) jusqu'à leur export et leur documentation. Un exemple simple, concret et pratique clôturera la séance.

Le nombre de places est limité, l'inscription est obligatoire à l'adresse sivante:
https://www.ined.fr/fr/actualites/rencontres-scientifiques/seminaires-colloques-ined/6-12-2018/

Rappel: vous trouverez sur le site du séminaire, les archives des précédentes séances ainsi que toutes les informations pour les sessions à venir.

Jeudi 7 février 2019 :  salle BS1_05 (54 bd Raspail à partir de 9h30) - Elodie Baril (Ined) et Arnaud Bringé (Ined) - Organiser et traiter plus facilement ses données avec R : utiliser le package dplyr

La gestion de données sous R apparait souvent compliquée et peut constituer un frein pour des utilisateurs habitués au management de données sous d’autres logiciels statistiques ou des débutants en R. Cette séance s'adresse aux personnes souhaitant s'initier à cette syntaxe claire et cohérente, sous formes de verbes permettant de traiter et manipuler facilement les données contenues dans une ou plusieurs tables R.
Ce package, proposé en 2016, fait partie du tidyverse (https://www.tidyverse.org/) et a l’avantage de présenter une grammaire unifiée. Il semble aujourd’hui incontournable pour qui souhaite traiter ses données avec R en toute autonomie.
Grâce à sa syntaxe plus « naturelle » dplyr permet de sélectionner des lignes/colonnes, créer des variables, regrouper de données et enfin calculer des statistiques descriptives. Des fonctions servent également à renommer les variables, ordonner les données, fusionner des tableaux très simplement. Elles sont en général plus rapides que leur équivalent sous R de base et sont adaptées au traitement de données de grande dimension.
Nous verrons à l’aide d’un exemple concret comment préparer ses données, expliciter les éléments de la grammaire de dplyr, enchaîner les opérations élémentaires pour constituer un fichier d’analyse et enfin calculer facilement des statistiques agrégées.

Le nombre de places est limité, l'inscription est obligatoire :
https://www.ined.fr/fr/actualites/rencontres-scientifiques/seminaires-colloques-ined/7-2-2019/

Vous trouverez sur le site du séminaire, l'annonce, les archives des précédentes séances ainsi que toutes les informations pour les sessions à venir :
https://russ.site.ined.fr/fr/
 

Jeudi 4 avril 2019 : salle 5 (105 bd Raspail) - Matthieu Viry (LIG - Univ. Grenoble Alpes / CNRS / Grenoble INP) : Introduction à Python pour les utilisateurs de R

La présentation dressera un aperçu de l'écosystème destiné au calcul scientifique, à la statistique et à la manipulation de données géo spatiales, notamment en montrant la correspondance entre bibliothèques incontournables et façon de faire appropriées dans les deux langages. Enfin l'accent sera mis sur la grande polyvalence du langage Python, notamment lorsqu'il s'agit d'effectuer des opérations transversales à l'analyse de données (création d'applications Web, opérations relatives au système d'exploitation, etc.).

Le nombre de places est limité ; l'inscription est obligatoire : https://russ.site.ined.fr/fr/annee-2018-2019/jeudi-4-avril-2019/

Jeudi 6 juin 2019 : salle BS1_05 (54 bd Raspail à partir de 9h30) - Milan Bouchet-Valat (Ined) et Antoine Chollet (Ensai) sur l’analyse textuelle en R avec R.temis

R.temis est un nouveau paquet R dédié à l’analyse textuelle, qui prend la suite de l’interface graphique RcmdrPlugin.temis (R.TeMiS). Contrairement à son prédécesseur, R.temis fournit des fonctions à utiliser dans des scripts (par exemple dans RStudio). Il s’adresse donc aux utilisateurs déjà familiers avec R, tout en se voulant accessible.
Le principe du paquet est de faciliter les étapes essentielles de l’analyse textuelle (importation, traitement et analyses) en s’appuyant au maximum sur les paquets existants (tm, FactoMineR, explor, igraph...) pour permettre aux utilisateurs de réaliser les analyses dont ils ont besoin sans les enfermer dans une méthode particulière.

R.temis prend en charge les méthodes suivantes :

  • importation de corpus au format .csv, .txt, Alceste, Factiva, Europresse et LexisNexis
  • suppression des mots vides, lemmatisation automatique modifiable manuellement
  • découpage des textes en paragraphes
  • construction de sous-corpus à partir de termes
  • bilan lexical, spécificités, co-occurrences, concordances
  • nuage de mots
  • analyse des correspondances sur tableau lexical entier ou agrégé
  • classification
  • graphes de mots

Après une présentation des principes du logiciel et des principales méthodes, nous proposerons une illustration pratique à partir d’un extrait du corpus EuroBroadMap, constitué de réponses d’étudiants à la question « Quels sont les mots que vous associez le plus à l’« Europe » ? Choisissez 5 mots au maximum ».

Le nombre de places est limité ; l'inscription est obligatoire : https://www.ined.fr/fr/actualites/rencontres-scientifiques/seminaires-colloques-ined/russ-6-6-19/ .
 

Manifestations associées :

StaRDay Paris 2019, 23 février 2019, AgroParisTech. Programme:  https://paris2019.satrdays.org/

Programme des séances 2017-2018

Organisateurs: Élisabeth Morand, Bénédicte Garnier (INED, service Méthodes Statistiques), Timothée Giraud, ingénieur d’études au CNRS (UMS-RIATE) avec la collaboration Pascal Cristofoli (EHESS). Ce séminaire  associe le LaDéHiS et le service méthodes statistiques de l'INED.

Le Jeudi de 9 h à 12 h à l’EHESS, 54 bd Raspail 75006 Paris

Jeudi 7 décembre 2017 : salle AS1_23 - "Mes débuts avec R"

Jeudi 1er février 2018 : salle AS1_23 - Présentation du tidyverse (J. Barnier)

Jeudi 5 avril 2018 : amphithéâtre François-Furet (105 bd Raspail 75006 Paris) - Enseigner R en SHS. Table ronde avec Nicolas Ballier (Université Paris Diderot), Diane Beldame (thinkr.fr), Muriel Epstein ( SAMM, Université Paris 1 Panthéon Sorbonne), Anton Perdoncin (ENS, CMH, IDHES -ENS Cachan)

Jeudi 7 juin 2018 : salle AS1_23 - Séance annulée.

Programme des séances 2016-2017

Organisateurs: Élisabeth Morand, Bénédicte Garnier (INED, service Méthodes Statistiques), Timothée Giraud, ingénieur d’études au CNRS (UMS-RIATE) avec la collaboration Pascal Cristofoli (EHESS). Ce séminaire  associe le LaDéHiS et le service méthodes statistiques de l'INED.

Séance 1 : Le jeudi 24 novembre 2016Hadrien Commenges  (Université Paris 1 Panthéon-Sorbonne UMR 8504 Géographie-cités) :  "Flux de travail intégré et conception d’outils pour la recherche et l’enseignement avec R et shiny"

Séance 2 : Le jeudi 26 janvier 2017Arnaud Bringé (Ined) : "Traitement de données historiques avec R"

Séance 3 : Le jeudi 23 mars 2017Nicolas Robette ( CREST-LSQ ENSAE, Université Paris Saclay) : "Les arbres qui cachent les forêts ? Arbres de régression et forêts aléatoires comme alternatives aux modèles de régressions standards en sciences sociales"

Séance 4 : Le jeudi 18 mai 2017François Briatte (Université Catholique de Lille,École européenne des sciences politiques et sociales (ESPOL)) : "Web Scraping et APIs avec R"
 

Programme des séances 2015-2016

Organisateurs: Élisabeth Morand, Bénédicte Garnier (INED, service Méthodes Statistiques), avec la collaboration de Florence Maillochon (CNRS) et Pascal Cristofoli (EHESS). Ce séminaire  associe le LaDéHiS et le service méthodes statistiques de l'INED.


Les séances ont lieu àl'EHESS, en salle 3, RdC, bât. Le France, 190 av de France 75013 Paris.

Séance 1 : jeudi 19 novembre 2015 (9h-12h)Julien Barnier (Ens Lyon) et Elisabeth Morand (Ined) : "L'enseignement et la formation au logiciel R : retours d'expérience "


Séance 2 : jeudi 21 janvier 2016 (9h-12h) Mónica Bécue Bertaut ( Univ. Polyt. de Catalunya) et Annie Morin (IRISA-Univ. Rennes 1) : "Analyse textuelle avec R"


Séance 3 : jeudi 17 mars 2016 (9h-12h) - Arnaud Bringé (Ined) : "Analyse de réseaux sous R : Mise en œuvre, applications, visualisation" (Cf. affiche)


Séance 4 : jeudi 19 mai 2016 (9h-12h) - Timothée Giraud et Nicolas Lambert (CNRS UMS Riate) :"Représentation et traitement de l'information géographique avec R"

Vous pouvez désormais retrouvez toutes les informations actualisées et documents associés concernant le séminaire RUSS sur le site dédié (https://russ.site.ined.fr/fr/) ainsi que l'affiche du programme du séminaire RUSS 2015-2016.

Rappel: le nombre de places étant limité, l'inscription est obligatoire pour chaque séance à l'adresse seminaire-russ@ined.fr.
 

Programme des séances 2014-2015

Séance 1: Présentation générale de R - Générations de rapports dynamiques

Jeudi 18 décembre 2014 de 9h à 11h, salle 015, RdC, bât. Le France, 190 av de France 75013 Paris
Chistophe Genolini (Université Paris Ouest Nanterre La Défense), Présentation générale de R - Générations de rapports dynamiques (voir Affiche)

A la fois langage de programmation et environnement d’analyse, R s’est progressivement imposé sur le devant de la scène des statistiques. Les raisons de ce succès sont diverses: gratuité, simplicité de la prise en main, mais également son côté open source qui permet à un chercheur inventant une nouvelle méthode de la programmer et de la mettre lui-même à la disposition de la communauté. On trouve sur R nombre des méthodes les plus récentes dans des domaines aussi variés que la biologie, la psychologie, l’économie, la médecine, l’histoire, la linguistique et bien sûr les sciences sociales.
Lors de ce séminaire, nous essayerons dans un premier temps de donner une vue d’ensemble du logiciel. Puis nous nous attarderons un peu plus précisément sur l’«automatic reporting», la possibilité d'intégrer automatiquement une analyse statistique dans un rapport.
Le nombre de places étant limité à 30, l'inscription est indispensable à l’adresse :
http://www.ined.fr/fr/actualites/rencontres-scientifiques/seminaires-colloques-ined/russ-seance-1/
 

Séance 2: Text mining et recherche de thèmes dans un ensemble de documents

Jeudi 19 Mars 2015 de 9h00 à 11h00 à l’EHESS en salle 015, RdC, bât. Le France, 190 av de France 75013 Paris.

Claire Tissot (INRS), Text mining et recherche de thèmes dans un ensemble de documents : une application de R au traitement de données d’accidents de salariés nouvellement embauchés dans une entreprise. (voir affiche)

Au cours de la séance sera abordé la mise en œuvre complète de l’analyse, de la lecture des données aux traitements et sorties graphiques. Quatre packages seront utilisés : tm pour la création d’un corpus et le traitement du texte, topicmodels pour l’identification de thèmes et d’une structure intra-document, FactoMineR pour les analyses factorielles et une classification des accidents, worcloud pour un exemple d’illustration graphique.
Le nombre de places est limité, l'inscription est obligatoire à l'adresse suiavnte:
https://www.ined.fr/fr/actualites/rencontres-scientifiques/seminaires-colloques-ined/russ-seance-2/

Séance 3: Représentation et traitement de l'information géographique avec R

Jeudi 21 mai 2015 de 9h00 à 11h00 à l’EHESS en salle 015, RdC, bât. Le France, 190 av de France 75013 Paris.

Timothée Giraud et Nicolas Lambert (Ingénieurs, CNRS UMS Riate), Représentation et traitement de l'information géographique avec R (voir affiche).

R permet de simplifier les chaînes de traitements d'analyse spatiale et de cartographie qui nécessitaient auparavant l'utilisation de nombreux logiciels. A partir d'exemples serons abordés notamment l'utilisation d'API de cartographie, des opérations classiques de géotraitement ainsi que des traitements plus poussés d'analyse spatiale faisant appel aux méthodes de lissage.
Le nombre de places est limité, l'inscription est obligatoire à l'adresse:
https://www.ined.fr/fr/actualites/rencontres-scientifiques/seminaires-colloques-ined/russ-3/

Programme des séances 2013-2014

Organisateurs: Élisabeth Morand, Bénédicte Garnier, Arnaud Bringé (Ined, service Méthodes Statistiques), avec la collaboration de Florence Maillochon (Cnrs) et Pascal Cristofoli (EHESS). Ce séminaire associe le LaDéHiS et le service méthodes statistiques de l'INED. (Annonce du séminaire à l'EHESS)

Séance 1: Les enquête quantitatives : premiers traitements de données

Jeudi 28 novembre 2013, de 9h30 à 11h30, salle du conseil B à l’EHESS (bâtiment Le France)

Julien Barnier (Ingénieur d'études au Centre Max Weber Ens Lyon), Les enquête quantitatives : premiers traitements de données avec R. (Voir affiche)

R est un langage de traitement et d'analyse de données de plus en plus utilisé et qui possède de nombreux atouts : libre, gratuit, multiplateforme, il bénéficie d'un développement de type communautaire extrêmement actif qui lui permet de proposer de très nombreuses fonctionnalités. En tant que langage de programmation, son apprentissage peut cependant apparaître assez ardu, en particulier pour celles et ceux n'ayant pas d'expérience préalable en programmation.
Cette intervention s'appuiera à la fois sur un document d'introduction à R et sur l'extension associée questionr. Nous aborderons en particulier la question de la manipulation des données (indexation, recodages, tris...) et verrons en quoi les fonctionnalités de questionr peuvent faciliter ces opérations.

Séance 2: Analyses de réseaux

Jeudi 23 janvier 2014, de 9h30 à 11h30, salle du conseil B à l’EHESS (bâtiment Le France).

Arnaud Bringé (Ingénieur de recherche à l’Ined): Analyses de réseaux avec R : concepts et mise en œuvre pratique. (Voir affiche)

L’analyse de réseaux est une méthode couramment appliquée en sciences sociales, notamment en sociologie,  en histoire et en anthropologie (e.g. parenté). Après une brève présentation des concepts, nous nous intéresserons à la mise en oeuvre d’une analyse : de l’intégration des données à la représentation graphique du réseau.
A l’aide d’exemples issus des sciences sociales, nous verrons de quelle façon R permet de réaliser l’ensemble de ces étapes : structuration des données, calculs d’indicateurs descriptifs du réseau et visualisation graphique.

Séance 3: Analyse des correspondances multiples et classification

Jeudi 27 Mars 2014, de 9h30 à 11h30, salle du conseil B à l’EHESS (bâtiment Le France).

Wilfried Rault (Sociologue chargé de recherche, Ined), Bénédicte Garnier et Elisabeth Morand (Ingénieurs, Ined), Analyse des correspondances multiples et classification : un exemple de mise en œuvre avec R. (Voir affiche)

A partir de l’enquête Contexte de la Sexualité en France (CSF, INSERM, INED, 2006), on s’interrogera sur le lien entre les attitudes favorables à l’homosexualité et les caractéristiques sociales des individus. Nous présenterons l’ensemble des étapes de l’analyse réalisée avec R : de la statistique descriptive à l’analyse des correspondances multiples et la classification.
Dans le cadre de cette analyse, nous ferons un retour d’expérience sur l’utilisation des fonctions du package FactoMineR (avantages et limites).

Séance 4: Cartographie et analyse spatiale

Jeudi 22 Mai 2014, de 9h30 à 11h30, salle du conseil B à l’EHESS (bâtiment Le France).

Timothée Giraud et Nicolas Lambert (Ingénieurs, CNRS UMS Riate): Cartographie et analyse spatiale avec R. (Voir affiche)

L’intérêt pour la cartographie est assez fort dans la communauté des utilisateurs de R. Le logiciel permet la conception automatisée de cartes tout en minimisant les ruptures dans la chaîne logicielle partant des données et aboutissant à la représentation graphique. Plus généralement, R facilite la manipulation des données géographiques ainsi que la mise en place de méthodes pour l'étude de l'organisation des phénomènes dans l'espace (analyse spatiale).Par différents exemples nous montrerons plusieurs applications pratiques de cartographie et d’analyse spatiale.

Le nombre de places est limité l'inscription est obligatoire à l'adresse
http://www.ined.fr/fr/rendez_vous/seminaires_colloques/bdd/rendez_vous/894/
 

EHESS
Cnrs

flux rss Actualités

L'EHESS vous invite à aller voir la pièce "Ça ne résonne pas / Ça résonne trop" au théâtre La Commune

Théâtre - Jeudi 21 mars 2024 - 19:30La pièce Ça ne résonne pas / Ça résonne trop de Secteur In.Verso (Chiara Boitani, Climène Perrin, Mathilde Chadeau) est présentée au théâtre La Commune à Aubervilliers du 21 au 24 mars 2024. Le vendredi 22 mars, à l’issue de la représentation, un échange se tiendra entre l’équipe artistique et Christophe Bonneuil (CNRS, EHESS, CRH). Comment agir devant l’ampleur de la catastrophe écologique ? Face à l’urgence de la crise climatique, Chiara et Climène s’int(...)

Lire la suite

54, boulevard Raspail
75006 Paris
Tél. : 01.49.54.25.56