Calendrier

Lu Ma Me Je Ve Sa Di
01 02 03 04 05 06 07
08 09 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          

Programme de la semaine


Liste des séminaires

Les séminaires mentionnés ici sont ouverts principalement aux chercheurs et doctorants et sont consacrés à des présentations de recherches récentes. Les enseignements, séminaires et groupes de travail spécialisés offerts dans le cadre des programmes de master sont décrits dans la rubrique formation.

Les séminaires d'économie

Applied Economics Lunch Seminar

Atelier Histoire Economique

Behavior seminar

Behavior Working Group

brown bag Travail et Économie Publique

Casual Friday Development Seminar - Brown Bag Seminar

Development Economics Seminar

Economic History Seminar

Economics and Complexity Lunch Seminar

Economie industrielle

EPCI (Economie politique du changement institutionnel) Seminar

Football et sciences sociales : les footballeurs entre institutions et marchés

GSIELM (Graduate Students International Economics and Labor Market) Lunch Seminar

Histoire des entreprises et de la finance

Industrial Organization

Job Market Seminar

Macro Retreat

Macro Workshop

Macroeconomics Seminar

NGOs, Development and Globalization

Paris Game Theory Seminar

Paris Migration Seminar

Paris Seminar in Demographic Economics

Paris Trade Seminar

PEPES (Paris Empirical Political Economics) Working Group

PhD Conferences

Propagation Mechanisms

PSI-PSE (Petit Séminaire Informel de la Paris School of Economics) Seminar

Regional and urban economics seminar

Régulation et Environnement

RISK Working Group

Roy Seminar (ADRES)

Séminaire d'Economie et Psychologie

The Construction of Economic History Working Group

Theory Working Group

TOM (Théorie, Organisation et Marchés) Lunch Seminar

Travail et économie publique externe

WIP (Work in progress) Working Group

Les séminaires de sociologie, anthropologie, histoire et pluridisciplinaires

Casse-croûte socio

Déviances et contrôle social : Approche interdisciplinaire des déviances et des institutions pénales

Dispositifs éducatifs, socialisation, inégalités

La discipline au travail. Qu’est-ce que le salariat ?

Méthodes quantitatives en sociologie

Modélisation et méthodes statistiques en sciences sociales

Objectiver la souffrance

Sciences sociales et immigration

Archives d'économie

Accumulation, régulation, croissance et crise

Commerce international appliqué

Conférences PSE

Economie du travail et inégalités

Economie industrielle

Economie monétaire internationale

Economie publique et protection sociale

Groupe de modélisation en macroéconomie

Groupe de travail : Economie du travail et inégalités

Groupe de travail : Macroeconomic Tea Break

Groupe de travail : Risques

Health Economics Working Group

Journée de la Fédération Paris-Jourdan

Lunch séminaire Droit et Economie

Marché du travail et inégalités

Risques et protection sociale

Séminaire de Recrutement de Professeur Assistant

Seminaire de recrutement sénior

SemINRAire

Archives de sociologie, anthropologie, histoire et pluridisciplinaires

Conférence du Centre de Théorie et d'Analyse du Droit

Espace social des inégalités contemporaines. La constitution de l'entre-soi

Etudes halbwachsiennes

Familles, patrimoines, mobilités

Frontières de l'anthropologie

L'auto-fabrication des sociétés : population, politiques sociales, santé

La Guerre des Sciences Sociales

Population et histoire politique au XXe siècle

Pratiques et méthodes de la socio-histoire du politique

Pratiques quantitatives de la sociologie

Repenser la solidarité au 21e siècle

Séminaire de l'équipe ETT du CMH

Séminaire ethnographie urbaine

Sociologie économique

Terrains et religion


Agenda

Archives du séminaire Modélisation et méthodes statistiques en sciences sociales

Modélisation et méthodes statistiques en sciences sociales

Le 26/06/2012 de 10:00:00 à 12:00:00



En sciences sociales la régression logistique est une méthode communément utilisée pour la modélisation des variables qualitatives. Dans les usages les plus courants la variable dépendante modélisée comporte seulement deux modalités et la régression est alors dite logistique dichotomique. Les chercheurs sont cependant fréquemment confrontés à la nécessité de modéliser des variables comprenant plus de deux modalités ce qui les expose à une plus grande complexité en regard du choix des spécifications à retenir pour leurs modèles et également des règles à retenir pour la présentation des résultats. Nous nous intéressons dans cet atelier à la modélisation des variables qualitatives comprenant plus de deux modalités non ordonnées. Nous déclinons d’abord les différentes définitions et propriétés des modèles de régression logistique polytomiques non ordonnés à travers lesquelles est conçu le cadre théorique de la modélisation de ces variables. Dans un deuxième temps nous développons un exemple concret d’application et nous discuterons de l’intérêt d’utiliser des modèles non ordonnés pour analyser des variables ordinales ne satisfaisant pas l’hypothèse de proportionnalité des odds-ratios sous-jacente aux modèles ordonnés. Nous prendrons ainsi l’exemple de l’analyse des réponses données par les Anglais, les Français et les Allemands à des questions impliquant d’évaluer sur une échelle l’importance de différents critères d’appartenance à la nation. Ces données proviennent d’une enquête internationale portant sur les représentations de l’appartenance à la nation (ISSP, 2003).

JAYET Cyril (CMH-CNRS-ENS-EHESS) Les modèles logit polytomiques non ordonnés

Modélisation et méthodes statistiques en sciences sociales

Le 15/05/2012 de 10:00:00 à 12:00:00



Analyser les réponses à une question ouverte, exploiter un corpus d’entretiens ou de textes est une pratique courante en sciences sociales. Cette exploration peut être facilitée par des logiciels d’aide à la lecture ou à la codification mais si l’on veut saisir le sens d’un corpus et en quantifier le contenu, il est nécessaire de recourir à des outils spécifiques. Les méthodes de la statistique textuelle permettent de traiter des textes de nature très différente comme des variables particulières au moyen des outils classiques de l’analyse des données. Née dans les années 1980 de la rencontre entre plusieurs disciplines (linguistique, statistique, informatique, traitement des enquêtes, etc.), la statistique textuelle trouve aujourd’hui des applications dans des domaines de recherche extrêmement variés (linguistique, histoire, sociologie, géographie, démographie, marketing, etc.) et de plus en plus étendus. Elle fait l’objet des Journées d’Analyse statistique des Données Textuelles (JADT) qui se tiennent tous les deux ans et présentent les avancées dans ce domaine. Cette présentation s’adresse à tous ceux qui sont amenés à traiter des données recueillies sous forme de textes, quel que soit leur niveau de connaissances en statistiques. Nous montrerons l'application de ces méthodes à différents types de corpus et au moyen de différents logiciels.

GARNIER Bénédicte (SMS, Ined) Appliquer les méthodes de la statistique textuelle en sciences sociales

Modélisation et méthodes statistiques en sciences sociales

Le 20/03/2012 de 10:00:00 à 12:00:00



A l’heure où la participation des personnes tirées au sort aux enquêtes en population générale devient de plus en plus difficile à obtenir, la question de la représentativité et des processus de qualité mis en œuvre pour l’atteindre se révèle plus que jamais cruciale. Or, avant d’être une opportunité méthodologique pour les enquêtes contemporaines, Internet est surtout une manne pour les instituts de sondage qui voient les coûts de mise en œuvre d’enquêtes en ligne réduits dans des proportions très importantes. Une grande énergie est en effet régulièrement déployée pour tenter de montrer qu’un échantillon de panélistes Internet volontaires aux caractéristiques bien choisies et contrôlées puis redressées pourrait faire l’affaire des commanditaires d’études, parfois prompt à réduire leurs propres coûts. Mais de nombreux travaux menés ces dernières années, portant notamment sur les sujets sensibles, ont bien montré que des critères tels que la difficulté à joindre certaines personnes dans les échantillons aléatoires ou encore le fait de n’être pas joignable par une ligne de téléphone fixe n’étaient pas réductibles aux simples caractéristiques socio-économiques. Depuis quelques années le taux de pénétration d’Internet dans les ménages français, de l’ordre de 75%, légitime cette attention portée aux enquêtes web. Mais la confusion s’installe parfois car Internet est plus volontiers envisagé comme une base de sondage d’internautes (qui reste encore à l’heure actuelle très imparfaite) que comme un mode de collecte. Or rien n’empêche d’imaginer qu’une base de sondage classique, la meilleure disponible, soit le creuset d’une méthode d’enquête invitant les individus tirés au sort et contactés par courrier ou par téléphone, à répondre sur une page web ou à choisir le mode de collecte qui leur convient le mieux. Les avantages et les inconvénients de ces méthodes seront brièvement discutés. A-t-on avantage à conduire des enquêtes web ou multimodes ? Quelles sont les contraintes pratiques et statistiques ? Les expériences étrangères puis les dispositifs d’enquête expérimentaux en cours ou prévus en France seront également brièvement présentés. Enfin, on listera quelques questions qui restent à résoudre.

BECK François (INPES) Représentativité et enquêtes WEB

Modélisation et méthodes statistiques en sciences sociales

Le 31/01/2012 de 10:00:00 à 12:00:00



La multiplication ces dernières années des recueils de récits de vie a créé une émulation autour des méthodes d’analyse de données longitudinales et en particulier les typologies de trajectoires. Selon le point de vue que l’on adopte, les différences entre individus à la base desquelles se construisent les typologies se mesurent différemment. Nous présentons ici un panorama de méthodes de typologies de trajectoires et des outils d’analyse pour autant d’approches et de problématiques : mesurer par quels chemins et à quelle vitesse les jeunes s’insèrent sur le marché du travail, et leur capacité à tenir compte des caractéristiques d’un marché du travail influencé par nombre de facteurs exogènes. Selon que l’on considère que l'environnement dans lequel se déroulent les trajectoires est global ou propre à chaque individu, qu'il évolue ou non dans le temps, il convient d’utiliser une méthode dont les paramètres et les sorties sont adaptées. On proposera des illustrations de ces méthodes à partir des trajectoires d'insertion des jeunes, décrites par les enquêtes "Génération" du Céreq.

GRELET Yvette (CEREQ) Les typologies de trajectoires : choisir la bonne distance...

Modélisation et méthodes statistiques en sciences sociales

Le 29/11/2011 de 10:00:00 à 12:00:00



Au début des années 1980, au moment de la mise en place de la nomenclature des PCS, Luc Boltanski et Laurent Thévenot ont réalisé des travaux sur les catégorisations ordinaires de l’espace social. Ces travaux se sont notamment appuyés sur un dispositif empirique original tiré d’un jeu de cartes : les enquêtés étaient invités à commenter et à classer des cartes représentant des individus et leurs caractéristiques sociales selon leur degré de ressemblance . A la fin des années 2000, au moment des débats autour de la mise en place éventuelle d’une nomenclature socioprofessionnelle européenne, des enquêtes reprenant le principe du jeu de cartes ont été menées en France et dans divers pays européens sous l’impulsion de Cécile Brousse (en charge à l’INSEE des questions de nomenclatures socioprofessionnelles). L’objectif de cette communication est de présenter d’une part les méthodes statistiques mobilisées pour traiter quantitativement ce matériau inhabituel et d’autre part de donner un aperçu des premiers résultats obtenus sur une population de 496 salariés français. On donnera ainsi à voir autant les éléments communs dans les classements effectués que les variations selon la position dans le monde du travail ou encore les caractéristiques des enquêtés.

DEAUVIEAU Jérôme (Printemps (UVSQ), LSQ , INED) Les catégorisations de l’espace socioprofessionnel par les salariés français : une étude à partir d’un jeu de cartes.

Modélisation et méthodes statistiques en sciences sociales

Le 18/10/2011 de 10:00:00 à 12:00:00



Lorsqu’on souhaite estimer des paramètres définis sur des populations de relativement petite taille à partir de données d'enquête obtenues par sondage, on se trouve confronté au problème de la médiocre qualité des estimations issues des méthodes classiques. C’est une conséquence mécanique de la faible taille de l’échantillon qui recoupe ces petites populations (appelées "domaines"). Pour améliorer la précision des estimations, on dispose néanmoins d'un ensemble de méthodes utilisant de l’information auxiliaire issue de sources exhaustives ou à défaut d’enquêtes par sondage de très grande taille (par exemple les enquêtes de recensement). Dans cet esprit, l'exposé présentera une application de deux modèles permettant d'obtenir une estimation trimestrielle du nombre de chômeurs BIT sur des "Zones d'emploi", puisqu'on convient généralement que l'enquête trimestrielle Emploi de l'Insee ne permet pas, seule et en l'état, de procéder avec une précision jugée suffisante à des estimations d'effectifs de chômeurs sur des zones géographiques infra régionales.

ARDILLY Pascal (INSEE) Une application de méthodes d'estimation sur petits domaines à l'estimation localisée du chômage

Modélisation et méthodes statistiques en sciences sociales

Le 28/06/2011 de 10:00:00 à 12:00:00

EHESS - 105, bd Raspail - Salle 1

BURRICAND Carine (INSEE) L'enquête Européenne Statistiques sur les ressources et les conditions de vie SRCV /SILC : de la richesse d'information aux difficultés de comparaison internationale

L’enquête Statistiques sur les ressources et les conditions de vie (SRCV) est la partie française du système communautaire EU-SILC (Community statistics on income and living conditions). Le projet EU-SILC répond à une demande de la commission européenne et est piloté par Eurostat. L’enquête couvre de nombreux thèmes relatifs aux ressources et aux conditions de vie des ménages. Elle sert de référence pour les comparaisons de distributions de revenus entre Etats membres de l’Union Européenne et pour les actions communautaires de lutte contre l’exclusion. Son dispositif s’articule autour de deux composantes : une composante « transversale » sous forme d’enquête traditionnelle annuelle, et une composante « longitudinale » sous forme de panel. Lancée en France en 2004, l'enquête permet de répondre à la demande Européenne mais aussi à une demande nationale puisqu'elle inclut également des questionnements sur des thèmes sociaux (participation culturelle et sportive, mobilité sociale) depuis 2008 ainsi que des questions subjectives sur le bien-être depuis 2010. Si l'enquête est obligatoire au niveau européen et encadrée par des règlements d'application, une certaine souplesse est accordée aux pays membres tant quant au mode de collecte, aux modèles d'imputation ainsi que dans le questionnement. L'obligation portant sur les seules variables cibles, la comparabilité des résultats au niveau européen peut être rendue parfois difficile.

Modélisation et méthodes statistiques en sciences sociales

Le 31/05/2011 de 10:00:00 à 12:00:00



La méthode de l'évaluation aléatoire simple repose sur la constitution, en amont de la mise en œuvre du programme dont l'on souhaite évaluer l'impact, d'un groupe test et d'un groupe témoin de manière aléatoire. Ceci permet, dans certaines conditions, d'assurer l'identité, en moyenne, des deux groupes avant toute intervention. Tout au long de l'expérimentation, seul le groupe test bénéficiera du programme, mais les deux groupes seront enquêtés afin, d'une part, de pouvoir vérifier cette identité ex-ante, et d'autre part, de pouvoir les comparer à la fin du programme, ou après une période plus longue selon l'information que l'on souhaite obtenir. La présentation visera tout d'abord à présenter une méthode jumelle qui est celle de "l'encouragement à la participation", puis à expliciter les intérêts et limites de cette méthode d'évaluation en insistant entre autres sur la différence entre évaluation d'impact et évaluation de processus. Elle s'appuiera sur l'évaluation du dispositif de la "mallette des parents", dont l’objectif des deux années d'expérimentation a été d’accroître la participation des parents d’élèves de 6ème à la scolarité de leurs enfants en évaluant les effets de la mise en place d’ateliers d’accompagnement et de débats pour renouer le lien avec le milieu scolaire. Les résultats obtenus permettront également de préciser l'importance de pouvoir détecter et mesurer d'éventuels effets d'entrainement - positifs ou négatifs - sur les personnes ne participant pas au programme mis en place. Cette présentation sera en outre l'occasion de détailler le protocole d'enquête mis en œuvre au long des deux années d'expérimentation, protocole par certains côtés indissociable de la méthode d'évaluation et d'exploitation des données.

GUYON Nina (PSE) Évaluation de l'impact d'un dispositif d'encouragement à la participation : la méthode de l'évaluation aléatoire. Application à l’évaluation du programme "Influence des parents sur les élèves"

Modélisation et méthodes statistiques en sciences sociales

Le 29/03/2011 de 10:00:00 à 12:00:00



A l’occasion de la mise en place de la 5e vague de l’enquête European Social Survey (ESS), cette intervention se propose de présenter une application de ces données par l’analyse des correspondances multiples spécifique (ACM spé), variante de l’ACM classique (Chiche et al., 2000 ; Le Roux, Rouanet, 2010). Nous présenterons dans un premier temps les grandes caractéristiques de cette enquête européenne qui a débuté en 2002 et les fondements statistiques de la méthode de l’ACM spécifique. A partir de la deuxième vague de l’ESS, nous montrerons dans un second temps en quoi ce type d’analyse géométrique des données permet de comprendre l’articulation entre les attitudes à l’égard des normes et des déviances, et les rapports de confiance envers l’administration, la sphère politique et le monde privé (artisans et institutions financières) (Lascoumes, Le Hay, 2010). Parmi les 15 pays européens étudiés, cinq grands modèles peuvent être dégagés. Dans ce panorama, la France et la Suède se présentent comme des cas particuliers qu’il sera intéressant de souligner. Bibliographie : - Chiche (Jean), Le Roux (Brigitte), Perrineau (Pascal), Rouanet (Henry), 2000, « L’espace politique des électeurs français à la fin des années 1990 : Nouveaux et anciens clivages, hétérogénéité des électorats », Revue française de science politique, vol. 50, n° 3, pp. 463-488. - Lascoumes (Pierre), Le Hay (Viviane), 2010, « Tolérances de la fraude et relations de confiance », Boy (Daniel), Cautrès (Bruno), Sauger (Nicolas) (dir.), Les Français, des Européens comme les autres ?, Paris, Presses de Sciences Po, pp. 73-108. - Le Roux (Brigitte), Rouanet (Henry), 2010, Multiple correspondence analysis, CA: Thousand oaks, Sage, 128 p.

LE HAY Viviane (CNRS-CEVIPOF) Tolérances de la fraude et relations de confiance en Europe : Un exemple d’application de la méthode de l’ACM spécifique à partir de l’enquête European Social Survey

Modélisation et méthodes statistiques en sciences sociales

Le 25/01/2011 de 10:00:00 à 12:00:00



Au cours de la période récente et dans de nombreuses disciplines (Sciences de l’éducation, Economie, Sociologie, Epidémiologie,…) les travaux quantitatifs portant sur l’analyse des comportements individuels ont mobilisé de façon croissante l’analyse multi-niveaux. Cette méthodologie présente en effet l’intérêt de permettre la recherche des sources de variation des phénomènes étudiés non plus dans la seule prise en compte de variables individuelles mais également dans la mobilisation de données relatives aux contextes (sociaux, institutionnel, géographiques…) dans lesquels évoluent les individus permettant ainsi l’analyse des interactions entre ces deux entités. L’objectif de cette présentation est d’examiner dans quelle mesure cette approche peut être utilement mise en œuvre dans le cadre d’études internationales portant sur les comportements individuels. En d’autres termes disposant de données statistiques structurées par pays est-il justifié de poser l’hypothèse selon laquelle les caractéristiques du pays d’appartenance d’un individu sont susceptibles d’influer sur son comportement ? Après un rappel rapide des principaux outils mobilisés par la méthodologie multi-niveaux j’introduirai trois exemples portant sur une approche comparative des comportements individuels en matière santé entre différents groupes de pays. Nous verrons ainsi de quelles façons les chercheurs ont mobilisé la méthodologie multi-niveaux dans leurs analyses . Quels ont été les résultats et les limites de cette mise en œuvre ? Enfin nous tenterons de dégager quelques enseignements pratiques relativement à l’usage de la méthodologie multi-niveaux dans ce cadre.

LE VAILLANT Marc (CERMES3, CNRS - INSERM) Analyses multi-niveaux et comparaisons internationales

Modélisation et méthodes statistiques en sciences sociales

Le 30/11/2010 de 10:00:00 à 12:00:00



L’exposé partira sur un exemple d’utilisation classique d’analyse des correspondances multiples (ACM). Ces mêmes données serviront à aborder la prise en compte de variables structurées en groupes sous le double point de vue des problèmes posés et de la solution apportée par l’analyse factorielle multiple (AFM). Dans un second temps, sera évoqué le cas d’un mélange de variables quantitatives et qualitatives (données mixtes). Le principe de l’analyse factorielle de données mixtes (AFDM) sera décrit. En combinant AFM et AFDM, on obtient une méthodologie permettant d’envisager de données de type très général ce qui sera illustré par un exemple.

Pagès Jérôme (Agrocampus, Rennes) Analyse factorielle de variables qualitatives structurées en groupes et de données mixtes

Modélisation et méthodes statistiques en sciences sociales

Le 19/10/2010 de 10:00:00 à 12:00:00



Il est courant en sociologie de chercher à traduire les odds ratio, résultats bruts d’une modélisation logit (ou régression logistique), en probabilités ou pourcentages, c’est-à-dire dans le langage du tableau croisé. Cette communication vise à présenter et discuter deux façons différentes de réaliser cette opération, dénommées « l’écart pur » et « l’écart expérimental ». Nous présentons et comparons tout d’abord les principes de ces deux méthodes sur le plan général et à partir d’exemples concrets ; puis nous abordons les solutions logicielles permettant de les mettre en œuvre. Nous comparons ensuite les résultats obtenus par ces deux méthodes sur les mêmes jeux de données. Enfin, les deux méthodes sont généralisées au cas de la modélisation polytomique non ordonnée.

DEAUVIEAU Jérôme (Laboratoire Printemps, CNRS, Université de Versailles-Saint-Quentin) Écart pur ou écart expérimental ? Deux façons de traduire sous forme de probabilités les résultats d’une modélisation logit dichotomique et polytomique non ordonnée

Modélisation et méthodes statistiques en sciences sociales

Le 22/06/2010 de 10:00:00 à 12:00:00

105 Bd Raspail - Salle 2

La présentation reviendra sur les différentes méthodes mises en œuvre, analyses factorielles, régressions et calcul de coefficients de similarité, afin d’exploiter statistiquement les réponses de 800 individus à un protocole d’enquête original, inspiré de l’expérience menée par Luc Boltanski et Laurent Thévenot au début des années 1980. À partir d’un jeu de 33 cartes décrivant des profils d’actifs au moyen de plusieurs caractéristiques (diplôme, profession, statut d’emploi…), les enquêtés doivent construire des groupes qu’ils jugent socialement homogènes, les dénommer et choisir la carte la plus représentative pour chacun d’entre eux. Il s’agit pour le chercheur de recomposer les différentes logiques de classifications mobilisées par les enquêtés.

JAYET Cyril (CMH) Exploitation de l'enquête sur la nomenclature ESEC

Modélisation et méthodes statistiques en sciences sociales

Le 25/05/2010 de 10:00:00 à 12:00:00



En 2007, plus de 3000 salariés ont répondu à l’enquête SalSa (les Salaires vus par les Salariés) initiée par le Centre Maurice Halbwachs et l’Insee. Cette enquête porte sur les modalités subjectives de la perception des salaires ainsi que les critères et les conceptions de la justice auxquels se réfèrent les individus pour juger de leur montant. En jugeant le montant de leurs salaires, les personnes interrogées se réfèrent visiblement à des registres de justice très différents : certains estiment que leur salaire ne leur permet pas de satisfaire leurs besoins; d'autres qu'ils apportent plus à leur entreprise que ce qu'elle veut bien leur rétrocéder; d'autres que leur salaire ne correspond pas à la valeur de leur capital humain mesuré par leurs diplômes... Est-il possible de prendre une mesure statistique de cette configuration d'attitudes et d'en expliquer les tenants et aboutissants, à partir de variables (et indiscrètes)? Analyses factorielles, régressions logistiques et statistiques textuelles seront mobilisées (et confrontées à des entretiens qualitatifs), pour traiter ces riches données et répondre à la question.

BAUDELOT Christian (ENS) Identification statistique des conceptions de la justice

Modélisation et méthodes statistiques en sciences sociales

Le 13/04/2010 de 10:00:00 à 12:00:00



L’intervention portera sur la méthodologie du programme SIRS (« Santé, Inégalités et Ruptures Sociales ») en Ile-de-France, lequel interroge par questionnaire, tous les deux ans depuis 2005, une cohorte (panel) de 3000 personnes. A partir de cet exemple précis, il s’agira d’aborder les questions que soulèvent les différentes étapes de la mise en œuvre d’une telle enquête – notamment l’élaboration de l’échantillon, la construction du questionnaire, l’encadrement des enquêteurs ou encore le suivi dans le temps des enquêtés (en particulier les problèmes d’attrition de la cohorte). L’exposé présentera de façon concrète les problèmes rencontrés et les solutions mises en œuvre par l’équipe pluridisciplinaire, en fonction des problématiques de recherche mais aussi des contraintes financières et organisationnelles du programme.

PARIZOT Isabelle (CNRS, CMH) Méthodologie autour de l'enquête longitudinale SIRS(Santé, Inégalités et Ruptures Sociales

Modélisation et méthodes statistiques en sciences sociales

Le 23/03/2010 de 10:00:00 à 12:00:00



Résumé: L’exposé partira sur un exemple d’utilisation classique d’analyse des correspondances multiples (ACM). Ces mêmes données serviront à aborder la prise en compte de variables structurées en groupes sous le double point de vue des problèmes posés et de la solution apportée par l’analyse factorielle multiple (AFM). Dans un second temps, sera évoqué le cas d’un mélange de variables quantitatives et qualitatives (données mixtes). Le principe de l’analyse factorielle de données mixtes (AFDM) sera décrit. En combinant AFM et AFDM, on obtient une méthodologie permettant d’envisager de données de type très général ce qui sera illustré par un exemple.

PAGES Jérôme (Agrocampus, RENNES) Analyse factorielle de variables qualitatives structurées en groupes et de données mixtes; () ;

La séance est annulée

Modélisation et méthodes statistiques en sciences sociales

Le 16/02/2010 de 10:00:00 à 12:00:00



La simulation agents s'est développée depuis le début des années 1990 dans différentes branches des sciences sociales. Son usage repose sur deux notions centrales, le système complexe et la rationalité limitée, et sur un paradigme de démonstration nouveau, la capacité à "générer" un fait social ("generative social science", Epstein, 2006). Il s'agit en effet de faire émerger des régularités observables au niveau méso ou macro-social sur la base d'hypothèses micro-comportementales. Durant ce séminaire, on évoquera quelques applications en montrant comment la simulation agent peut être utilisée d'un point de vue théorique, afin de comprendre mieux quel usage les individus font de l'information qu'ils reçoivent ou dans des applications à la prise de décision collective.

ROUCHIER Juliette (GREQAM, Marseille) La simulation agents en sciences sociales

Paola Tubaro (CMH)

Modélisation et méthodes statistiques en sciences sociales

Le 26/01/2010 de 10:00:00 à 12:00:00



Cette séance fait suite à la séance sur les variables latentes animée par Gilbert SAPORTA (CNAM) le 14 novembre 2009. Nous présenterons dans cette conférence des méthodes permettant d’analyser un ou plusieurs tableaux de données : analyse factorielle exploratoire, analyse factorielle confirmatoire, modèle à équations simultanées et modèle à équations structurelles sur variables latentes. Ces méthodes sont plus puissantes que les méthodes habituelles d’analyse des données car elles acceptent des construits (ou facteurs, composantes, variables latentes, scores,…) corrélés entre eux et prennent en compte des hypothèses de causalité. Elles permettent aussi de valider des hypothèses en comparant le modèle étudié aux données recueillies. Ces méthodes sont largement utilisées en psychologie, en sociologie, en science politique, en management des ressources humaines, en marketing, en management stratégique. Toutes ces méthodes seront présentées à partir du logiciel AMOS.

TENENHAUS Michel (HEC) Modèles à équations structurelles

Modélisation et méthodes statistiques en sciences sociales

Le 24/11/2009 de 10:00:00 à 12:00:00



Introduction aux modèles à variables latentes Les modèles à variables latentes ont été introduits dans les sciences humaines dès le début du 20 ème siècle avec l'analyse factorielle de Spearman et Thurstone, puis ensuite les structures latentes dans les années 50. Ils postulent l'existence de variables inobservables directement (appelées facteurs ou variables latentes) telles l'intelligence, l'engagement religieux etc., mais dont on peut mesurer ou observer des conséquences comme la fréquentation des lieux de culte, la réussite à certains tests… L'hypothèse fondamentale est que les covariations entre variables observées (dites également " variables manifestes ") s'expliquent par la dépendance de chaque variable observée avec les variables latentes d'où le principe d'indépendance conditionnelle : les variables observées sont indépendantes conditionnellement aux variables latentes. On présentera un panorama des 4 types de modèles à variables latentes obtenus en croisant la nature (qualitative ou quantitative) des variables manifestes avec celle des variables latentes, en les reliant à certains modèles de mélange de distributions et aux pratiques usuelles de l'analyse exploratoire des données. Une attention particulière sera accordée au modèle de classes latentes et à la personnalité de son inventeur Paul Félix Lazarsfeld. Cette séance sera suivie, le 26 janvier 2010, par une séance sur les équations structurelles.

SAPORTA Gilbert (CNAM) Introduction aux modèles à variables latentes

Modélisation et méthodes statistiques en sciences sociales

Le 20/10/2009 de 10:00:00 à 12:00:00



Trideux est un logiciel libre de dépouillement d'enquête, librement reproductible mis au point par Philippe Cibois. Il fonctionne sous windows (98 à XP et Vista). L'objet de ce logiciel est de fournir aux chercheurs, enseignants, étudiants et à toute personne en ayant l'utilisation un outil simple d'usage et gratuit pour dépouiller des enquêtes en utilisant des techniques simples comme les tris croisés ou plus complexes comme l'analyse factorielle, des méthodes post-factorielles ou la régression sur données d'enquête. Une version dite "UVSQ", car développée à l'Université de Versailles Saint-Quentin, a été écrite à partir de 2006 par Alex Alber pour servir de support pédagogique à l'enseignement des méthodes quantitatives en sciences sociales. Elle présente certaines innovations ergonomiques et fonctionnelles vouées à accélérer les dépouillements. Dans une première partie, Alex Alber présentera Trideux UVSQ et les possibilités de la version actuelle : par exemple, importation directe de bases de données saisies en Excel ; affichage graphique des tris à plat, des attractions et répulsions dans un tableau croisé, des effets marginaux dans une régression logistique. Dans une deuxième partie, Philippe Cibois présentera les développements en cours, en particulier l'implémentation des techniques sans situation de référence en régression logistique (en utilisant des propositions faites par Jérôme Deauvieau dans un article à paraitre du BMS "Comment traduire sous forme de probabilités les résultats d'une modélisation logit?")

CIBOIS Philippe (UVSQ, Printemps) Trideux: nouveaux développements

Modélisation et méthodes statistiques en sciences sociales

Le 23/06/2009 de 10:00:00 à 12:00:00



La séance portera sur la modélisation des tableaux de contingence illustrée sur les problématiques de démocratisation scolaire. Elle abordera des questions techniques sur ces modèles (choix du modèle, méthode d'estimation, modélisation sous-jacente) mais essaiera aussi de les comparer à d'autres modélisations (question de l'hétérogénéité non observée et de l'"ability bias" notamment).

ALBOUY Valérie (INSEE) Modélisations sur données individuelles

Modélisation et méthodes statistiques en sciences sociales

Le 19/05/2009 de 10:00:00 à 12:00:00



la multicolinéarité conduit à des estimations instables des coefficients d'un modèle de régression linéaire multiple. La solution brutale qui consiste à éliminer des prédicteurs peut ne pas être acceptable pour le chercheur qui a un modèle issu d'une théorie. Le problème est devenu crucial dans de nombreuses applications où on dispose de plus de variables que d'unités observées. On présentera un panorama des solutions les plus efficaces permettant de conserver toutes les variables : régression sur composantes principales, régression ridge et régression PLS. On donnera également des indications sur le LASSO qui aboutit à une sélection de variables via une pénalité L1 .

SAPORTA Gilbert (CNAM) Diagnostic et traitement de la multicolinéarité en régression linéaire

Modélisation et méthodes statistiques en sciences sociales

Le 28/04/2009 de 10:00:00 à 12:00:00



La représentativité est une notion qui n'a pas bonne presse aujourd'hui auprès des statisticiens car ils la trouvent peu scientifique. Pourtant, cette notion a été absolument cruciale pendant l'invention des sondages, y compris des sondages aléatoires, tout au long du XXème siècle, et surtout au moment où les non-statisticiens, en particulier les politiques, se sont intéressés aux techniques d'enquête reposant sur un échantillonnage. Nous reviendrons sur cette histoire, qui s'est déroulée en grande partie aux USA pendant le New Deal, et sur ce qu'on peut en retenir pour nos pratiques actuelles.

DIDIER Emmanuel (CNRS-CESDIP ) La représentativité statistique : histoire et usages actuels.

Modélisation et méthodes statistiques en sciences sociales

Le 31/03/2009 de 10:00:00 à 12:00:00



A partir du milieu des années 90, alors que l’harmonisation des statistiques sociales s’intensifie, Eurostat et la Commission européenne commandent une série de rapports sur la possibilité d’élaborer une nomenclature socio-économique européenne. Pendant la décennie 1996-2006, chercheurs et statistisciens, français et britanniques pour la plupart, rivalisent de propositions et d’expertises. En 2006, une équipe de sociologues coordonnée par David Rose et Eric Harrison, soumet aux instituts de statistiques un projet baptisé ESeC, très proche de la nomenclature rénovée britannique de 2002 (la National Statistics Socio-economic Classification (NS-SEC)), elle-même largement inspirée d’une d’une variante de la classification Erikson-Goldthorpe-Portocarrero (EGP), communément utilisées dans les travaux de comparaison internationale sur la mobilité et les inégalités sociales. Ce projet de classification, qui est actuellement examiné par Eurostat et les INS, a vocation à figurer dans le tronc commun des enquête Ménages communautaires. Sur un plan opérationnel, il se définit par un simple croisement entre la nomenclature internationale des professions (CITP) et un petit nombre de variables complémentaires, distingue 9 groupes sociaux.

BROUSSE Cécile (INSEE) Nomenclature socio-économique européenne (ESeC)

Co-auteur: Etienne Pénissat (CMH, équipe ETT)

Modélisation et méthodes statistiques en sciences sociales

Le 27/01/2009 de 10:00:00 à 12:00:00



Le panel d'outils statistiques offerts aux chercheurs en sciences sociales ne cesse de s'enrichir, contribuant à étendre la pratique et la réflexion sociologiques. Pour autant, la multiplication de techniques sophistiquées ne sert pas nécessairement la construction du sens et l'interprétation des données, notamment lorsque ils sont utilisés déconnectés de la connaissance que le chercheur a du "terrain" et du domaine de sa recherche. Ce séminaire se propose de questionner les enjeux et les conditions d'un usage raisonné des statistiques en sociologie, et de souligner par l'exemple les apports et les limites des modes émergents d'articulation entre démarches quantitatives et qualitatives.

SELZ Marion (CNRS-CMH) Articulations des méthodes qualitatives et quantitatives : pour un usage raisonné des statistiques en sociologie.

Modélisation et méthodes statistiques en sciences sociales

Le 25/11/2008 de 10:00:00 à 12:00:00



Les réponses données par les personnes lorsqu'on les interroge sur leur niveau de satisfaction dans divers domaines (leur emploi, leur situation financière, etc.) sont délicates à interpréter. Elles mêlent en effet réalité et perception. Certes, on le constate régulièrement, la satisfaction exprimée par l'individu est corrélée avec des facteurs objectifs décrivant sa situation. Mais cette corrélation passe aussi par des éléments plus subjectifs et qui tiennent à la manière dont la personne évalue la situation qu'elle vit. L'objet de l'étude est de montrer que le caractère hybride de ces variables n'empêche pas de les utiliser avec profit. Au contraire, ces variables sont précieuses car elles permettent, lorsqu'elles sont couplées à des données objectives, d'inférer ou d'estimer des grandeurs qui sont inobservées ou qui sont très difficiles à mesurer directement. Mais cela ne vaut que si on est capable d'isoler ou de contrôler les facteurs personnels qui interviennent dans l'expression de la satisfaction. Pour illustrer le propos, nous prenons un cas pratique, celui de la satisfaction exprimée par le salarié vis-à-vis de son temps du travail. A l'aide d'un modèle très simple, nous montrons que la satisfaction exprimée nous permet en théorie, en connaissant le nombre d'heures effectivement travaillées, d'inférer la distribution des préférences individuelles en matière de durée hebdomadaire du travail. Le modèle permet aussi de repérer les points de difficulté tenant à la nature subjective de la variable de satisfaction, de manière à pouvoir intervenir en connaissance de cause lors de la phase d'estimation. En nous appuyant sur les huit vagues 1994-2001 de la partie française du Panel Européen des Ménages, nous estimons la valeur moyenne des heures préférées. Nous montrons que des modèles « naïfs », c'est-à-dire des modèles qui ignoreraient la spécificité des variables de satisfaction, donnent des estimations des heures préférées substantiellement biaisées.

AFSA ESSAFI Cédric (INSEE) Interpréter les variables de satisfaction: l'exemple de la durée du travail

Modélisation et méthodes statistiques en sciences sociales

Le 21/10/2008 de 10:00:00 à 12:00:00



L’étude des parcours de vie en sciences sociales fait l’objet depuis plusieurs décennies de très nombreux travaux. D’un point de vue méthodologique, ce sont principalement les approches probabilistes, centrées sur la modélisation d’évènements (approche atomiste), qui ont été privilégiées. Toutefois, la complexité croissante des parcours a amené le développement de techniques exploratoires, appréhendant la trajectoire comme un tout (approche holiste). Si diverses méthodes ont été proposées, en particulier dans le champ de l’analyse de séquences, c’est l’Optimal Matching Analysis qui bénéficie du plus large écho. Issue de la biologie moléculaire puis introduite dans les sciences sociales par Andrew Abbott dans les années 1980, l’OMA consiste à mesurer la similarité de chaque paire de séquences puis à construire à partir de cette mesure une matrice de distance, permettant par les méthodes de classification d’obtenir des typologies. L’OMA a souvent été utilisée pour explorer et décrire les carrières professionnelles ou l’insertion, mais les champs d’application sont très variés. Cette présentation sera illustrée d’exemples sur les trajectoires professionnelles et le passage à l’âge adulte.

ROBETTE Nicolas (IDUP-INED) Un outil pour explorer et décrire les parcours de vie: l’Optimal Matching Analysis

Modélisation et méthodes statistiques en sciences sociales

Le 24/06/2008 de 10:00:00 à 12:00:00



Parce qu’ils sont inscrits au cœur du fonctionnement des sociétés, certains phénomènes sont dotés d’une inertie temporelle considérable. Tel est typiquement le cas de la liaison statistique qui existe entre la position sociale d’individus adultes et celle de leurs ascendants, ou encore du lien entre le diplôme le plus élevé d’individus adultes et leur milieu social d’origine. La nature qualitative des variables en jeu pose alors une forme de défi à l’analyse statistique pour qui souhaiterait examiner la variation temporelle de telles liaisons. En effet, dans des modèles classiques de type log-linéaire ou logit, l’introduction d’une interaction avec le temps (année d’enquête ou génération) implique souvent l’estimation d’un nombre important de paramètres supplémentaires. Il en résulte alors que la variation temporelle du phénomène est susceptible de ne pas apparaître clairement. Une avancée importante a été obtenue sur cette question dans les années 1990 par l’adoption d’une modélisation statistique plus parcimonieuse de type log-multiplicatif : modèle « Unidiff » d’Erikson & Goldthorpe (1992) ou de Xie (1992), modèle de Goodman & Hout (1998 et 2001). Ces développements méthodologiques ont joué un rôle important en sociologie en contribuant, ces dernières années et dans plusieurs pays, à préciser les conclusions de la recherche sur la dynamique temporelle de l’inégalité des chances sociales et de l’inégalité des chances scolaires. L’exposé, entièrement construit autour de l’analyse de données réelles, aura pour but de présenter ces modèles statistiques comme d’illustrer leur usage et de mettre en évidence leur utilité dans la recherche empirique en sciences sociales. La présentation PDF sur laquelle il s’appuiera sera disponible pour les participants à la fin de la séance.

VALLET Louis-André (CNRS - Grecsta ( CNRS & INSEE)) COMMENT ANALYSER LA DYNAMIQUE TEMPORELLE D’ASSOCIATIONS STATISTIQUES

Modélisation et méthodes statistiques en sciences sociales

Le 27/05/2008 de 10:00:00 à 12:00:00

HARKNESS Janet (Director of the Survey Research and Methodology Program at the Univers) Questionnaire Design and Implementation in Comparative Contexts

The presentation focuses on questionnaire design and implementation in comparative contexts, in particular on the interdependence of questionnaire design and version production in other languages. It introduces models used to design and produce questionnaires for cross-lingual, cross-cultural contexts and illustrates various strategies of adaptation and harmonization employed in producing other language versions. Some considerations of mode as these relate to language (web, telephone) and of means (interpreted and orally translated interviews) are included. The potential and limitations of alternative models are suggested. The challenges met when questions are used in a survey that were not designed for that given comparative context are thus also highlighted.

Modélisation et méthodes statistiques en sciences sociales

Le 25/03/2008 de 10:00:00 à 12:00:00



Les réseaux sociaux sont aujourd’hui reconnus comme une déterminante importante du comportement et du bien-être des individus ; la structure des réseaux sociaux, à son tour, dépend des comportements et des caractéristiques des acteurs qui en font partie. L’objectif de ce séminaire est de proposer une introduction pratique aux outils qui ont été mis au point pour modéliser ces interactions complexes. La première partie sera consacrée aux modèles de formation des réseaux pour des données en coupe, en commençant par ce que l’on appelle dans la littérature p2, pour passer ensuite à la famille de modèles p*, également connus sous le nom d’ERGM (Exponential Random Graph Models). La deuxième partie de l’exposé sera consacrée à l’un des principaux modèles pour l’étude de la dynamique des réseaux sociaux, SIENA (Simulation Investigation for Empirical Network Analysis), conçu pour des données longitudinales. L’apport de ces méthodes à l’étude de phénomènes sociaux sera illustré à l’aide d’une étude de cas : le réseau de conseil entre les juges du Tribunal de Commerce de Paris.

TUBARO Paola (CMH-EconomiX (CNRS et Université Paris X) ) Les méthodes d’analyse empirique des réseaux sociaux

Modélisation et méthodes statistiques en sciences sociales

Le 19/02/2008 de 10:00:00 à 12:00:00



Le projet d’enquête «Générations et Genre» (GGS) a été lancé en 2000 par la Population Activities Unit (PAU) de la Commission Économique. «Générations et Genre» est un programme d 'enquête internationales centrées sur la description et l’explication de la dynamique de la construction de la famille, privilégiant deux grands axes d’étude : les relations de genre et les relations entre générations. Deux autres dimensions susceptibles de jouer un rôle déterminant dans les comportements démographiques sont par ailleurs prises en compte dans le questionnement : la dimension subjective (normes, intentions, attitudes et valeurs) et la dimension économique (activité, revenus). Autre nouveauté: l’approche longitudinale, avec trois passages, à intervalle de trois ans chacun et la mise en place parallèlement d’une base de données contextuelle. Tous les pays participant à ce programme se sont engagés à faire passer un questionnaire de base le plus semblable possible, suivant une méthodologie si possible la plus comparable. Mais les questions et les problématiques sous-jacentes ne prennent pas partout le même sens. Et la gestion du terrain peut également prendre des formes variées. L'exposé portera donc sur la manière dont trois pays, la Russie, en 2004 la Géorgie, en 2006, et la France, en 2007, ont réalisé la première vague de cette enquête, et comment ils envisagent la seconde ou l’ont, dans le cas de la Russie en 2007, mise en oeuvre. On abordera les thèmes de l'adaptabilité et de la comparabilité d'un questionnaire initial standard, les questions de sa traduction, les questions communes rencontrées sur le terrain par les trois pays, mais aussi leurs préoccupations scientifiques spécifiques. On évoquera aussi des questions plus pratiques telles que la recherche de financement et de partenariat, les cadres juridiques de ces enquêtes, le recrutement et la formation des enquêteurs, ou encore celle de la recherche de légitimation scientifique internationale à travers cette enquête. On discutera enfin des questions de comparabilité de la mise en œuvre de ces enquêtes, de ses conditions d’exploitation, et de celle in fine des résultats produits

LEFEVRE Cécile (INED) Décliner nationalement un projet d’enquête internationale : l’expérience des enquêtes « Gender and Generation » en France, Russie et Géorgie

Modélisation et méthodes statistiques en sciences sociales

Le 29/01/2008 de 10:00:00 à 12:00:00



Dans la première moitié des années 1920, la statistique administrative soviétique se caractérisait par une utilisation très diversifiée des enquêtes par sondage. Au carrefour des apports du calcul des probabilités à la théorie des sondages et des questions de méthode posées par la pratique de ces enquêtes, en particulier pour construire les échantillons de population, les statisticiens russes poursuivaient un questionnement entamé dans leur pays à la fin du XIXe siècle. L’application du tirage aléatoire posa toutefois une question particulière en URSS : quel rôle pouvait avoir le hasard dans un monde planifié, où justement l’incertitude ne pouvait pas avoir de place, et où le caractère imprévisible des comportements individuels et la variabilité des cas individuels ne pouvaient pas être pris en compte théoriquement ? L’exposé s’efforcera de montrer comment la résolution de ces questions a pu influer sur la construction des techniques d’échantillonnage et sur les formes d’usage des enquêtes par sondage en URSS jusqu’en 1991. La manière de traiter l’échantillon aléatoire en Russie et en URSS sera présentée dans une perspective comparative.

MESPOULET Martine (Univ. de Poitiers) Les enquêtes par sondage en URSS.

Modélisation et méthodes statistiques en sciences sociales

Le 15/01/2008 de 10:00:00 à 12:00:00



Cette séance présentera de façon synthétique les principaux centres d'archives et stocks mondiaux de microdonnées selon différents modes de regroupements, du point de vue des finalités et du point de vue des contenus. Au delà d'une comparaison des modes d'accès et de contrôle de la diffusion des données, il s'agira de souligner les transformations depuis dix ans des usages sociologiques et les risques actuels de surabondance d'information, dans un paysage en plein bouleversement.

CHAUVEL Louis (Sciences-PO/IUF) Données Internationales - Esquisse d'un atlas global des microdonnées : opportunités nouvelles et contraintes pour la recherche

Modélisation et méthodes statistiques en sciences sociales

Le 23/10/2007 de 10:00:00 à 12:00:00



Dans le contexte d'une demande sociale croissante, et suite à la création en 1993 d'un groupe de travail sur les « sans abri » au sein du Conseil National de l'Information Statistique, différentes enquêtes ont été menées en France, depuis le milieu des années 1990, auprès de populations sans domicile. Combler les lacunes du recensement en matière de situations marginales de logement et mieux connaître les personnes concernées et leurs parcours en étaient les objectifs principaux. Les différentes enquêtes réalisées à l’Ined sous la direction de Maryse Marpsat et Jean-Marie Firdion, puis à l’Insee sous la direction de Cécile Brousse, se sont inspirées des méthodologies développées aux États-Unis depuis la fin des années 1980, notamment par la Rand Corporation, l’Urban Institute, le Research Triangle Institute et le Census Bureau. Ces méthodologies, visant principalement à combler l’absence de base de sondage fiable, ont ainsi été adaptées au contexte français. Dans le prolongement de ces expériences, ces principes méthodologiques ont été étendus et adaptés à d'autres populations difficiles à joindre et à enquêter tels que les usagers de drogues. Nous retracerons les principales avancées développées dans ces enquêtes et présenterons les enjeux et les difficultés inhérents à leur mise en œuvre, des phases d'échantillonnage à celles de collecte sur le terrain. Nous mentionnerons aussi l'intégration de méthodes d'enquêtes qualitatives, telles que l'observation des services destinés aux sans-abri ne fréquentant pas les services d’hébergement ou de restauration, et la réalisation d'entretiens auprès des travailleurs sociaux ou gestionnaires associatifs, qui a contribué à améliorer la méthodologie et le champ couvert par les enquêtes quantitatives.

MARPSAT Maryse (INSEE) Les enquêtes auprès de populations difficiles à joindre : les exemples des personnes sans domicile et des usagers de drogue

Modélisation et méthodes statistiques en sciences sociales

Le 26/06/2007 de 10:00:00 à 12:00:00

Salle 8, EHESS, 105 bv Raspail, Paris

Les règles de la méthode sociologique indiquent qu’il convient de traiter les faits sociaux comme des choses. Quand les matériaux à analyser sont des productions langagières écrites ou orales sur lesquelles une analyse de contenu va être effectuée, comment se prémunir des croyances du chercheur ? L’utilisation d’un logiciel comme ALCESTE est adaptée à cet objectif, il met en oeuvre des mécanismes d'analyse indépendants du sens et permet d'étudier la structure formelle de la cooccurrence des mots dans un corpus donné. Il dégage des mondes lexicaux qui peuvent être pris comme autant de "faits bruts" sur lesquels appuyer sa démarche interprétative. Deux exemples : • «Votre vie à 25 ans, comment vous voyez-vous ?» réponse donnée par des lycéens de terminales de lycée à cette question. Le corpus des réponses a d’abord fait l’objet d’une analyse de contenu traditionnelle et a été soumis ensuite (deux ans plus tard) à Alceste, les résultats des deux analyses seront présentés en parallèle. • Mémoire de recherche et travail social, l’exemple des quatrièmes de couverture des mémoires de recherche du Diplôme Supérieur de Travail Social.

WACH Monique (CMH) Utilisation du logiciel Alceste pour l’analyse du discours : instrument de validation et/ou aide à la construction d’hypothèses

Modélisation et méthodes statistiques en sciences sociales

Le 29/05/2007 de 10:00:00 à 12:00:00



De nombreuses données utilisées en sciences sociales proviennent d’enquêtes par « sondage ». Il s’agit d’une méthode d’enquête quantitative qui consiste à collecter l’information non sur la totalité de la population ciblée mais uniquement auprès d’une partie de celle-ci, appelée « échantillon », et réduisant ainsi considérablement les coûts. Cet avantage amène toutefois à une contrainte lors du traitement des données. En effet, les enquêtes par sondage donnent lieu à des « pondérations », ou coefficients d’extrapolation, valables par unité ayant répondu, et qui font en sorte que l’échantillon obtenu in fine soit « représentatif » de la totalité de la population ciblée. Le calcul de ces pondérations peut être très complexe : il tient généralement compte du plan de sondage, mais aussi, éventuellement des non-réponses, et met en œuvre des procédures de « calage sur marges », etc. Notre exposé tentera d’éclairer une question que les usagers des données d’enquêtes par sondage se posent souvent : l’utilisation de la variable «pondération» dans les analyses, et la mise en œuvre. On évoquera quelques éléments théoriques qu’on illustrera par des exemples issus d’enquêtes par sondage récentes.

RAZAFINDRATSIMA N. (INED) L'utilisation des pondérations dans l'analyse des données d'enquêtes par sondages. Principes et exemples.

Modélisation et méthodes statistiques en sciences sociales

Le 24/04/2007 de 10:00:00 à 12:00:00



Dans cette séance, on abordera le problème de la causalité en sciences sociales, On introduira la notion de "résultats potentiels" et on montrera l'importance des biais potentiels de sélection. On discutera ensuite des et les différentes solutions qui lui ont été proposées par les statisticiens et les économistes. (Correction de Heckman, variables instrumentales, expériences naturelles ou contrôlées) avec leurs avantages et leurs limites. L'exposé reposera sur des exemples concrets.

DUFLO E. (MIT) La causalité en sciences sociales

Modélisation et méthodes statistiques en sciences sociales

Le 27/03/2007 de 10:00:00 à 12:00:00



Le système statistique français se développe de plus en plus dans un cadre formatté par des recommandations européennes afin de permettre l'émergence d'études comparatives fiables. L'objectif est particulièrement ambitieux dans le domaine social, en particulier pour tout ce qui a trait aux questions de revenus et d'inégalités de niveaux de vie. Les régimes fiscaux et sociaux sont encore loin d'être unifiés, les modes de vie gardent les traces d'un passé récent où les régimes politiques étaient fort différents, et les spécificités culturelles ne se sont pas toutes effacées. A partir notamment de l'exemple des études conduites sur la pauvreté, on se propose de réfléchir sur les conditions nécessaires à l'établissement de statistiques robustes et comparables.

VERGER Daniel (INSEE) La comparabilité internationale des statistiques sociales est-elle une utopie ?

Modélisation et méthodes statistiques en sciences sociales

Le 27/02/2007 de 10:00:00 à 12:00:00



Ce travail (1975-2005) repose sur des mesures répétées de la SAE sur des échantillons représentatifs étoffés, bien renseignés socialement, de 2 cohortes retraitées en 1972 et 1984. On observe l'influence du genre et de la catégorie sociale du sujet sur la SAE, et, plus originale, celle des origines socio-géographiques, de l'instruction, des parcours professionnels, de la catégorie sociale du ménage, du statut familial. On a créé des mesures de "santé-motilité estimées", de "santé du ménage", observé leurs relations avec les modes de vie, le moral, le plaisir à vivre, mettant l'accent sur les différences culturelles qui influent à la fois sur la SAE, le recours aux soins, et la santé "objective". Les différences de SAE entre groupes sont dues à des états de santé différents, et à des modes d'estimation différents. Les réponses longtemps analysées comme "optimistes" sont le plus souvent des réponses peu réalistes car mal informées, de sorte que les différences de SAE entre groupes sociaux sont plus grandes que celles de la santé objective, surtout chez les hommes. Enfin l'évolution d'une cohorte à l'autre montre une différence paradoxale d'estimation la cohorte la plus jeune se porte mieux et dit se porter plutôt moins bien.

Cribier Françoise (CMH) Les mesures de la santé auto-estimée, leur sens et leur usage en science sociale.

Modélisation et méthodes statistiques en sciences sociales

Le 30/01/2007 de 10:00:00 à 12:00:00



L'analyse longitudinale classique en démographie consiste à étudier la survenue au cours du temps d’un événement (mariage, migration, etc.) au sein d’une cohorte homogène. Elle conduisait à décrire des phénomènes à l’état pur en essayant d’éliminer les effets des autres processus à l’œuvre considérés comme perturbateurs. L’analyse statistique de trajectoires individuelles complexes où les processus interagissent, a renouvelé l’approche en la plaçant dans une perspective probabiliste et non déterministe des comportements , en offrant la possibilité de prendre en compte l’hétérogénéité entre les individus et ainsi de lever l’hypothèse rarement vérifiée de suivi d’un groupe homogène, ceci par la prise en compte des caractéristiques individuelles, fixes (comme le lieu de naissance) ou dépendantes du temps (tel le niveau de formation) ; de lever l’hypothèse d’indépendance entre phénomènes perturbateurs et phénomène étudié ; de traiter un corpus complexe de récits interrompus, puisque le plus souvent obtenus de façon rétrospective. On est passé d’une analyse à un niveau macroscopique, celui de populations dont les membres sont supposés se comporter de façon homogène à une vision microscopique, celles de trajectoires individuelles caractérisées par des successions chronologiques d’événements de nature diverse. Le nouveau défi consiste à trouver un niveau intermédiaire plus satisfaisant du point de vue de la compréhension des comportements, ce qui présente des challenges du point de vue de l’observation comme de la modélisation. L’exposé, largement illustré d’exemples, retracera conjointement l’évolution des concepts, des sources de données et méthodes d’analyse.

LELIEVRE E. (INED) De l’analyse de cohorte au suivi de trajectoires complexes : quels concepts, quelles données, quelles analyses ?

Modélisation et méthodes statistiques en sciences sociales

Le 28/11/2006 de 10:00:00 à 12:00:00



Les enquêtes nécessitent parfois l’interrogation: de plusieurs personnes autour d’un cas, de personnes qui parlent à la place d’une autre, de passer par les uns pour avoir accès à d’autres…Les étapes, enjeux et difficultés d’une telle enquête seront exposés à partir de l’exemple d’une enquête expérimentale menée par une équipe d’économistes et de sociologues travaillant sur la prise en charge des personnes dépendantes. La problématique que l’équipe souhaitait traiter supposait de décrire l’ensemble des personnes potentiellement mobilisables autour d’une personne atteinte de troubles de type Alzheimer ainsi que l’ensemble des personnes effectivement mobilisées autour d’elle. Le protocole de l’enquête, qui supposait d'interroger des personnes appartenant à plusieurs ménages apparentés ou des individus aidants, l'ensemble de ces personnes constituant un "cas", s’est révélé efficace à condition de tenir compte de ses différentes possibilités de blocage, comme le refus d’aider l’enquêteur à circuler dans l’entourage familial ou le refus de répondre au questionnaire.

WEBER Florence (CEE) Une enquête par questionnaire au défi de l'interconnaissance des enquêtés

Co-auteurs : Agnès Gramain (CEE et LEGOS), Emmanuel Soutrenon (CEE, CSE et CMH)

Modélisation et méthodes statistiques en sciences sociales

Le 24/10/2006 de 10:00:00 à 12:00:00



Le modèle linéaire est l’une des méthodes statistiques les plus utilisées dans les sciences de l’homme et de la société. A partir d’un exemple consistant à étudier les liaisons entre le revenu, l’âge, la CSP, le diplôme et l’orientation politique des électeurs, on précise la démarche d’interprétation des résultats et les propriétés numériques du modèle qui interviennent. Ces propriétés règlent complètement la question de la transitivité de la corrélation et donnent une nouvelle interprétation de la corrélation partielle. Des simulations mettent en évidence l’instabilité des estimations lorsque les variables explicatives sont statistiquement colinéaires, et montrent l’intérêt de la régression bornée. Un algorithme apporte quelques éclaircissements sur le choix des composantes principales en régression orthogonale. L’objectif final de cette communication est de mettre en garde les utilisateurs du modèle linéaire contre une confiance exagérée dans les résultats qu’il produit.

FOUCART Thierry (Univ. de Poitiers) Modèle linéaire. Analyse numérique d'une matrice de corrélation. Transitivité et colinéarité

Modélisation et méthodes statistiques en sciences sociales

Le 27/06/2006 de 00:00:00 à 00:00:00



Depuis 2004, une nouvelle méthode de recensement substitue au comptage traditionnel organisé tous les huit ou neuf ans une technique d'enquêtes annuelles de recensement. Tous les ans avec cette méthode, il y a une enquête de recensement exhaustive dans environ 7000 communes de moins de 10000 habitants et une enquête de recensement par sondage dans les quelques 900 communes de 10 000 habitants ou plus. Au bout de cinq ans, c'est-à-dire à partir de 2008, l'ensemble du territoire aura été pris en compte et il sera possible de produire chaque année les populations légales et des statistiques détaillées. Cette nouvelle méthode permettra donc de diffuser tous les ans des résultats récents et régulièrement actualisés à tous les niveaux d'organisation du territoire. La diffusion et l'utilisation des résultats font l'objet d'une large concertation. Deux groupes de travail, mis en place au sein du Cnis (Conseil National de l’Information Statistique) et composés de représentants de communes et d'experts (démographes, géographes,etc.) se sont vus confier la mission de réfléchir à l'exploitation des données et la diffusion des résultats statistiques produits par le recensement annualisé. Le second plus largement composé de représentants de communes a pour mission principale de définir la forme et le contenu des produits issus du recensement à fournir aux communes, et de réfléchir aux opérations à mettre en oeuvre (information, formations etc.) pour que ces produits soient utilisés au mieux. L'atelier aura pour objet de présenter la méthode de collecte et l'élaboration des résultats et, à partir d'exemples, d'échanger sur les utilisations qui pourront en être faites.

DUPONT F. (INSEE) La nouvelle méthode de recensement de la population

Modélisation et méthodes statistiques en sciences sociales

Le 23/05/2006 de 00:00:00 à 00:00:00



Au cours de la dernière décennie, l'épidémiologie sociale s'est intéressée de façon croissante à l'impact que le contexte de résidence des individus peut avoir sur la santé, tentant de dépasser à la fois le paradigme «individualiste» propre à la discipline et les limites de l'analyse écologique. Malgré un nombre croissant d'études rapportant des associations entre caractéristiques du contexte résidentiel et morbidité (ou mortalité) après ajustement au niveau individuel, la question de savoir dans quelle mesure le contexte influe véritablement sur la santé reste sans réponse. Au travers de l'exemple de la santé cardiovasculaire, on suggèrera qu'il est possible d'avancer dans la connaissance des effets du contexte au prix de développements méthodologiques conséquents (modélisation spatiale) et en s'intéressant aux processus causaux par lesquels le contexte de résidence peut influer sur la santé.

CHAIX B. (INSERM) Impact du contexte de résidence sur la santé : simple hypothèse ou résultat établi ? L'exemple de la morbidité cardiovasculaire

Modélisation et méthodes statistiques en sciences sociales

Le 16/05/2006 de 00:00:00 à 00:00:00



Trideux a été conçu comme environnement de travail autour du dépouillement des données d'enquête. Il permet aussi de traiter le vocabulaire de questions ouvertes ou d'entretiens. Sa spécificité est, dans une analyse des correspondances, de croiser le vocabulaire des questions ouvertes avec les questions fermées de l'enquête ou, pour les entretiens, le vocabulaire utilisé avec les caractéristiques des personnes interrogées. Les mots utilisés peuvent être, outre le vocabulaire spécifique, les mots outils, mais ceux-ci peuvent être mis en éléments supplémentaires. Les mots retenus sont ceux supérieurs à une fréquence définie par l'utilisateur. L'analyse est effectuée d'une façon itérative en utilisant un plan factoriel pour rassembler sous un même thème des mots utilisés dans un même contexte. Le but de l'analyse n'est pas lexicographique mais sociologique.

CIBOIS P. (Univ. de Versailles-Saint-Quentin-en-Yvelines) Le traitement des données textuelles avec Trideux

Modélisation et méthodes statistiques en sciences sociales

Le 25/04/2006 de 00:00:00 à 00:00:00



L'exposé se basera sur l'expérience d'une telle enquête réalisée auprès de mathématiciens et de scientifiques des sciences connexes aux mathématiques. Il portera sur la constitution de l'échantillon, le contact et la relance des enquêtés, la mise sur site du questionnaire, le suivi de l'enquête et les relations avec les enquêtés. Enfin seront indiqués les risques techniques et les problèmes restés en suspens.

ZARCA B. (CNRS) Questions méthodologiques posées par la réalisation d'une enquête extensive sur internet

Modélisation et méthodes statistiques en sciences sociales

Le 28/02/2006 de 00:00:00 à 00:00:00



Introduit en France en 1992 lors de l'enquête sur l'Analyse du Comportement Sexuel des Français (ACSF), le recours au téléphone pour interroger un échantillon représentatif de la population adulte sur un sujet sensible est rapidement devenu le mode de recueil privilégié des différentes équipes de recherche engagées sur des questions telles que les violences, les usages de drogues L'intérêt de ce mode est d'éviter les problèmes posés par les enquêtes en face à face (coût, durée du terrain, digicodes, contrôle du terrain plus difficile, absence de base de sondage.) ainsi que par les enquêtes par voie postale (taux de réponse très faibles en France, difficulté à surmonter les problèmes de lecture et d'écriture.) tout en offrant une distance avec l'enquêté qui s'avère parfois très utile. Les concepteurs d'enquêtes téléphoniques sont toutefois confrontés à quatre types de populations : les abonnés au téléphone fixe au sein desquels il faut distinguer les inscrits sur liste rouge, les possesseurs exclusifs de téléphone portable et les personnes ne disposant d'aucun équipement. Depuis quelques années, la part des abonnés au téléphone fixe chute au profit de celle des possesseurs exclusifs de portable. Si le téléphone reste un excellent moyen de toucher les individus résidant en France (environ 1 % des personnes ne dispose d'aucun équipement), ce nouveau paysage de la téléphonie complexifie les méthodes élaborées depuis le début des années 1990. L'objet de cette séance est de présenter les dernières avancées méthodologiques mises en œuvre pour interroger les personnes issues de ménages inscrits sur la liste rouge et celles ayant un téléphone portable mais pas de ligne fixe, à propos de la méthode de création des numéros, du protocole d'appel, de la sélection des répondants, de la passation du questionnaire et du profil des répondants selon leur modalité d'inclusion à l'enquête.

BECK F. (OFDT) Le recours au téléphone dans les enquêtes en population générale sur les sujets sensibles : viabilité et dernières avancées méthodologiques

Animateurs : François Beck (OFDT), Arnaud Gautier (INPES) et Stéphane Marder (Atoo).

Modélisation et méthodes statistiques en sciences sociales

Le 31/01/2006 de 00:00:00 à 00:00:00

LEHALLE C.A. (ENS) Stratégie non paramétrique pour évaluer une modélisation statistique: la comparaison des distributions de résidus entre populations à partir du test de Kolmogorov-Smirnov

De nombreuses questions de sociologie quantitative peuvent se ramener au cas d’une comparaison entre deux populations pour savoir si elles se distinguent significativement sur tel ou tel aspect mesurable. Par exemple, l’inégalité d’accès aux grandes écoles selon l’origine sociale est-elle ou non différente d’une génération donnée à une autre ? Est-elle différente entre les populations masculine et féminine ? En outre, il est fréquent de recourir à une modélisation (unidiff dans l’exemple) pour estimer un indicateur doté de propriétés intéressantes (par exemple, l’invariance quant à certaines variables structurelles). Habituellement, la méthode mise en œuvre repose sur des tests paramétriques. Nous proposons ici une méthode générale et non paramétrique pour mener à bien ce type d’investigations. Elle consiste à estimer le modèle sur une population, de conserver les résidus, puis de l’appliquer à l’autre population pour en extraire également les résidus. Le test de Kolmogorov-Smirnov est alors tout indiqué pour repérer un écart significatif entre les deux distributions de résidus et, du même coup, pour répondre de manière fine à la question initiale. Les avantages de cette procédure sont nombreux, et les possibilités multiples. Ainsi même avec un mauvais fit du modèle, la comparaison des résidus entre populations conserve tout son intérêt et son sens. Cette méthode peut permettre également de juger à partir de quand on modélise du bruit. Nous appliquerons cette méthode sur plusieurs exemples: un modèle unidiff et une régression sur une variable à expliquer continue.

Modélisation et méthodes statistiques en sciences sociales

Le 29/11/2005 de 00:00:00 à 00:00:00



La pratique des tests de signification, qui s'est développée à partir du début du 20ème siècle, est maintenant à peu près universelle dans la recherche expérimentale : de la sociologie à la physique, en passant par la médecine, la biologie, etc., aucun domaine n'y échappe. Un tel succès du test pourrait faire penser que cet outil est unanimement reconnu et apprécié, or, il n'en est rien. Les critiques sont pratiquement apparues dès leurs débuts (1919, par exemple) et n'ont pas cessé depuis. Ces critiques sont de deux ordres. D'une part elles s'adressent à une pratique abusive des chercheurs qui commettent très fréquemment de profondes erreurs d'interprétation, comme l'attestent différentes enquêtes sur ce sujet. D'autre part, elles s'adressent à la logique même des tests. Si ces critiques sont restées sans effet jusqu'à présent, il est possible que le courant vienne à s'inverser, au vu de ce qui se passe dans certains domaines (médecine, psychologie).

POITEVINEAU J. (CNRS) L'usage des tests statistiques chez les chercheurs

Modélisation et méthodes statistiques en sciences sociales

Le 18/10/2005 de 00:00:00 à 00:00:00



Dans un célèbre article paru en 1973 dans International Economic Review, Ronald Oaxaca a proposé une méthode originale permettant de donner une mesure moyenne de la discrimination salariale à l’encontre des femmes sur le marché du travail américain et une évaluation des sources à l’origine de ces écarts de salaire. En France cette méthode dite «de décomposition des effets» revue en 1974 par Oaxaca et Ranson a fait l’objet de plusieurs mises en œuvre dans le cadre de l’analyse des phénomènes de discrimination vis-à-vis de l’emploi et du travail (O. Joseph, S. Lemière CEREQ 2005). Des extensions vers d’autres terrains d’analyse ont également été proposés (Kaukewitsch, Rouault INSEE 1998). Nous présentons dans cet atelier un travail reposant sur cette méthodologie et dont l’objet est d’analyser les causes du différentiel d’efficience entre les hôpitaux franciliens et les hôpitaux de province dans le but de tester la présence et l’ampleur d’un éventuel effet de localisation.

LE VAILLANT M. (CREGAS) Application de la méthode de décomposition des effets à l'analyse de l'efficience du système hospitalier public : mise en évidence d'un effet de contexte relatif à l'Ile-de-France