TD 1 : Population, échantillon et estimation

Auteur·rice
Affiliation

Paul Géhin

Insee

Date de publication

20 févr. 2026

Les exercices dotés d’une sont à maîtriser.

Exercice 1 : Détermination des probabilités d’ordre 1 et 2.

On considère un plan de sondage \(p\) sur une population \(\mathcal{U}\) de taille \(N = 4\). Le plan de sondage est défini par la fonction de masse suivante :

\(p(\{1\}) = 0.01\) \(p(\{2\}) = 0.01\) \(p(\{3\}) = 0.01\) \(p(\{4\}) = 0.01\)

\(p(\{1,2\}) = 0.07\) \(p(\{1,3\}) = 0.07\) \(p(\{1,4\}) = 0.07\) \(p(\{2,3\}) = 0.07\) \(p(\{2,4\}) = 0.07\) \(p(\{3,4\}) = 0.07\)

\(p(\{1,2,3\}) = 0.135\) \(p(\{1,3,4\}) = 0.135\) \(p(\{1,2,4\}) = 0.135\) \(p(\{2,3,4\}) = 0.135\)

\(p(\{1,2,3,4\}) = 0\) \(p(\{\emptyset\}) = 0\)

  1. Calculez les probabilités d’inclusion d’ordre 1 et 2.
  2. Est-ce un plan de taille fixe ? Est-ce un plan simple ?
  3. Déterminez l’espérance de la taille moyenne de l’échantillon \(\mathbb{E}(n(S))\).
  1. Appliquez la formule du cours.
  2. Est-ce qu’il existe deux ensembles de taille différente et ayant des probabilités non nulles d’être tirés ?
  3. Deux idées :
    • Calculez la probabilité que \(n(S) = 1\), \(n(S) = 2\)
    • Notez que \(n(S) = \sum_{k \in \mathcal{U}} I_k\)\(I_k = 1\) si l’individu \(k \in S\) et 0 sinon puis utilisez la linéarité de l’espérance.

Exercice 2 : Estimation de l’amplitude du parc automobile dans le département du Nord

Le département du Nord souhaiterait connaître le nombre d’automobiles diesel détenus par les 2.5 millions d’habitants du département. Afin d’obtenir une estimation, le statisticien en charge de ce projet souhaite réaliser un sondage. Ce dernier a opté pour un tirage aléatoire simple sans remise afin d’obtenir un échantillon \(s\) de taille 20 000. Après collecte, le statiscien observe que le nombre de véhicules diesel dans son échantillon \(s\) est de \(4 274\) voitures.

  1. Donnez la population \(\mathcal{U}\), la variable d’intérêt et la fonction (ou paramètre) d’intérêt.

  2. Est-ce que le nombre de véhicules fonctionnant au diesel observés sur l’échantillon est un estimateur sans biais du nombre de véhicules diesel ?

  3. Rappelez les probabilités d’inclusion d’ordre 1 et 2 associées au plan de sondage utilisé.

  4. Proposez un estimateur sans biais pour la fonction d’intérêt et calculez une estimation.

  5. Sachant que \(\displaystyle \sum_{k \in s} (y_k - \bar{y})^2 = 8198\)\(\displaystyle \bar{y} = \frac{1}{n} \sum_{k \in s} y_k\) , proposez :

    • Une estimation de la variance de l’estimateur d’Horvitz-Thompson utilisé précédemment.
    • Un intervalle de confiance asymptotique au niveau 0.95.
  1. Rendez-vous dans votre cours.
  2. Quelle est le plan de sondage ? Existe t-il une formule permettant d’obtenir ces probabiltés pour ce plan ?
  3. Est-ce que les probabilités d’inclusion d’ordre un sont strictement positives ?

Exercice 3 : Estimation de la proportion des élèves pratiquants une activité sportive

L’administration de l’Université de Paris 1 aimerait connaître la proportion d’individus réalisant du sport au moins une fois par semaine. L’Université de Paris 1 \(\mathcal{U}\) est composée de 45 000 étudiants : 40 000 étudiants en licence ou master \(\mathcal{U}_\text{lic-mast}\) et 5 000 étudiants en doctorat \(\mathcal{U}_\text{doct}\). Un sondage est réalisé : un échantillon est tiré selon un plan de Poisson de paramètre \(0.3 \mathbb{1}_{k \in \mathcal{U}_\text{lic-mast}} + 0.8 \mathbb{1}_{k \in \mathcal{U}_\text{doct}}\). L’échantillon contient 16 780 individus : 12 700 en licence ou master et 4 080 en doctorat. Après collecte, le méthodologue en charge de l’enquête observe que dans l’échantillon : 9 120 (8 010 en licence ou master et 1 110 en doctorat) individus ont indiqué faire du sport au moins une fois par semaine.

On supposera qu’un étudiant est soit en licence ou master soit en doctorat mais ne peut être dans les deux en même temps.

  1. Donnez la population \(\mathcal{U}\), la variable d’intérêt et la fonction (ou paramètre) d’intérêt.
  2. Rappelez les probabilités d’inclusion d’ordre 1 et 2 associées au plan de sondage utilisé.
  3. Proposez un estimateur sans biais pour la fonction d’intérêt et calculez une estimation.

On s’intéresse maintenant uniquement à la proportion d’individus ayant au moins une activité sportive par semaine chez les doctorants.

  1. Proposez un estimateur sans biais de cette proportion. On pourra utiliser les résultats des questions précédentes en modifiant la variable d’intérêt
  1. La variance d’intérêt est une variable binaire.
  2. Rendez-vous dans votre cours.
  3. Est-ce que les probabilités d’inclusion d’ordre un sont strictement positives ?

Exercice 4 : Probabilité d’inclusion d’ordre 1 du SASSR(n)

Soit \(\mathcal{U}\) une population de taille \(N\). On tire un échantillon de taille \(n\) en utilisant un tirage aléatoire sans remise.

  • Montrez que pour tout individu \(k \in \mathcal{U}\) \(\pi_k = \frac{n}{N}\).

Exercice 5 : Plan de sondage entièrement défini par les probabilités d’inclusion d’ordre 1

D’après vous, est-ce qu’un plan de sondage \(p\) est entièrement défini à l’aide des probabilités d’inclusion d’ordre 1 ?

  • Si oui, prouvez-le.
  • Si non, donnez un contre-exemple.

Considérez un SRS et un plan poissonien ayant les mêmes probabilités d’inclusion d’ordre un.