Les sondages

       Concept, catégories et Types de sondages

 

 

 

 

 

 

            

            Une fois le questionnaire est défini en fonction de la problématique de l'enquête et du sujet de recherche et de la nature des informations à demander, il reste à fixer la méthode du choix de l'échantillon et des unités à enquêter, la taille de l'échantillon est supposée clarifiée (Cf. taille de l'échantillon).

            On examinera ici très succinctement le concept et le fondement des sondages, les catégories et les types de sondages.

            

 

I - CONCEPT ET FONDEMENT  DES SONDAGES

 

            Un sondage est une enquête portant sur un sous-ensemble représentatif et dont les résultats sont généralisables à l'ensemble de la population. Il signifie aussi la méthode de choisir l'échantillon. Il s'appuie sur la notion de représentativité.

 

1.1 - Le concept de sondage

 

            Le sondage est une enquête sur un échantillon représentatif de la population mère , il est défini par un taux, un plan et une base de sondage. C'est aussi le procédé qui consiste à tirer l'échantillon, on dit faire un sondage ou une enquête par sondage.

            L'échantillon est un sous-ensemble représentatif d'une population, tiré selon des règles précises conformément à un plan de sondage précis donné et une base de sondage. L'échantillonnage est la méthodologie suivie pour déterminer l'échantillon: taille, base de sondage, plan de tirage... L'échantillon est défini par trois paramètres: la base de sondage, le taux et le plan de sondage:

           - La base de sondage est l'ensemble des critères de base servant à définir l'échantillon. Ces critères sont des variables liées au phénomène étudié (du moins supposés l'être au moins), de préférence visibles permettant ainsi de contrôler l'échantillon. Toutefois, les variables visibles sont très limitées à l'âge ou le sexe. Des variables comme le revenu, la profession ou le milieu ne peuvent pas être visibles ?

        C'est aussi la liste exhaustive des unités composant la population concernée par l'enquête à partir de laquelle se fait le tirage. La liste de la population est nécessaire pour les sondages aléatoires.

            Le taux de sondage est le rapport entre la taille de l'échantillon (n) et celle de la population (N)   t = n/N. Le taux de 1/10 signifie qu'on enquête un tous les dix individus ou unités, soit le un dixième.

           - Le plan de sondage est l'ensemble des étapes nécessaires qui permettent d'aboutir, en pratique à la fin du processus, à l'identification des unités qui font partie de l'échantillon.

 

 

1.2 - Le fondement

 

            Le sondage trouve son fondement théorique la notion de représentativité. On suppose que tout sous-ensemble représentatif, ou tout échantillon, est susceptible d'être l'objet d'une étude indirecte de la population dont il est tiré.

            On peut distinguer deux types de représentativité:

        - La représentativité structurelle: tout sous-ensemble qui présente la même structure que la population mère est considéré comme représentatif. Il suffit alors choisir un échantillon qui présente la même structure que celle de la population d'origine.

        - La représentativité statistique: elle est assurée par la loi des grands nombres ou la loi de convergence. Lorsque la taille de l'échantillon (n) augmente, les valeurs observées dans l'échantillon (comme la moyenne, la médiane, la variance...) tendent à converger vers les valeurs réelles de la population avec un certain risque déterminé a. Ce risque d'erreur diminue lorsque la taille de l'échantillon augmente et tend vers zéro dans le cas d'un recensement où on enquête toute la population.

 

                                      Seuil de signification                  90%    95%    98%  100%  

                                       Risque d'erreur                        10%      5%      2%      0%                                     

 

                                Convergence de la valeur du paramètre échantillon (x) vers la valeur réelle dans la population (m)

 

 

            En outre, chaque paramètre statistique mesuré dans l'échantillon, tend à suivre une loi de probabilité bien déterminée au fur et à mesure que n augmente appelée distribution d'échantillonnage. La connaissance de ces lois de distribution d'échantillonnage permette ainsi de fixer la taille optimale d'un échantillon pour un risque d'erreur fixé à l'avance.

 

II - Les catégories de sondages 

 

            On peut distinguer deux grandes catégories de sondages: les sondages raisonnées et les sondages aléatoires.

 

2.1 - Les sondages raisonnés

           

            Un sondage raisonné est un sondage où les critères de choix et les unités sont raisonnablement choisis par le chercheur. Il présente la même structure que la population d'origine, l'échantillon en est la miniature. Le fondement de ce type d'échantillonnage est la représentativité structurelle qui fait qu'en enquêtant un échantillon de même structure on peut généraliser les résultats.

            La base de sondage est représentée par les variables, liés au phénomène étudié, de préférence observables pour pouvoir contrôler la structure de l'échantillon. Ces variables ont la même distribution que le phénomène étudié si bien qu'elles constituent des variables de contrôle.

            Le sondage raisonné est simple et constitue le seul procédé à défaut d'une liste exhaustive des unités, c'est ce qui explique son utilisation fréquente. Utilisé avec prudence, il donne des résultats acceptables: > 10% et une bonne spartiale.

 

            Les limites découlent de l'absence de fondement théorique solide au niveau de la représentativité et l'absence de règles de choix des unités. De là, la difficulté de mesurer la précision du résultat et de la généralisation. Il suppose une connaissance préalable de la structure

            .

2.2 - Les sondages aléatoires

 

            Le sondage aléatoire est un sondage où le tirage se fait selon des règles précises à partir d'une liste exhaustive appelée base de sondage, il se fonde sur la loi des grands nombres. Les unités sont choisies aléatoirement en utilisant la Table des Nombres au Hasard (TNH) ou aléatoires (TNA).
            La TNH est une table où les chiffres ont la même probabilité d'apparition qui se présente sous forme de 2 à 7 chiffres qu'on peut lire dans tous les sens (vertical, horizontal, diagonal), les ordres (premiers, derniers chiffres, milieu, chiffres alternés...) et avec un nombre variable de chiffres (2 à 7). Il est conseillé cependant de choisir, pour la rapidité de l'opération, le même nombre de chiffres que la valeur extême de la population (N). L'utilisation de la TNH passe par les stades suivants :

- Numéroter la population à étudier de 1 à N.

- Etablir la taille de l'échantillon n

- Lire la TNH selon une méthode déterminée (NOS)  Nombre de chiffres, un ordre et un sens donnés.¨Pour la facilité de la lecture, on utilisera toujours autant de chiffres qu'il y a dans la population (N): par exemple les 3 premiers chiffres horizontalement (3PH) ou les 3 derniers verticalement (3DV)...

- Relever les chiffres <=N qui apparaissent par ordre jusqu'à obtenir toutes les unités de l'échantillon n (n: taille de l'échantillon déjà fixée).

 

            Pour disposer des unités de remplacement, on continue le processus de tirage de 25 à 33% unités supplémentaires. Le remplacement des défaillants se fait dans  l'ordre des remplaçants.

             En cas d'ae-exequo dans le tirage, on ne retient que le premier qui apparaît.

 

            Lorsque la taille de l'échantillon est suffisamment élevée, on peut voir apparaître une grande proportion constituée des mêmes unités qui se trouvent choisies par des méthodes différentes à l'aide de la TNH (premiers  ou derniers chiffres, deux, trois ou quatre chiffres, lecture horizontale ou verticale).

 

Exemple :
       
Soit une population de 360 éleveurs, on veut enquêter le dixième, soit t = 0,1 = Dn = 36. N = 360, on peut utiliser trois chiffres seulement. En lisant la TNH dans n’importe quel sens et ordre, on retient les 36 premiers nombres rencontrés qui sont inférieurs ou égaux à 360.

Trois premiers chiffres, sens horizontal

159, 198, 189, 216, 7, 66, 71, 227, 208, 209, 127, 284, 250, 217, 275, 184, 97, 322, 236, 115, 336, 176, 181, 129, 177, 162, 47, 334, 2, 348, 158, 357, 179, 322, 331, 75.

 Trois derniers chiffres, sens horizontal

230, 10, 106, 350, 98, 292, 259, 88, 6, 5, 44, 121, 343, 226, 357, 211, 129, 162, 194, 51, 238, 270, 314, 308, 163, 68, 102, 197, 331, 217, 312, 202, 262, 254, 250, 209. 

Trois premiers chiffres, sens vertical

159, 217, 162, 158, 275, 271, 43, 146, 133, 30, 93, 313, 53, 80, 308, 211, 25, 208, 173, 178, 51, 1, 264, 151, 70, 249, 118, 136, 60, 191, 248, 66, 176, 357, 152, 304.

Trois derniers chiffres, sens vertical

259, 343, 129, 238, 207, 188, 17, 316, 200, 20, 349, 75, 65, 41, 10, 18, 140, 230, 88, 331, 297, 208, 258, 87, 1, 102, 318, 146, 289, 170, 328, 97, 155, 355, 96, 226.

Trois chiffres du milieu, sens vertical

259, 125, 172, 834, 312, 299, 270, 88, 336, 60, 31, 301, 75, 292, 137, 351,  320, 2, 244, 50, 138, 343, 307, 114, 308, 67, 33, 254, 259, 42, 101, 283, 10, 37, 128, 297.  

On voit que quelque soit les sens ou l’ordre choisi, il y a un certain nombre de chiffres qui se répètent.

 

            Le sondage aléatoire assure une très grande précision et permet de connaître le risque ce qui permette la généralisation des résultats. On peut estimer la valeur réelle des paramètres en définissant un intervalle de variation avec une probabilité connue.

 

 

III - LES TYPES DE SONDAGES

           

            On peut distinguer plusieurs types de sondage indépendamment de la catégorie (raisonné ou aléatoire), le sondage élémentaire, systématique, par quota, stratifié, en grappes..

           

3.1 - Le sondage élémentaire

 

            C'est un sondage sans contrainte majeure,  il s'agit simplement de choisir n unités parmi  la population N sans critère précis sinon la représentativité.

            Dans un sondage aléatoire (S.A), chaque unité a la même probabilité d'être choisie, c'est un sondage sans remise. La méthode présentée ci-dessus permet de choisir les unités. Dans un sondage raisonné, il suffit de choisir n unités.

           

Exemple: Choisir 10 unités dans une popolation de 100. Pour un sondage aléatoire, il s'agit d'abord de numéroter la population de 1 à 100, fixer le sens et l'ordre de la leceture de la TNH, par exemple: les trois premiers horizontalement. Relever les éléments qui apparaîssent inéférieurs à 100 jusqu'à obtenir 10. Continuer le processus et relever 3 unités supplémentaires pour un éventuel remplacement des défaillants. Pour un sondage raisonné, on n'a pas de règle du choix, l'essentiel est de choisir 10.

 

3.2 - Le sondage systématique

 

            Il s'agit de choisir les unités à intervalle régulier de manière à couvrir toute la population. La première unité (ou la base b) est choisie dans l'intervalle [1 <= e1 <= N/n] tandis que le pas de la progression arithmétique (ou raison r) est de r = N/n. Dans un S.A, la base est choisie dans la TNH selon le procédé indiqué ci-dessus. C'est un sondage plus facile, mais pose le problème de remplacement en cas de défaillance et ne convient pas aux phénomènes périodiques. Pour le remplacement, on utilise un second tirage selon une seconde méthode de lecture pour distinguer un quart ou un tiers des unités remplaçantes.

 

Exemple: Choisir un échantillon systématique avec un taux de sondage de 1/10 pour une population de 100. Pour un SAS: On numérote la population de 1 à 100, on fixe le sens et l'ordre de lecture de la TNH: 2 derniers verticalement puisque la base est comprise entre 1 et 10 (N/n) qui est en même temps la raison: les unités choisies sont par exemple: 5, 15, 25, 35, 45,..95 . Pour un SRS: On choisit un chiffre entre 1 et 10 qui constitue la base puis on ajoute 10 pour les autres.

 

3.3 - Le sondage par quota

 

            Lorsqu'on a une population hétérogène où on a plusieurs modalités ou classes estimées discriminantes (taille, forme) on peut assurer une répartition équitable en fonction de l'effectif de la strate (quota proportionnel) ou privilégier les petites strates en leur donnant plus de chance d'être enquêtées contrairement aux grandes strates où on peut se contenter d'un nombre réduit d'unités mais suffisamment grand pour permettre la généralisation (quota non proportionnel). Le choix des unités dans un SA se fait toujours à l'aide de la TNH selon les mêmes règles à l'intérieur de chaque strate séparément.

            Dans le quota proportionnel, on a: Qi = Si .t avec t: taux de sondage global, Si: effectif de la strate i, Qi: quota de la strate i. Chaque strate et chaque individu a la même probabilité d'être choisis.

            Dans le quota non proportionnel, on a: Qi = Si.ti avec t = (Sti.Si)/Pi  et Pi: population totale, t: taux global de sondage.

 

Exemple: On a 10 gros propriétaires qui accaparent 60% du sol à côté de 500 petits exploitants qui n'ont que 15% des terres et on a fixé le taux de sondage à 1/10°.

            Dans un quota proportionnel, on a 1 et 50 respectivement. Dans un quota non proportionnel, on peut enquêter tous les gros propriétaires (10) mais seulement 31 petits ce qui respecte le taux global de 1/10.

 

 

3.4 - Le sondage stratifié 

 

            Le tirage se fait à plusieurs niveaux ou degrés avec le choix au tirage des unités primaires (UP) dans un premier degré puis les unités secondaires (US) choisies dans les UP... Les unités échantillons sont en cascade. C'est le cas lorsque le tirage se fait selon plusieurs critères, la combinaison des critères définit les strates.

            On peut distinguer quatre types de sondages selon que les probabilités de tirage aux différents degrés sont égales (toutes les strates ont le même taux de sondage) ou inégales (en privilégiant les petits échantillons):

 

 

             U. Primaires

U. Secondaires

P. Egales

P. Inégales

     P. Egales

EE

EI

     P. Inégales

IE

II

 

 

            On peut citer l'enquête population-emploi et l'enquête consommation de l'INS. Dans ce cas, les UP sont définies par la combinaison Région (5) et le milieu (3). Dans ces UP, la combinaison taille du ménage (5) et activité de son chef (5) constitue les US.

 

 

3.5 - Le sondage par grappe ou aréolaire

 

            Il constitue un cas particulier des sondages stratifiés notamment dans les sondages où l'espace constitue un paramètre important (région, quartier...), il contribue à réduire les déplacements sur le terrain. Ce type de sondage nécessite un nombre réduit de types représentatifs. Dans une enquête portant sur une ville, il vaut mieux enquêter le minimum de quartier représentatifs avec le maximum de ménages dans chaque quartier qu'un nombre réduit de ménages répartis dans tous les quartiers ce qui réduit fortement les déplacements; ceci est encore plus pertinent lorsque le terrain d'enquête est trop vaste comme l'ensemble du pays: au lieu d'enquêter touts les villes, on dresse une typologie de 4 à 5 groupes où on choisit une ville.

 

 

IV - LES SONDAGES SPATIAUX

 

            Dans l'espace, l'unité est bidimentionnelle et peut être de trois formes selon les besoins de l'analyse: ponctuelle, linéaire ou aréale. Sur une carte, une photographie aérienne ou un plan, on peut tirer un certain nombre de points ou de lieux à étudier. Il s'agit de graduer la carte horizontalement (X) et verticalement (Y) pour pouvoir tirer les points ou les transects (coupe) aléatoirement selon la TNH (Cf. P Haggett, 1973: L'analyse spatiale en géographie, AC).

            .

4.1 - Le sondage élémentaire

 

            Dans un sondage élémentaire on tire les coordonnées des lieux (x, y) selon la TNH. Pour les phénomènes linéaires, on choisit au hasard deux points (x, y ) pour chaque traverse. C'est le cas par exemple lorsqu'on veut étudier les prix fonciers dans un espace urbain.

 

 

 

4.2 - Le sondage systématique

 

            Dans un sondage systématique, seul le premier point ou la première traverse sont tirés au hasard, les autres sont choisis selon le même schéma pour couvrir l'ensemble de l'espace avec des points ou des traverses à des distances régulières.

 

 

 

4.3 - Le sondage hiérarchique

 

            C'est un sondage stratifié à deux degrés qui  consiste à tracer des carrés et les numéroter, choisir les UP représentées par les carrés de base et à l'intérieur de ces carrés, fixer les points selon le même procédé de graduation et de tirage (avec un nombre égal ou variable par carré).

            La grille peut être établie par les coordonnées d'un point tiré au hasard, les autres points sont choisis de telle manière qu'il y 'ait une grille de carrés où on tire un nombre égal de points selon la TNH.

 

 

 

4.4 - Le sondage aréolaire

           

            Il consiste à définir les strates constituées par des unités spatiales homogènes  comme le type de sol ou les types de culture et tirer dans chaque strate un certain nombre de points selon la TNH. Ce nombre peut être égal ou variable. Ces strates  sont des unités homogènes.

 

 

4.5 - Le sondage systématique stratifié sans alignement

           

            C'est un sondage stratifié, systématique mais qui évite l'alignement. Il a été élaboré par Berry et comprend les étapes suivantes:

- Définir les différentes strates 

- Déterminer une grille graduée de 0 à 9 (pour chaque strate)qu'on on place au dessus de la strate

- A l'aide de la TNH, on choisit un point P à partir du coin inférieur gauche et on y place la grille

- On fait varier y à l'aide de la TNH (alors que x est fixe) ce qui nous ramène à un second point P1 de même abscisse mais d'ordonné différent.

- On refait le même processus précédent pour faire varier non pas y mais x, ce qui donne le troisième point P2

- On répète les étapes jusqu'à remplir la  grille.

 

 

 

 

            Selon l'effet de la distance, on peut choisir le type adéquat de sondage, si la distance est aléatoire on peut utiliser le sondage systématique, pour un effet linéaire on utilise le sondage systématique ou stratifié. Lorsqu'on a des processus périodiques, on utilise le sondage stratifié mais quand l'effet de la distance est inconnu, il vaut mieux utiliser le sondage systématique stratifié non aligné.