DYNAMIQUE DES ÉTABLISSEMENTS AGROALIMENTAIRES DU LANGUEDOC-ROUSSILLON
MÉTHODOLOGIE D'ENQUÊTE AUPRES DES ÉTABLISSEMENTS AGROALIMENTAIRES DE LA RÉGION LANGUEDOC-ROUSSILLON
(2 311 établissements) moins les disparus entre 1998 et
2003 et les mis hors champ a priori (boulangers-pâtissiers
et bouchers-charcutiers-traiteurs de 3 à 5 salariés), notés
D (1 106 établissements), plus les nouveaux établissements
créés depuis 1998, notés C (307 établissements).
L'échantillon 2003 est finalement composé de trois parties :
1. Ia totalité des établissements enquêtés en 1998 et
encore actifs aujourd'hui. Cette partie en tant
qu'échantillon constant doit permettre de mesurer les
évolutions de 1998 à 2003. Cela nécessite d'utiliser
des pondérations spécifiques.
2. un complément pour accroître la représentativité
de la partie ancienne de la base 2003.
3. un sous échantillon représentatif des établissements
créés depuis 1998.
La démarche de tirage de l'échantillon, décrite ci-dessous,
explique le tableau de tirage.
2. Extraire l'échantillon constant
Repérer dans le fichier Sirène à jour au 1er janvier les
établissements qui appartenaient au fichier des 329
établissements exploités en 1998. Il y en a 230. Les autres
ont cessé leur activité.
3. Calculer le complément d'échantillon des
établissements anciens
• Fixer la taille du sous-échantillon représentant les
anciens établissements et en conséquence du sous-
échantillon représentant les nouveaux. Par exemple, c'est
le choix fait, dire que l'on enquête 350 anciens et le reste
pour les nouveaux soit 500-350=150.
• Le complément de l'échantillon des anciens serait alors
350-230 de l'échantillon constant =120.
• Calculer la part théorique de l'échantillon des 350 dans
chaque classe selon les poids des effectifs de chacune.
• Par différence avec la partie de l'échantillon constant
(230 établissements) de chaque strate, on a le nombre à
tirer dans chaque strate pour le complément.
• Le tirage de ces 120 se fera dans le fichier de 1998 dont
on aura retiré les 230 du champ constant (préalablement
trié par département et code APE).
Soit à tirer dans la base 1998, pour la strate h, un taux
d'établissements de : ^QQ3h-ni998h
Λ∕1998h-n1998h
où Nl998h est l'effectif de la strate h dans la base 1998
n1998h est l'effectif de l'échantillon 1998 dans la strate h
n2003h est l'effectif de l'échantillon 2003 dans la
strate h (y compris la part constante)
Après tirage de ce complément, il faut retirer les
établissements disparus (le taux de disparus est de 1106/2311
dans la base 1998), ce qui devrait faire perdre environ
120*( 1106/2311 ) = 57 établissements. Pour compenser
cette perte potentielle et arriver au bout du tirage à un
complément de 120, il faut corriger le complément de
l'échantillon à tirer : 120*[1∕( 1 -1106/2311 )] = 230. Le
tirage au sort a donc été réalisé sur la base de 230
établissements à tirer et non 120.
A cause du changement de définition du champ a priori
entre 1998 et 2003, le tirage au sort, en fait, a été réalisé
parmi les anciens de la base de 2003 et non de 1998.
Tableaux et graphiques tiennent compte des calculs
réellement effectués.
• Le mode de tirage s'est fait sur un pas constant pour
bénéficier d'une stratification implicite par département
et code APE due au tri ci-dessus5.
4. Tirer les établissements représentatifs des
nouveaux établissements
Par classe, tirer les établissements selon les taux de
sondage prévus : tirage à pas constant des établissements
selon l'hypothèse ci-dessus (après tirage au hasard de la
première unité).
5. Traiter les refus de réponse
Accroître a priori l'échantillon des classes non exhaustives
de l'inverse du taux de refus de 1998.
6. Traiter les hors champ
Le champ de l'enquête est défini d'une part sur des
caractéristiques qui permettent une sélection de la base
dans Sirène et d'autre part sur des caractéristiques qui ne
sont connues qu'après enquête. Pour ces dernières, on
considère que le taux de hors champ dans la base est le
même que dans l'échantillon. En conséquence, on retire
de l'échantillon les hors champ constatés et il n'y a aucun
redressement à faire à ce titre pour recalculer les résultats
sur la population à partir des résultats sur l'échantillon.
7. Compléter l'échantillon de Lozère pour atteindre
l'exhaustivité
Afin de pouvoir fournir de l'information sur le département
de la Lozère, Comptetenu du faible nombre d'établissement,
le groupe de suivi méthodologique a décidé d'enquêter la
totalité des établissements de ce département.
8. Tableaux récapitulatifs de la constitution de
l’échantillon
Après retrait de la base des établissements de 3 à 5
salariés appartenant aux APE 151F (charcuterie), 158B,
158C, 158D (boulangerie-pâtisserie) considérés hors
champ (mono-site de vente).
168
5 On aurait pu utiliser la méthode d'affectation d'un numéro aléatoire -compris entre 0 et 1- à chaque unité (avec numéro de 1 pour tous les
établissements de !'échantillon constant), stratification par taille, tri par ordre croissant et sélection du nombre défini des n premières unités dans
chaque classe (les unités affectées de 1 ne sont pas tirées ou le sont en dernier recours). En utilisant cette méthode, toutefois, on aurait perdu l'avantage
de la stratification implicite.