Raison d’être des variables construites


Les données d’enquête Elfe collectées directement auprès des familles sont parfois nombreuses et complexes à examiner.
Elles nécessitent souvent une connaissance approfondie de leur mode de collecte ou une expertise scientifique pour être analysées pleinement. Parfois même, ces variables sont jugées indirectement identifiantes et ne sont alors pas mises à disposition malgré la richesse des informations qu’elles contiennent. Plus précisément, on peut distinguer :

  • Un certain nombre de variables (par exemple la description complète des personnes habitant le logement, leur âge et niveau d’étude) sont, à chaque enquête, itérées un nombre important de fois (de 12 à 25 selon les enquêtes). Pour être analysées, il faut obtenir de nombreuses variables parfois difficiles à manipuler alors qu’on souhaite en utiliser un indicateur synthétique (par exemple, le nombre de personnes vivant dans le ménage). Des données agrégeant ces éléments sont donc mises à disposition.

  • Des données sont indirectement identifiantes (par exemple les réponses données en texte libre ou encore des modalités de réponses trop peu nombreuses). Ces données sont alors analysées une à une et recodées pour être mises à disposition sans risque d’identification.

  • Un certain nombre de variables ne sont pas reprises lorsque l’information est renseignée dans une enquête (par exemple si une personne a arrêté ces études et qu’on connait son niveau d’études à une date donnée, on ne redemande pas cette information plus tard). Ainsi, pour analyser certaines données à une date de collecte, il faut obtenir toutes les variables identiques des enquêtes précédentes. Pour éviter ces difficultés, certaines données, figées dans le temps, peuvent être mises directement à disposition.  

  • De même, certaines variables peuvent être analysées « longitudinalement » (par exemple taille et poids des enfants peuvent être corrigées uniquement si on les collecte à plusieurs temps d’enquête). Certaines corrections ont été appliquées et les données anthropométriques corrigées sont directement mises à disposition. 

  • Certaines enquêtes donnent lieu à des questions complexes pour en saisir toute l’information (par exemple le temps de sommeil ou le temps passé devant un écran, qui sont donnés en heure et/ou en minutes, en jour de semaine et/ou en jour de week-end, par type d’écran ou au total ..). Ces variables ont été analysées pour mettre à disposition des données synthétiques et homogénéisées.

  • Enfin, certaines variables doivent faire l’objet d’algorithme (calcul de score) pour être analysables pleinement. Certains de ces algorithmes ont déjà été mis en œuvre et les résultats sont mis à disposition.

L’équipe Elfe et l’ensemble des chercheurs associés ont donc souhaité mettre à disposition de la communauté scientifique un certain nombre de tables (dites EQR) mises à disposition sous forme de bases appariables à votre panier de données Elfe. Vous trouverez ci-dessous des informations relatives aux types de variables disponibles et la raison de leur construction. La documentation précise des variables disponibles dans chacune des EQR est décrite dans un document séparé. 

 

Remarque

La mise à disposition de ces différentes données ne doit pas empêcher les chercheurs souhaitant obtenir les variables individuelles non traitées d’en faire la demande, mais a simplement pour objectif d’en simplifier et d’en accélérer l’utilisation. Dans le cas où un chercheur souhaite obtenir les données initiales, celles-ci restent disponibles via le processus classique de constitution du panier et de soumission au CADE.