statAfrikR est une boîte à outils R conçue spécifiquement pour les Instituts Nationaux de Statistique (INS) africains. Ce guide vous permet de réaliser une analyse complète en moins de 30 minutes.
# Nettoyage des libellés textuels
donnees <- nettoyer_libelles(
donnees,
vars = c("region", "commune"),
casse = "titre"
)
# Suppression des doublons
resultat <- supprimer_doublons(donnees, cles = "id_menage")
donnees <- resultat$donnees
cat("Doublons supprimés :", nrow(resultat$rapport), "\n")
# Imputation des valeurs manquantes
donnees <- imputer_valeurs(
donnees,
vars = c("revenu_mensuel", "depense_alimentaire"),
methode = "mediane",
rapport = FALSE
)# Anonymiser avant diffusion
donnees_anon <- anonymiser_donnees(
donnees,
vars_supprimer = c("nom", "prenom", "telephone", "adresse"),
vars_masquer = c("id_menage", "id_individu"),
vars_generaliser = list(age = 5),
rapport = FALSE
)
# Créer le package de diffusion
compresser_package_diffusion(
donnees = donnees_anon,
repertoire_sortie = "diffusion/",
nom_package = "EMOP_BEN_2023_v1",
metadonnees = list(
titre = "EMOP Bénin 2023",
institution = "INSAE",
version = "1.0"
)
)Import → Validation → Nettoyage → Pondération → Analyse → Visualisation → Diffusion
Pour aller plus loin, consultez les vignettes :