D’après la société Médiamétrie, 53.5 millions de français se sont rendus sur le web en avril 2020. Soit 85.4% de la population. En particulier, l’utilisation des réseaux sociaux a augmentée de 61%. Le confinement nous a rendu d’autant plus connectés. Si l’on compte les réseaux sociaux, les sites web, les plateformes pour télétravailler, les outils de visioconférence… on répand beaucoup d’informations à notre sujet sur Internet. C’est une bonne raison de faire le point sur nos données. Car récupérer nos données personnelles éparpillées sur le Web nous permet de voir comment les entreprises du web nous perçoivent. On peut aussi en apprendre davantage sur notre propre comportement.
Quelques exemples de données personnelles récupérées
Pour comprendre à quoi servent nos données personnelles, il faut récupérer des informations. Je vous propose en apéritif quelques-unes de mes propres données récupérées auprès de certaines entreprises.
Décathlon
Décathlon m’a fourni différentes feuilles Excel me concernant. L’entreprise m’a transmis ce dossier de données à travers Google Drive (un intermédiaire de plus qui peut consulter mes données à mon insu). L’image ci-dessus est un petit extrait de ce que j’ai reçu. Voici comment je l’interprète : Décathlon a identifié, grâce à mes achats, que j’ai commencé à jouer au badminton en février 2018. Ils ont aussi déduit que nous sommes deux à pratiquer ce sport, car deux lignes affichent la valeur beginner_player (« joueur débutant ») avec la même date (2018-02-08).
Ils ont aussi estimé qu’en juin 2018, nous sommes devenus des joueurs de badminton confirmés. Nous méritions donc de recevoir de la publicité. Pour info, la colonne active_flag (ci-dessus) indique les lignes actives lorsque la valeur est à 1, c’est-à-dire le statut en cours.
Dans le classeur principal on retrouve 6 onglets de données, en commençant par les information d’identité avec la liste de tous les achats dans l’onglet Perso. L’onglet Sports rassemble les informations concernant le badminton (ci-dessus). L’onglet Campagnes emailing liste les mails marketing qui m’ont été envoyés. Scores présente le résultat des analyses de Décathlon par rapport aux campagnes mails envoyées. Ces résultats leur permettent de m’envoyer des mails qui sont techniquement plus susceptibles de me faire acheter.
Samsung
Décathlon m’a remis deux classeurs Excel (avec 4 onglets de données dans le deuxième classeur). Les données envoyées par Samsung sont beaucoup plus structurées. Il y a des fichiers et des sous-dossiers. N’ayant pas encore anonymisé ces données personnelles, je vous propose un extrait de l’en-tête d’un document Excel :
N°Consommateur id_sql Numéro OP Intitulé opération Date de démarrage de l'op Date limite de participation Date de participation CODE_DE_PARTICIPATION IDENTIFIANT_SUA Date de saisie Date Semaine Civilité Cher ou chère Nom Prénom Adresse Adresse2 Adresse3 Numérique CP communes Date naissance Téléphone Téléphone PORTABLE ADRESSE MAIL Code IBAN Code BIC Code IBAN Valide Code BIC Valide Virement Virement Effectué Mont Etat Non Conforme Lettre Non conforme envoyée Enseigne ADRESSE ENSEIGNE CP ENSEIGNE VILLE ENSEIGNE Date d'achat Date d'édition des NC Date d'expédition des NC Date de débit des Virements Remboursement non abouti Confirmation Virement envoyée Date d'expédition Confirmation Virement Confirmation conformité envoyée Date d'expédition Confirmation Conformité Motif NC NC Samsung STATUT_DOSSIER Civilité SEF Date d'envoi de la dotation REF_PRODUIT1 REF_PRODUIT2 RNC ENSEIGNE NC OPERATEUR NC PRODUIT NC CODE BARRES NC DATE ACHAT NC Courrier de confirmation de virement Recommandé CODE_ERREUR DESCRIPTION_ERREUR CODE_CONFORMITE OU CODE_NON_CONFORMITE LIBELLE_CODE CODE_CONFORMITE OU CODE_NON_CONFORMITE2 LIBELLE_CODE2 DATE_GENERATION_PARTICIPATION DESCRIPTIF_PRIME NUMERO_SERIE_PRODUIT1 PRIX_TTC_PRODUIT1 CODE_BARRE_PRODUIT1 NUMERO_SERIE_PRODUIT2 PRIX_TTC_PRODUIT2 CODE_BARRE_PRODUIT2 REF_PRODUIT3 NUMERO_SERIE_PRODUIT3 RESTEZ_EN_CONTACT MONTANT_REMBOURSEMENT Date limite virement LOT N° PRODUITS Code barres non listé du Produit 1 Code barres non listé du Produit 2 NC21 régularisé Date régul NC21 NC conformisé date_import REF_PRODUIT_DECLARE1 REF_PRODUIT_DECLARE2 REF_PRODUIT_DECLARE3 REF_PRODUIT_DECLARE4 date_saisie fraudeur id_fraudeur date_blacklist IMEI 1 IMEI 2 participation_certifiee potentiel_fraudeur doublon_SN doublon_IMEI dateEditionPrime NumeroPrime NumeroSeriePrime email_nc_envoye email_code_envoye ENSEIGNE_SAISIE AUTRE_ENSEIGNE_SAISIE date_envoi_mail_dotation Code barres non listé du Produit 3 ITS_envoye ITS_check_result ITS_check_message created_at IMEI 6 Code barres non listé du Produit 4 Code barres non listé du Produit 5 Code barres non listé du Produit 6 Code barres non listé du Produit 7 Code barres non listé du Produit 8 Code barres non listé du Produit 9 Code barres non listé du Produit 10 RaisonSociale Activite Fonction ProPart JustifPro JustifProAutre MONTANT_REMBOURSEMENT1 MONTANT_REMBOURSEMENT2 PartiellementConforme DateEnquetePoste ID_PRODUIT_PERE ref_produit QtePrimes PotentielDoublon dateEnvoiMailPrimeExpe NUMERO_SERIE_PRODUIT DateLimiteParticipation Statut_ITS
Pour faire simple, Samsung conserve absolument tout, même votre code IBAN, BIC… juste au cas où. L’entreprise archive la liste des produits que vous avez achetés, leur code IMEI (International Mobile Equipment Identity), leur code barre. Votre smartphone et ses accessoires vous représentent littéralement. Il y a même une colonne réservée à un potentiel_fraudeur.
Analyse détaillée de l’export des données personnelles
Présenter l’ensemble de mes trouvailles représenterait énormément de travail et exigerait un grand nombre d’articles. Cependant, j’en ai déjà publié quelques-uns que vous pouvez retrouvez ici :
Accédez aux données personnelles anonymisées exportées par des entreprises
Sur Unlock My Data, vous pouvez télécharger mes données anonymisées et les consulter avant de souscrire à une quelconque carte de fidélité, ou de créer un compte sur un site. Pour cela, rendez-vous sur le site Unlock My Data et connectez-vous ou créez un compte.
Une fois connecté, cliquez sur le bouton Lancer une demande. Vous accéderez à la liste des entreprises / services recensés par Unlock My Data. Dans la partie critère d’information, sélectionnez l’option Avec un exemple de données puis cliquez sur la petite loupe à droite afin de filtrer les données.
Unlock My Data affiche uniquement les entreprises pour lesquelles des données personnelles ont été récupérées et anonymisées.
Sur chacune de ces cartes d’entreprise, il y a des petits logo représentatifs. Celui figurant une fiche et une loupe indique la présence d’un exemple de données personnelles.
Cliquez sur l’entreprise souhaitée.
Le premier bloc contenant les informations de base de l’entreprise propose aussi un Exemple d’export. Il suffit donc de cliquer sur le bouton Cliquez ici pour télécharger des données personnelles anonymisées récupérées dans l’entreprise. Vous allez faire de sacrées découvertes !
Conclusion
J’espère qu’avec ce nouvel article, vous vous découvrirez une nouvelle passion : l’archéologie 2.0 des données personnelles enfouies dans le Deep Web. Si cela vous intéresse et que vous souhaitez contribuer à Unlock My Data, contactez-moi directement. Avec votre aide, nous pourrons révéler les trésors d’informations que les entreprises possèdent sur chacun d’entre nous.
Que pensez-vous des exemples de données présents dans Unlock My Data ? Répondez-nous dans les commentaires.
Et pour en savoir plus sur cette loi nommée RGPD, qui nous permet de faire ces découvertes, c’est par ici.