Traqués par nos propres smartphones, nous produisons chaque jour des quantités astronomiques de données de localisation. Des informations brutes sans grand intérêt, mais qui dévoilent beaucoup de chacun une fois analysées
Nos données de localisation sont très bavardes. Le lieu où nous sommes de 20h à 8h est logiquement celui de notre domicile. Et celui où ce dernier émet de 9h à 18h doit correspondre au lieu de travail. Grâce à la vitesse de déplacement, il est également facile de définir un mode de transport. Toutes ces informations sont recueillies par nos applications préférées, grâce à notre smartphone.
Nina Wiedemann, doctorante à l’Université de Zurich, a fait parler ces données de localisation. Pendant plusieurs mois, elle a entraîné un modèle d’apprentissage automatique pour analyser les données GPS récupérées par l’application Foursquare. Son idée: se placer du point de vue d’un pirate de données pour démontrer à quel point il est aisé d’établir des profils d’utilisateurs rien qu’avec nos données de localisation.
L’enjeu autour de ces données brutes de localisation est très concret: il est possible de créer des profils d’utilisateurs. En d’autres mots, faire parler ces données pour identifier des informations importantes comme des traits de caractère ou des habitudes d’achats. Des données importantes pour les compagnies qui achètent nos données, les data brokers, pour faire de la publicité ciblée.
Mais l’analyse peut être beaucoup plus fine, avec des risques très concrets: «Par exemple, les compagnies d’assurances sont très intéressées par ces données. Elles ont besoin de calculer toutes sortes de risques pour leurs clients. Elles peuvent estimer ces risques en sachant la quantité de sport que vous faites, combien de fois vous allez à l’hôpital, chez le médecin ou à la pharmacie. Il s’agit de données de santé très sensibles qui intéressent les entreprises.»
Des changements de comportements peuvent également être analysés. Par exemple, on ne se déplace plus vers son lieu de travail, mais régulièrement vers un hôpital, on peut en déduire que la personne a des problèmes de santé et qu’elle ne travaille plus.
Autre exemple d’utilisation de ces données: l’ingénierie sociale. «Plus des inconnus peuvent vous identifier, plus ils peuvent savoir quel genre de personne vous êtes, plus ils peuvent vous cibler pour certaines escroqueries», illustre également Nina Wiedemann.
Les applications GPS ne sont pas les seules à récupérer nos données de position. Une enquête de plusieurs médias dont Le Monde a révélé que Candy Crush, Vinted ou Grindr, notamment, partagent la localisation de leurs utilisateurs avec des partenaires commerciaux externes.