Catégories
Uncategorized

Les historiques de navigation sont suffisamment uniques pour identifier de manière fiable les utilisateurs, dit Mozilla


Les historiques de navigation sont suffisamment uniques pour identifier de manière fiable les utilisateurs, dit Mozilla

Une étude récente, menée par trois employés de Mozilla, s’est penchée sur la confidentialité offerte par les navigateurs aux internautes. Leurs résultats montrent que la plupart des utilisateurs ont des habitudes de navigation Web uniques qui permettent aux annonceurs en ligne de créer des profils précis.

Ces profils peuvent ensuite être utilisés pour suivre et réidentifier les utilisateurs sur différents ensembles de données, même si ceux-ci ne contiennent que de petits échantillons de l’historique de navigation d’un utilisateur.

L’étude dissipe le mythe selon lequel même l’historique de navigation anonyme n’est pas utile aux annonceurs en ligne. En fait, l’étude montre que même une petite liste de 50 à 150 des domaines préférés et les plus consultés de l’utilisateur peut permettre aux annonceurs de créer un profil de suivi unique.

Confirmation d’une étude similaire pour 2012

Le document de recherche de Mozilla est intitulé « Réplication: pourquoi nous ne pouvons toujours pas naviguer en paix: sur l’unicité et la réidentification des historiques de navigation Web » [PDF]. Cet article a été présenté plus tôt ce mois-ci lors de la USENIX Security Conference et fait suite à une autre étude académique publiée en 2012 [PDF].

Cette étude de 2012 était l’une des premières recherches à grande échelle sur la vie privée des utilisateurs à l’époque: les données de l’historique du navigateur de plus de 380000 internautes ont été analysées. Entre janvier 2009 et mai 2011, les chercheurs ont utilisé un site de test en ligne et un code CSS pour déterminer quels sites Web, à partir d’une liste prédéfinie de 6 000 domaines, les utilisateurs avaient visités.

L’étude de 2012 a montré que 97% des utilisateurs qui ont accédé à ce site de test avaient une liste unique de sites dans leur historique de navigation, ce qui faisait de l’historique de navigation un puissant vecteur de reconnaissance des utilisateurs. De plus, lorsque les utilisateurs ont été invités à entrer de nouveau sur le site de test, les chercheurs ont déclaré qu’ils étaient en mesure de réidentifier les utilisateurs en fonction de leur profil d’historique de navigation dès la première visite.

Les taux de précision étaient de 38% lorsque les chercheurs ont examiné les ensembles de données d’historique de navigation de 50 des domaines les plus populaires de l’utilisateur, et de 70% lorsqu’ils ont analysé les ensembles de données de 500. zones.

Les résultats de l’étude Mozilla en 2020

L’année dernière, les chercheurs de Mozilla voulaient réévaluer si l’historique de navigation était toujours un vecteur d’empreintes digitales valide et si l’étude de 2012 était toujours valide. La nouvelle expérience a été réalisée entre le 16 juillet et le 13 août 2019. Les chercheurs de Mozilla ont déclaré que plus de 52 000 utilisateurs ont accepté de participer et ont accepté de fournir des données de navigation anonymes.

Cependant, cette fois-ci, comme les données ont été collectées à partir du navigateur Firefox, et non via une page Web effectuant des tests CSS, les données collectées sont beaucoup plus précises et fiables. En outre, les données collectées par les chercheurs de Mozilla sont du même type que celles que les sociétés d’analyse en ligne d’aujourd’hui collectent également sur les utilisateurs, que ce soit par le biais de partenariats de données, d’applications mobiles, de publicité en ligne ou d’autres mécanismes.

Comme en 2012, la collecte des données s’est déroulée en deux étapes, en deux semaines, les utilisateurs partageant leur historique de navigation pour la première semaine puis à nouveau pour la seconde, afin que les chercheurs de Mozilla puissent voir s’ils pouvaient ré-identifier les utilisateurs.

Au total, l’équipe de Mozilla a déclaré avoir collecté des données sur environ 35 millions de visites de sites Web dans 660 000 domaines uniques. Et cet accès à de meilleures données s’est immédiatement reflété dans les résultats de l’étude. Mozilla a déclaré que 99% des profils de navigation collectés pour l’étude étaient uniques à chaque utilisateur. Cette particularité a permis aux chercheurs de Mozilla de réidentifier facilement les utilisateurs au cours de la deuxième semaine de l’étude.

La précision est également meilleure que celle de l’étude de 2012. Mozilla prétend avoir un taux de ré-identifiabilité de près de 50% pour les ensembles de données contenant 50 domaines de l’historique de navigation d’un utilisateur. Ce taux de ré-identifiabilité augmente à plus de 80% lorsque les chercheurs de Mozilla étendent l’ensemble de données de l’historique de navigation à 150 domaines.

Cela suggère que les sociétés d’analyse et les annonceurs n’ont pas besoin de listes importantes de données d’historique de navigation pour suivre les utilisateurs, et que les spécificités de navigation de chaque utilisateur et leurs sites préférés finissent par les divulguer, même lorsque les données sont anonymes et les URL tronquées.

Une vidéo de la présentation de l’équipe Mozilla est disponible ici.

Source: ZDNet.com





Source link