Gestion des homonymes

Dans un audit d'empreinte numérique, il est fréquent que certains résultats concernent des personnes qui portent le même nom que toi — tes homonymes. Voici comment Data Knight distingue tes données de celles des autres, et ce que le bouton « Ce n'est pas moi » permet de faire.
Prêt·e à tester ? Lance ton analyse gratuite
Les homonymes, c'est fréquent
La France compte plus de 1,5 million de noms de famille différents recensés par l'INSEE, mais la population est très concentrée sur une minorité d'entre eux. Quelques ordres de grandeur (sources INSEE, période 1891-2000) :
- Les 20 noms de famille les plus courants en France sont portés par plus de 2 millions de personnes (INSEE). Les homonymes sont fréquents dans les résultats publics en ligne.
- Le nom Martin, le plus fréquent, est porté par environ 230 000 personnes.
- Même avec un patronyme moins commun, la combinaison nom + prénom est souvent partagée par plusieurs personnes sur le web public.
Côté prénoms, le fichier INSEE recense des milliers de prénoms utilisés en France depuis 1900. Résultat : même avec un prénom peu courant, il est presque inévitable que, sur le web public ou dans certaines bases de données, des pages ou fiches remontent pour d'autres personnes qui portent le même « nom + prénom » que toi. Il est donc fréquent que des homonymes remontent dans les audits Data Knight, mais notre méthodologie réduit au maximum les faux positifs.
Sources : INSEE – Fichier des noms de famille (1891-2000), Fichier des prénoms.
Comment on distingue tes données
Data Knight ne se contente jamais du seul couple « nom + prénom ». Pour chaque résultat, on croise plusieurs signaux pour juger s'il s'agit bien de toi.
Tes identifiants uniques : e-mail et téléphone
Ton adresse e-mail et ton numéro de téléphone sont des identifiants uniques qui n'appartiennent qu'à toi. Quand un courtier, une fuite de données ou une base quelconque contient ton e-mail ou ton téléphone, il n'y a aucun risque d'homonyme : c'est toi, sans ambiguïté. C'est la base la plus fiable de l'audit.
Croisement nom + prénom + contexte
Pour les résultats du web public (articles, registres, annuaires, réseaux sociaux), on applique une qualification stricte : on croise ton nom + prénom avec les éléments du contenu (ville, employeur, école, pseudonyme associé, photo de profil, etc.). Notre moteur ne retient que les résultats dont la correspondance est forte : certitude haute ou moyenne, sans ambiguïté manifeste. En cas de doute, le résultat est écarté.
Qualification IA déterministe
La qualification des résultats du web public est effectuée par Claude (Anthropic) avec une classification en fonction des taux de certitudes : pour les mêmes résultats bruts, la décision est déterministe, et vérifiée. Les candidats incertains sont filtrés avant d'atterrir dans ton bilan. Il arrive parfois qu'il reste des faux positifs, c'est pour cela que nous te laissons la main pour les supprimer des résultats.
Le bouton « Ce n'est pas moi »
Malgré ce filtrage, il peut arriver qu'un résultat concerne un homonyme. Tu restes maître de ton bilan : chaque résultat du web public affiche un bouton « Ce n'est pas moi » qui te permet de l'exclure en un clic.

Ce qu'il fait concrètement
- Le résultat est immédiatement masqué de ton bilan.
- Si tu es connecté·e, l'exclusion est persistée : ce résultat ne réapparaîtra pas dans tes audits suivants, même si tu relances une analyse.
- Si tu n'es pas connecté·e, l'exclusion est conservée pour la session en cours. Crée un compte pour la rendre permanente.
- Aucune demande d'effacement n'est envoyée sur les résultats que tu as exclus : Data Knight ne dérange pas un homonyme pour qui tu ne parles pas.
Nos garanties
Rien n'est envoyé sans ta validation
Après l'audit, l'étape « Choisis les données » te montre chaque ligne (web public et courtiers). Tu coches ce que tu veux faire effacer. Aucune demande RGPD n'est déclenchée sans ton accord explicite — il n'y a donc aucun risque de demande sur un homonyme.
La demande d'effacement contient tes identifiants
Quand on envoie une demande au titre de l'article 17 RGPD, on joint ton e-mail, si nécessaire ton téléphone, et une copie de ton autorisation signée. Le destinataire ne peut donc traiter que ta fiche, pas celle d'un homonyme : il croise nos données avec les siennes.
En cas de doute : manuel plutôt qu'agressif
Si un résultat est ambigu (certitude faible, contexte contradictoire), Data Knight le revoit manuellement plutôt que de déclencher un envoi automatique. Nous préférons une demande de moins qu'une demande qui concerne la mauvaise personne.

