La déduplication : un outil indispensable pour optimiser sa stratégie de prospection

En complément de l’article sur le dédoublonnage, nous vous proposons d’aborder son pendant opérationnel en prospection : la déduplication.

Si le dédoublonnage est avant tout actif sur un ou plusieurs fichiers internes pour pouvoir travailler avec une base de contacts uniques, la déduplication consiste à effectuer un « super dédoublonnage » entre les fichiers d’adresses internes d’un annonceur (sa base de clients, ou anciens clients / prospects récents) et des fichiers externes, échangés ou loués, à des fins de prospection.

Dans le principe, un annonceur distingue son fichier client, avec lequel il communique déjà de façon régulière suivant les segmentations marketing qu’il a mis au point, des fichiers externes de prospection. Le but d’une déduplication est d’éviter de prendre contact avec un de ses clients en lui envoyant une offre de recrutement, ce qui perturbera évidemment la compréhension du client.

Il doit donc s’assurer, au moment de sa prospection, que les bases louées ne comportent que des adresses de purs prospects, afin que son offre soit adaptée.

De plus, cela permet d’identifier les prospects qui peuvent se retrouver en doublon dans plusieurs fichiers externes.

Par la suite, ces doublons pourront être réemployé pour une deuxième sollicitation dans un délai imparti. Nous les appelons les seconds de groupe.

Accepter

Les points clés de la déduplication

illustration de checklist

La déduplication est nécessairement réalisée par une SSII agréée.

On entend par là que la société doit pouvoir garder une neutralité quant aux traitements effectués, et qu’elle doit disposer d’outils de traitement agréés par le SNA (Service National de l’adresse).

Sans rentrer dans le détail des techniques de déduplication, on retiendra les points essentiels suivants :

  • L’ensemble des fichiers (repoussoir interne, repoussoir externe type Robinson, fichiers externes) est normalisé par un traitement RNVP, afin que les adresses puissent être lues et comparées de façon homogène et en minimisant les risques d’erreur.
    Ainsi, 2 adresses pourront être rapprochées : M. Jean Dupont, 13 rue de la Butte Aux Cailles, 75013 Paris sera rapprochée de M. ou Mme J. Dupont, Immeuble Tolbiac, appartement 5, 13 rue de la Butte aux Cailles, 75013 Paris.
    Le rapprochement entre les 2 adresses permettant de n’en conserver qu’une, dans l’idéal la plus complète.

  • On cherche à mettre en repoussoir (donc à ne pas prospecter) : les adresses de clients actifs de la marque ; les adresses de personnes ne souhaitant pas ou plus être prospectées (par la marque ou de façon générale), donc un éventuel fichier stop mailing de la marque, et un fichier national type Robinson en prospection mailing (rappelons que le fichier Robinson n’est pas obligatoire, mais fonctionne sur la base du volontariat des marques) ; des adresses de personnes ayant déménagé, et bénéficiant d’un contrat de réacheminement de la Poste (le fichier Estocade).

  • On cherche à ne prospecter qu’une seule fois un individu et/ou un foyer, donc à éliminer les doublons entre fichiers externes.
    En reprenant nos adresses Jean Dupont, si l’on retrouve Jean Dupont dans les fichiers repoussoirs, l’adresse sera automatiquement exclue.
    Si on retrouve cette adresse plusieurs fois dans les fichiers externes mais pas dans les repoussoirs, l’adresse ne sera conservée qu’une seule fois.

  • On pourra privilégier un ordre spécifique de fichiers (déduplication à rangs), afin de donner priorité à certains fichiers (par exemple, les fichiers offrant les meilleurs rendements).
    On pourra également privilégier une qualité d’adresse pour optimiser l’acheminement (dans mon exemple J. Dupont, prendre l’adresse avec le complément d’adresse Immeuble Tolbiac et n° appartement).
    On pourra tout aussi bien réaliser une déduplication en aléatoire, retenant une adresse comme son nom l’indique de façon aléatoire (afin de ne pas avoir de biais, et éviter des travaux de redressement post opération assez fastidieux).

  • En sortie de traitement de déduplication, la SSII présente un rapport de déduplication avec des informations qu’il faut absolument prendre le temps de lire.
    On a ainsi des indicateurs de qualité sur les fichiers externes et internes : taux de doublons internes sur chaque fichier, taux de rejet (adresses incomplètes ou non redressées par les traitements RNVP), taux d’Estocade, taux de Robinson.
    On a également des indicateurs sur le taux de communs inter-fichiers. Dans le principe, plus on a un taux de conservation faible (plus on a d’adresses communes entre les fichiers externes et internes), plus on est sur une concentration de cibles, et donc plus on a de chances que l’opération de prospection fonctionne.
    Cela peut sembler antinomique avec la notion de coût de location (puisque rappelons que nonobstant quelques accords, on paiera la quasi-totalité des adresses entrées en déduplication).
    En réalité, il faut trouver un bon équilibre entre l’investissement fait par la location des données et un bon taux de conservation pour que l’opération fonctionne.

  • La lecture des résultats de déduplication doit être faite, en sachant que si besoin, le prestataire de déduplication ou le broker ou l’agence de communication qui vous accompagnent peuvent vous aider à comprendre les principaux chiffres, et vous alerter sur des points de vigilance par rapport aux normes marché.

Gestion post duplication

bases de données

Post déduplication, le prestataire doit transmettre le fichier de prospection net de déduplication, éventuellement loti (un ou plusieurs lots suivant les souhaits de l’annonceur, le nombre d’offres distinctes, etc.) à un prestataire d’impression et routage

Quelques points complémentaires très importants à compléter autour de la déduplication. Le prestataire qui a réalisé la déduplication peut conserver les données originelles (fichiers sources, fichiers de traitement) selon des durées précises, encadrées par la loi (notamment le RGPD). 

La base mailing est intéressante à conserver, notamment pour pouvoir retrouver la source d’une adresse, si l’on n’intègre pas de codes média dans les messages de prospection, par exemple.

Le traitement de déduplication peut être complété par un traitement de redressement post opération (analyse des répondants par exemple, ou encore croisement de l’ensemble des répondants tous médias avec la sortie de déduplication pour mesurer l’exposition au mailing des répondants qui ont effectué un acte par un autre canal).

On peut également réaliser un traitement d’anonymisation pour réaliser des études statistiques, ou encore créer des matchcodes.

Conclusion

En conclusion, si la déduplication dépend d’outils techniques, on peut néanmoins en comprendre le fonctionnement simplement, et surtout l’intérêt de cette technique dans une stratégie de prospection d’une marque. 

Avec quelques points de repère pour comprendre et lire les résultats d’une déduplication, on peut être vigilants sur la qualité des données, en particulier en termes de délivrabilité, mais aussi pour utiliser la déduplication comme un moyen de renforcer la performance de campagne (lotissement intelligent, exploitation des meilleures adresses, exploitation des adresses Nièmes de groupe, etc.).