Glossaire
A
Adresse postale
Une adresse postale doit être lisible par une machine afin que les envois puissent être distribués sans retard. Les normes internationales telles que la norme ISO 19160-4 et la norme allemande DIN 5008 standardisent la structure correcte, l’orthographe et les éléments d’une adresse postale. En conséquence, une adresse postale en Allemagne se compose de l’entreprise et/ou du contact, de la rue et du numéro (ou de la boîte postale), du code postal et du lieu de destination. Pour les adresses internationales, il n’est plus d’usage de faire précéder le code postal d’un code de pays. Conformément à la norme DIN 5008 mise à jour, le nom du pays en allemand, anglais ou français est placé en majuscules sous le code postal et la destination. Les lignes vides entre les différents éléments de l’adresse ne sont plus non plus d’usage.
B
Batch vs. Service
Les produits TOLERANT offrent deux modes d’utilisation principaux : le mode batch, qui peut être exécuté hors ligne, et le mode service, qui est exécuté en ligne.
Lorsque de nombreux enregistrements sont traités en une seule étape de processus, on parle de traitement par lots (« batch processing »). À l’origine, ce terme désignait le traitement automatisé d’une pile de cartes perforées. Aujourd’hui, il désigne le traitement non surveillé d’une quantité de données généralement importante selon un modèle de traitement uniforme. En mode batch, il est donc possible de comparer rapidement de grandes quantités de données entre elles.
Le mode service est traité en ligne via une interface API et est donc également appelé mode API. L’abréviation API signifie ‘Application Programming Interface’, c’est-à-dire une interface de programmation d’applications.
Dans la pratique, le mode service ou API est généralement utilisé lorsqu’il s’agit d’une intégration directe dans une application. Par exemple, lorsque les données d’adresse doivent être vérifiées directement lors de leur saisie dans le système CRM. Le mode API est également utilisé pour les requêtes individuelles sous la forme d’un service web, tandis que l’ensemble des données est contrôlé et nettoyé à intervalles réguliers en mode batch.
BDSG (loi fédérale sur la protection des données)
BIC (Bank Identifier Code)
Le Bank Identifier Code (BIC) est un code d’identification bancaire valable au niveau international, attribué et défini par la Society for Worldwide Interbank Financial Telecommunication (SWIFT).
C
Cloud Computing
Le cloud computing consiste à mettre à disposition des programmes logiciels ou des mémoires de données sur des serveurs externes et à les utiliser virtuellement via Internet. En revanche, les données sont stockées localement et sur place sur des serveurs sur site.
Les produits de TOLERANT Software sont entièrement compatibles avec le cloud et peuvent être exploités sur la plateforme cloud du client. En outre, TOLERANT Software propose également certains produits sous forme de service en nuage ou de logiciel en tant que service (SaaS). Le service SaaS est particulièrement adapté à la comparaison de données tolérante aux erreurs avec des listes PEP (TL Cloud PEP), avec des listes de sanctions (TL Cloud Sanction), avec des données d’entreprise (TL Cloud Business), avec des données d’adresse (TL Cloud Post) ainsi qu’avec des données bancaires (TL Cloud Bank).
Conformité
Pour pouvoir respecter les prescriptions légales (comme par exemple les prescriptions du RGPD de l’UE) ou d’autres réglementations externes, des normes uniformes sont introduites et mises en œuvre dans l’entreprise. La mise en œuvre de ces mécanismes peut être soutenue par des outils de qualité des données tels que TOLERANT MPM, TOLERANT PEP ou TOLERANT Sanction.
Consulting vs. Support
Conteneurs Docker
Le logiciel open source Docker emballe les logiciels dans des conteneurs. Ces unités compactes contiennent tout ce qui est nécessaire au fonctionnement du logiciel, par exemple les bibliothèques, les outils système, le code et les temps d’exécution. À l’instar des conteneurs de fret sur un cargo, les conteneurs de logiciels peuvent être arrimés à un hôte Docker et mis à l’échelle horizontalement. Les conteneurs à l’échelle horizontale peuvent être exploités de manière modulaire, c’est-à-dire côte à côte et indépendamment les uns des autres, au moment où ils sont nécessaires. L’utilisation de conteneurs Docker est judicieuse, entre autres, lorsqu’une grande puissance de calcul est nécessaire à court terme. La puissance de calcul supplémentaire peut être transférée sur des conteneurs Docker. De plus, les conteneurs Docker simplifient l’installation et la mise à jour des logiciels. Les produits logiciels TOLERANT peuvent également être livrés et exploités dans des conteneurs Docker.
D
Data Quality-Connector (DQ-Connector)
Un connecteur DQ est une interface entre un système CRM ou ERP et des outils de qualité des données. Les outils de qualité des données prennent en charge différentes tâches d’assurance qualité lors de la saisie et du traitement des données clients. Par exemple, les clients peuvent être recherchés de manière floue. Les adresses peuvent être trouvées, vérifiées et complétées par autocomplétion. Avant l’enregistrement, il est possible de vérifier une nouvelle fois qu’aucun doublon n’a été créé. Le DQ-Connector veille à ce que le système CRM ou ERP reste exempt de doublons et que les données saisies soient correctes.
Data Steward
Les Data Stewards sont responsables de la qualité des données au sein d’un département spécifique de l’entreprise. En collaboration avec le gestionnaire de la qualité des données interdépartemental, les data stewards coordonnent la surveillance de la qualité des données au sein d’une entreprise.
Détection des doublons, élimination des doublons
voir sous Doublons
Données de déménagements
voir sous Nettoyage des données d’adresses
Données relatives au style de vie
Le milieu et le style de vie jouent un rôle important dans la décision d’achat. Les commerciaux ont donc tout intérêt à y regarder de plus près et à classer les groupes cibles en fonction de leurs données de style de vie afin de s’adresser exactement aux bons prospects potentiels. L’outil de qualité des données TOLERANT Post utilise les données de style de vie CAMEO de Deutsche Post Direkt GmbH. Les données CAMEO permettent de segmenter les environnements résidentiels de manière microgéographique et de les classer en fonction de la classe sociale, de la capacité financière et de la phase de vie. Les données de style de vie aident à établir une typologie spécifique des groupes cibles, à identifier les potentiels et à augmenter ainsi les parts de marché à long terme. Les données CAMEO sont disponibles pour de nombreux pays européens et internationaux. Pour l’Allemagne, elles comprennent plus de 40 caractéristiques permettant une différenciation régionale et sociodémographique. Ces caractéristiques sont à leur tour regroupées en 9 groupes principaux, ce qui permet de distinguer clairement les univers de vie, les comportements de consommation et les intérêts des différents groupes.
Doublons, détection des doublons, élimination des doublons
Les doublons sont des enregistrements de données en double concernant la même personne ou entreprise, qui se distinguent par des caractéristiques mineures (p. ex. orthographe différente, données d’adresse différentes). La recherche tolérante aux erreurs permet d’identifier et de supprimer les doublons dès la saisie des données. L’outil TOLERANT Match permet d’identifier et de supprimer automatiquement les doublons lors de la fusion de grandes bases de données.
DQ-Issue-Management
La gestion des DQ-Issues est un processus visant à résoudre les problèmes de qualité des données (DQ-Issues). Il s’agit par exemple d’adresses postales non valables, d’erreurs d’orthographe, de doublons ou d’enregistrements incomplets. Ces erreurs de qualité sont mesurées, évaluées et corrigées dans le cadre d’un processus structuré. La gestion DQ-Issue combine des outils de mesure automatisés, le contrôle des processus et des étapes de contrôle manuel. Les outils de TOLERANT Software servent de base à la gestion DQ-Issue.
F
First Level vs. Second Level Support
voir sous Support vs. Consulting
Fuzzy Search
voir sous Recherche tolérante aux erreurs
G
Gestion de la qualité des données
voir sous DQ-Issue-Management
Gestionnaire de la qualité des données
Un gestionnaire de la qualité des données joue un rôle central dans une entreprise. En collaboration avec les Data Stewards internes, le gestionnaire de la qualité des données assure la qualité des données dans une entreprise. En cas de problème, il joue le rôle de médiateur entre l’administrateur informatique et les data stewards.
I
IBAN (International Bank Account Number)
L’IBAN est une orthographe internationale standardisée pour les numéros de compte. Il a été introduit pour uniformiser le trafic international des paiements.
Index, central et inter-systèmes
Un index de recherche ou de clients inter-systèmes permet de centraliser les données provenant de différentes sources et de différents systèmes. L’index accélère les recherches et les requêtes inter-systèmes, car il rend superflue la recherche séparée dans les différents systèmes. Selon nos estimations, une recherche centralisée dans un index inter-systèmes est en moyenne 60 fois plus rapide qu’une recherche traditionnelle dans plusieurs systèmes. L’index de recherche inter-systèmes est inclus dans le produit TOLERANT Match.
Indice de clientèle inter-systèmes
voir sous Index
Indice de recherche central
voir sous Index
Interdictions de dialogue (liste Robinson du DDV)
Les listes d’interdiction de publicité protègent les consommateurs contre les envois publicitaires non souhaités. Il s’agit par exemple des listes Robinson de l’I.D.I. (Interessensverband Deutsches Internet e.V.) ou de la DDV (Deutscher Dialogmarketing Verband). L’outil de qualité des données TOLERANT MPM permet de comparer les données clients avec de telles listes d’interdiction de dialogue.
L
Listes antiterroristes
L’Union européenne interdit les relations commerciales avec les terroristes et les partisans de groupes extrémistes. Les listes antiterroristes, les listes de sanctions ou les listes d’embargos, régulièrement mises à jour par l’UE, indiquent qui fait partie de ces groupes. L’outil TOLERANT Sanction permet de comparer automatiquement le portefeuille de clients avec les listes antiterroristes, les listes de sanctions et les listes d’embargos. Les résultats trouvés doivent ensuite être évalués par les départements responsables respectifs.
M
Marketing ciblé
Le marketing ciblé consiste à s’adresser à des groupes cibles spécifiques. Les groupes cibles peuvent par exemple être délimités au niveau régional ou sociodémographique au moyen d’une segmentation microgéographique.
Marketing Permission Management
voir sous RGPD
Marketing spécifique au groupe ciblé
voir sous Marketing ciblé
Microgéographie
voir sous Données de style de vie
Migration des données
voir sous Processus ETL
N
Nettoyage des données
voir sous Nettoyage des données d’adresses
Nettoyage des données d’adresses
Des adresses postales et électroniques correctes et à jour sont la condition sine qua non d’un dialogue client réussi. Les retours et les envois non distribuables entraînent des coûts élevés. Une vérification et un nettoyage réguliers du stock d’adresses postales et électroniques permettent de réduire ces coûts. Les outils de qualité des données tels que TOLERANT Post, TOLERANT Move et TOLERANT Match permettent de réaliser ces tâches. Ces outils comparent les adresses postales avec les données d’adresses et de déménagements de la Deutsche Post et vérifient la délivrabilité des adresses électroniques. La recherche tolérante aux erreurs permet de détecter et de supprimer les doublons et les doubles, même en cas d’orthographe similaire.
O
On-Premise
voir sous Cloud Computing
P
Parsing (Analyse syntaxique)
Lors de l’analyse syntaxique, les champs de texte libre – comme les noms – sont divisés en éléments tels que la formule de politesse, le titre, le prénom et le nom. Les outils de qualité des données comme TOLERANT Name effectuent l’analyse syntaxique automatiquement. Par exemple, TL Name sépare automatiquement l’entrée « Madame Dr. Alexandra Schellenberger » en titre (« Madame »), titre (« Dr. »), prénom (« Alexandra ») et nom de famille (« Schellenberger »). L’analyse automatique, la standardisation et la structuration des éléments du nom permettent d’éviter les erreurs d’adressage et de s’adresser correctement au client.
Partitionnement
Le partitionnement consiste à diviser les enregistrements d’une grande quantité de données présentant des caractéristiques similaires en sous-domaines (en anglais : partition), dans lesquels la recherche est ensuite effectuée. Les caractéristiques typiques qui se prêtent au partitionnement sont par exemple le code postal, l’indicatif téléphonique, le domaine de messagerie électronique ou la date de naissance. Pour le partitionnement, les caractéristiques doivent être disponibles sans faille pour tous les clients. Le partitionnement a l’avantage d’accélérer la recherche de données, car seuls des domaines partiels pertinents doivent être recherchés et non l’ensemble des données. Les sous-secteurs pertinents sont déterminés par les valeurs du champ de recherche.
Ce schéma représente graphiquement le processus de partitionnement.
PEP (personnes politiquement exposées)
Les personnes politiquement exposées (PEP) sont des personnes physiques, comme les hommes politiques, qui occupent un poste particulièrement influent. Afin d’éviter la corruption et les pots-de-vin, les entreprises ont, conformément à la directive anti-blanchiment de l’UE, un devoir de diligence particulier lorsqu’elles traitent avec des PEP. Elles sont par exemple tenues d’identifier les PEP dans leur base de clients. L’outil TOLERANT PEP compare automatiquement le portefeuille de clients avec les listes de PEP en vigueur au niveau international.
Phonétique de Cologne
La phonétique de Cologne est un algorithme informatique qui attribue un chiffre à chaque son linguistique d’un mot. Le codage du texte en chiffres sert à classer les mots en fonction de leur sonorité. Avec l’aide de la phonétique de Cologne, un ordinateur reconnaît les mots qui ont un son similaire. L’algorithme permet à l’ordinateur de rechercher des données en tolérant les erreurs et, lorsqu’un mot est saisi, de trouver un mot à la sonorité similaire. Contrairement aux procédés Soundex et Metaphone, qui ont été conçus pour l’espace linguistique anglais, la phonétique de Cologne a été adaptée à l’espace linguistique allemand. La phonétique de Cologne code les consonnes avec les chiffres 1 à 8 et les voyelles avec le chiffre 0. Lors de l’attribution d’un chiffre à un son linguistique, les lettres voisines sont également prises en compte. Par exemple, la lettre P est codée avec le chiffre 3 lorsqu’elle est placée devant un H. Dans tous les autres cas, elle est attribuée au code 1. La phonétique de Cologne est utilisée avec Soundex et Metaphone dans l’outil de vérification des doublons TL Match. Grâce aux algorithmes intégrés, TL Match trouve par exemple l’enregistrement « Alexander Sczepansky » même si l’on a cherché « Alex Schepanski ».
Processus ETL
L’abréviation ETL désigne les trois processus de migration de données : extraction (E), transformation (T) et chargement (L). Lorsque des données sont transférées d’un système à un autre, elles passent généralement par ces trois processus. Les processus ETL sont orientés vers le traitement par lots ; leur actualité des données est donc limitée.
Pseudonymisation, Recherche de clients sous pseudonyme
Les données confidentielles des clients sont souvent échangées entre partenaires commerciaux sous forme de pseudonyme – par exemple pour préserver le secret commercial ou pour des raisons de sécurité. Lors de la pseudonymisation, les caractéristiques personnelles telles que le nom, l’adresse ou le numéro de téléphone sont remplacées par des pseudonymes.L’outil de qualité des données TOLERANT Match peut également effectuer des recherches tolérantes aux erreurs dans des bases de données entièrement pseudonymisées et identifier les doublons. Toutes les autres données clients restent anonymes lors de la recherche et le secret des affaires est préservé.
Q
Qualité des données
La qualité des données se reflète dans leur utilité. Les données sont bonnes lorsqu’elles remplissent l’objectif pour lequel elles ont été générées. Les critères importants pour évaluer la qualité des données sont par exemple l’exactitude, l’exhaustivité, la cohérence, la pertinence et l’actualité.
R
Recherche floue
voir sous Recherche tolérante aux erreurs
Recherche tolérante aux erreurs
La recherche tolérante aux erreurs est également appelée « recherche floue » ou « fuzzy search » dans le jargon logiciel. Lors d’une recherche à tolérance de fautes, des orthographes similaires sont prises en compte. Cela est particulièrement utile pour les noms difficiles à écrire, dont l’orthographe diffère fortement de la prononciation, ou pour les informations incomplètes. La liste des résultats affiche alors tous les termes qui pourraient être utilisés. Si l’on cherche par exemple « Szymanski », on trouvera également « Schimanski » et « Sczymansky » dans la liste de résultats grâce à la recherche tolérante aux erreurs.
Règlement général européen sur la protection des données (RGPD)
Le règlement général européen sur la protection des données (RGPD) est entré en vigueur le 25 mai 2018. Il uniformise le traitement des données à caractère personnel et protège les personnes physiques dont les données à caractère personnel sont traitées par des tiers.
Conformément à l’article 15 du RGPD, les personnes concernées ont par exemple le droit de demander aux responsables si leurs données à caractère personnel sont traitées. Les responsables sont tenus de répondre à ces demandes de protection des données en temps utile.
Conformément à l’article 12, paragraphe 1, et à l’article 5, paragraphe 2, du RGPD, les responsables doivent se préparer à de telles demandes et prendre des mesures appropriées pour pouvoir répondre aux personnes concernées dans les délais impartis. En Allemagne, le RGPD est complété et précisé par la loi fédérale sur la protection des données (BDSG).
Le produit TOLERANT MPM de TOLERANT Software aide les entreprises à répondre aux demandes de protection des données sans faille et en toute sécurité juridique.
RGPD (Règlement général de la protection des données)
S
SEPA (Single Euro Payments Area)
Dans l’espace unique de paiement en euros SEPA (Single Euro Payments Area), les virements, les prélèvements et les paiements par carte sont traités de manière uniforme. Les 28 États membres de l’UE ainsi que 8 autres pays participent au SEPA.
Service après-vente
Service vs. Batch
voir sous Batch vs. Service
Support vs. Consulting
Si vous avez des questions sur les produits TOLERANT, notre département de service est à votre disposition. Nous avons divisé notre service d’assistance après-vente en trois secteurs, à savoir le service d’assistance, le service de conseil et le service de développement.
Nos collaborateurs du support de premier niveau sont les premiers interlocuteurs pour toutes les demandes de nos clients. Ils répondent aux questions sur l’utilisation de nos produits de qualité des données et fournissent une assistance technique et un soutien en cas de problème. De nombreux problèmes d’application (comme par exemple les questions sur la version du produit, la compatibilité du produit ou les clés de licence et les données de référence) peuvent être entièrement traités par le support de premier niveau. Le support de premier niveau vérifie également si l’erreur a été entièrement décrite. Si ce n’est pas le cas, les collaborateurs du support complètent le cas échéant la description de l’erreur du client ou aident le client à la formuler. Les informations manquantes, telles que les fichiers, les logs et les requêtes concernant la demande, sont éventuellement demandées au client.
Les demandes plus complexes des clients, auxquelles le support de premier niveau ne peut pas répondre complètement, sont transmises au département de conseil de TOLERANT Software. Grâce à la documentation préparée par le support de premier niveau, le collaborateur du service de consultation obtient rapidement une vue d’ensemble de la demande du client. Il peut ainsi s’occuper rapidement de la demande du client sans devoir suivre une longue formation et y répondre rapidement.
Enfin, le service de développement de TOLERANT Software résout les problèmes d’application encore plus spécifiques, notamment la compatibilité du produit avec les programmes CRM ou ERP de l’entreprise. En étroite collaboration avec le client ou avec l’utilisateur dans son département spécialisé, notre service de développement élabore des solutions parfaitement adaptées au cas d’application concret. Le service d’assistance de troisième niveau intervient notamment auprès des grands clients qui traitent plusieurs millions d’enregistrements par an.
Vous pouvez contacter les trois départements de notre service après-vente pendant nos heures de service, du lundi au vendredi de 9 à 17 heures, au numéro +49 711 490 448 70 et à l’adresse support@tolerant-software.de.
Système CRM (Customer Relationship Management)
Un système de gestion de la relation client (en abrégé : système CRM) organise et gère la relation d’une entreprise avec ses clients. Généralement, les données clients sont stockées dans un système CRM, avec l’historique des contacts et des ventes. Chaque interaction avec le client est documentée dans le système CRM. Tous les services de l’entreprise qui ont accès au système CRM peuvent l’utiliser pour gérer les clients et interagir avec eux.
Système de gestion des marchandises
voir sous Système ERP
Système ERP (Enterprise Resource Planning)
Un système de planification des ressources d’entreprise (Enterprise Resource Planning System) est un système de gestion des marchandises basé sur un logiciel qui reproduit les processus d’une entreprise. Les données clients sont également nécessaires pour la planification, le contrôle et la gestion des processus. Des produits de qualité des données tels que TOLERANT Match ou TOLERANT Name peuvent être couplés aux systèmes ERP courants via des interfaces. De cette manière, il est possible d’éviter ou de réduire totalement les erreurs de ciblage des clients sur les offres, les confirmations de commande et les factures.
T
Traitement des données de commande
En Allemagne, la collecte, le traitement et l’utilisation des données à caractère personnel sont régis par l’article 11 de la loi fédérale sur la protection des données (BDSG). Lorsque des données sont collectées, traitées ou utilisées pour le compte de tiers, les partenaires commerciaux doivent conclure un accord de traitement des données de commande (AVV). Conformément à l’article 9 de la BDSG, un tel accord définit également les mesures techniques et organisationnelles pour le traitement des données. Pour l’utilisation des produits logiciels TOLERANT, les partenaires commerciaux doivent également conclure un contrat de traitement des données de commande avec leur fournisseur de logiciels si « le contrôle ou la maintenance de procédures automatisées ou d’installations de traitement de données est effectué par d’autres organismes sur mandat et qu’un accès aux données personnelles ne peut être exclu » (§ 11, alinéa 5, BDSG).
V
Validation des données bancaires
Les données bancaires telles que l’IBAN et le BIC peuvent être vérifiées et corrigées automatiquement dès la saisie grâce au logiciel de validation TOLERANT Bank.
Validation des e-mails
voir sous Nettoyage des données d’adresses
Validation des noms
voir sous Parsing (Analyse syntaxique)
Validation/Vérification d’adresses
voir sous Nettoyage des données d’adresses
Vérification des listes de sanctions
voir sous Listes antiterroristes
Vérification des listes d’embargo
voir sous Listes antiterroristes