Identifikace zákazníků

V dnešní době fúzí, integrací, konsolidací a sjednocování vzniká téměř ve všech organizacích potřeba jednozna


V dnešní době fúzí, integrací, konsolidací a sjednocování vzniká téměř ve všech
organizacích potřeba jednoznačně identifikovat klienta napříč všemi systémy.
Proč? Ruku na srdce kolik firem dokáže spolehlivě odpovědět na otázky typu:
Kolik máme zákazníků? Jaké všechny produkty klient využívá? Co klientovi ještě
nabídnout? Jakou má pro nás klient hodnotu? Jak je klient rizikový? Bez
identifikovaného klienta není snadné nalézt odpovědi.
Co se za magickým slovem identifikace vlastně skrývá? Úloha určit s vysokou
mírou spolehlivosti, které záznamy o osobách v různých primárních systémech
představují ve skutečnosti jednoho jediného klienta. Jakkoli se tato úloha může
zdát jednoduchá máme přece rodná čísla a IČ nejedná se o úplně triviální
záležitost. Problém je zejména dvojího charakteru. Zaprvé rodná čísla nejsou
jednoznačná.V České republice stále existuje několik desítek tisíc duplicitně
vydaných rodných čísel. Další komplikací je nejistá budoucnost rodného čísla,
zejména z pohledu ochrany osobních údajů. Samostatnou kapitolou zůstávají
cizinci, kteří rodná čísla nemají vůbec nad tímto problémem nemůžeme jen tak
mávnout rukou, protože se vzrůstající integrací evropských států se budeme
stále častěji setkávat s klienty z cizích zemí.
Druhou, a možná ještě větší komplikaci představuje obecně nízká kvalita
klientských dat v primárních systémech. Ta je způsobena zejména tlakem na
rychlost a úspornost pořizování dat, kdy není dostatek času (a kolikrát ani
vůle ze stran zaměstnanců) na pořízení správných a kompletních dat. V datech
tak můžeme nalézt jednak "technologické" nečistoty, způsobené zejména různou
formou uložení dat například rodná čísla zapisovaná s lomítkem, nebo bez, jméno
klienta v jednom, nebo více polích(např. i včetně akademických titulů), data
narození v různých formátech (rr-mm-dd, dd/mm/rrrr atd.), adresy zapsané v
nejrůznějším formátu nebo nečistoty způsobené systémy bez diakritiky
(Bacek,Baček,Báček). Kromě toho jsou data ovlivněna i nepřesnostmi způsobenými
lidským faktorem: například chyby z důvodu přepsání či přeslechnutí (Čehc,
oech, Nov8k, 32. 2. 2005...).
Sami už si dokážete představit, že provést identifikaci klienta kvalitně není
snadné. Při volbě triviálního algoritmu, který by porovnával shodná rodná čísla
nebo IČ, můžete narazit na duplicity nebo naopak chybné (či neexistující)
údaje, a tak se k rozumnému (a hlavně spolehlivému) výsledku nedopracujete.
Proto je vhodné volit komplexnější řešení, které nejenže v závěrečné fázi
dokáže vyhledávat shodné (nebo alespoň podobné) záznamy, ale zejména poskytne
sadu nástrojů pro zvýšení datové kvality a tedy přeneseně zvýšení spolehlivosti
identifikace klienta.
Na trhu v dnešní době existuje pouze hrstka nástrojů, které obstojí při tak
náročném úkolu, jako je čištění zákaznických dat a identifikace klienta.Jedná
se například o nástroje firem Adastra, Ascential, FirstLogicnebo Trillium.
Specifika českého nebo slovenského prostředí ale respektuje jen část z nich.









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.