우리 모두가 알고 있는 오래된 비즈니스 격언이 있습니다. 그 내용은 다음과 같습니다. 고객은 항상 옳습니다.
이 디지털 경제에서 공리는 다음과 같이 바뀌어야 합니다. 고객 데이터는 항상 정확합니다.
작은 이야기를 하나 들어보겠습니다.
저는 최근 새 차를 사고, 기존 차를 팔기로 했습니다. 저는 오래된 차를 6년 정도 탔고, 1년에 3천 마일 정도 운전했습니다. 말도 안 되는 소리처럼 들리겠지만 사실이에요. 한 번은 오하이오까지 운전해서 가족을 만난 적이 있습니다. 그게 다예요. 그렇지 않으면 집에서 반경 30마일 이내에 머물렀습니다. 저는 일요일에만 차를 몰고 교회에 가는 늙은 여자라고 농담하는 걸 좋아합니다.
그래서 자동차 딜러가 차량 내역 보고서에 보관된 단 한 줄의 데이터만을 기준으로 내 주행거리계 수치가 3만 마일 이상 틀렸다고 말했을 때 나는 정말 놀랐다. 또한 내 차가 2년 전에 노스다코타에서 정비를 받았다는 내용의 데이터도 있었습니다.
이런 불일치는 가볍게 여겨서는 안 됩니다. 주행거리계 판독값은 거래 가치를 알려주며, 이를 조작하는 것은 불법입니다(벌금 및 징역형이 가능). 실제 주행거리계가 보고서에 나와 있는 것보다 훨씬 낮은 숫자를 읽었다는 점을 고려하면, 딜러가 약간 불안해했을 거라고 상상할 수 있겠죠. 그는 나를 믿어야 할지, 아니면 내가 차를 노스다코타로 가져간 적이 없다고 주장한 나를 믿어야 할지, 아니면 내가 가져갔다고 주장하는 데이터를 믿어야 할지 바람직하지 않은 결정에 직면했습니다.
질문은 곧 "고객이 항상 옳은가?" 또는 "고객 데이터가 항상 옳은가?"로 귀결되었습니다.
차량 내역 보고서의 부정확한 데이터로 인해 누군가가 피해를 본 것은 이번이 처음이 아닌 것으로 밝혀졌습니다. 대부분의 데이터는 여전히 수동으로 입력되므로 실수가 발생합니다. 하지만 오류를 수정하려면 오류를 입력한 사람이 실수를 인정해야 합니다. 즉, 그들은 5년, 10년, 심지어 15년 전에도 실수를 저질렀다는 사실을 기억해야 한다는 뜻입니다. 데이터를 입력한 기술자가 실수를 인정할 수 있다면.
결국, 저는 새 차를 가지고 떠났고 딜러가 보고서를 정정하는 일을 맡았습니다. 여러분 중 많은 분들이 비슷한 이야기를 가지고 있을 거라고 확신합니다. 디지털 경제에서 운영하다 보면 이런 일이 너무 흔하게 일어납니다.
문제 해결, 데이터 마이닝, 의사 결정을 위해 기계에 대한 의존도가 계속 확대됨에 따라, 우리가 보유한 데이터가 정확하지 않을 수 있다는 사실을 알아야 합니다. 해당 데이터의 보관 과정 중 어느 시점에 인간이 개입되었습니다. 그리고 인간이라는 존재의 자명한 진실은 우리는 실수를 한다는 것입니다. 6년 전 노스다코타의 한 서비스 기술자가 키보드를 한 번 잘못 눌렀을 때 갑자기 뜨거운 불빛 아래서 지금까지 했던 모든 자동차 여행에 대해 심문을 받게 되었습니다.
우리는 의사결정에 사용하는 데이터에 얼마나 신뢰를 두어야 하는지 신중해야 합니다. 우리가 걱정해야 할 것은 우연한 실수뿐만 아니라 의도적인 실수도 있습니다. 귀하의 데이터는 더럽다는 걸 보장합니다.
DNS의 설계는 권위 있는 소스와 권위 없는 소스를 지정하는 데 있어 매우 놀랍습니다. 왜냐하면 불일치가 있다면 유일하고 참된 근원에 가서 진실을 찾을 수 있다는 것을 알기 때문입니다. 고객 데이터에는 그런 것이 없습니다. 이는 잠재적인 위험 신호입니다. 현재 우리가 사용하고 있는 시스템(그리고 가까운 미래에 사용하게 될 시스템)은 반드시 무엇이 정확하고 무엇이 정확하지 않은지 알 수 없기 때문입니다. 결국 그 진실성을 확인할 곳이 없으니까요. 인증 기관도 없고 DNS와 같은 지정된 권위 있는 소스도 없습니다. 그리고 많은 경우, 데이터에 이의를 제기할 방법이 없습니다.
우리는 끊임없이 데이터의 조각들을 모아 고객의 디지털 이미지를 구축하고 있기 때문에, 그 데이터가 우리에게, 즉 사업 의사결정권자에게도, 그리고 그 데이터에 근거해 내린 결론의 결과를 감수해야 하는 인간인 고객에게도 얼마나 큰 영향을 미칠 수 있는지 인식해야 합니다.
애플리케이션 보안 솔루션 제공업체로서 당사는 데이터와 신원을 유출이나 도난으로부터 보호하는 데 주력하고 있습니다. 하지만 우리는 종종 방정식을 뒤집어서 실수로든 악의적으로든 데이터가 손상될 수 있는 매우 현실적인 가능성에 대해 이야기하지 않습니다.
우리는 – 트위터에서 트렌드 주제가 되기 전에.
우리는 사람들을 향한 보복적인 디지털 공격이 다양한 형태로 증가하는 것을 보았습니다. 911 교환원이 휴대폰에서 정확한 위치와 주소를 얻을 수 없기 때문에 피해자들은 치명적인 스와팅 사건을 겪기도 했습니다. 복수 포르노가 만연해 있고 소셜 미디어에서 친구와 가족을 사칭하는 일이 늘 일어나고 있습니다. Kustodian의 CEO인 크리스 록이 DEF CON(CS Monitor)에서 대부분 국가의 사망 등록 절차의 취약점을 이용해 사기꾼들이 이익이나 장난을 위해 사람을 인위적으로 '죽일' 수 있는 방법을 보여준 지 3년이 넘었습니다. 주의 깊게 살펴보는 사람들을 위해 말씀드리자면, 이는 1995년 영화 '해커스'에서 사용된 해킹 중 하나였습니다. 누군가의 신용카드를 취소하고, 누군가의 모욕에 대한 보복으로 거짓 개인 광고를 제출하는 것과 같은 해킹입니다.
그런 보복적인 행동이 다른 곳의 데이터를 더럽히는 일로 확산되는 건 시간문제일 뿐입니다.
제가 머리에 주석 모자를 쓰고 있다고 생각한다면, 2017년 RedLock CSI 보고서를 기억해 보세요. 그 보고서는 데이터베이스의 31%가 인터넷으로 연결된 포트를 가지고 있다고 밝혔습니다. 누구에게나. 27,000개가 넘는 데이터베이스가 대중에게 공개되었던 MongoDB 사건을 기억하시나요? 잘못된 사람이 올바른 데이터베이스를 열어 두면 데이터가 망가질 수 있습니다.
이는 데이터가 종종 진실의 절대적이고 틀림없는 버전으로 취급되는 전환점에 도달했기 때문에 문제가 됩니다. 데이터 입력 오류로 인해 그 '진실'로 인해 감옥에 갇힐 수도 있었습니다.
우리의 사업과 삶의 많은 부분이 디지털 영역에 저장되는 것을 계속 확대해 나가면서, 우리는 심호흡을 하고 데이터 웨어하우스에 있는 비트와 바이트가 실제 인간의 어떤 측면을 나타낸다는 것을 기억해야 합니다. 우리가 데이터를 처리하는 근면성은 고객이라는 실제 인간에 대한 우리의 태도를 반영합니다. 특히 오늘 입력하는 데이터 조각 중 어떤 것이 나중에 고객에게 해를 끼칠 수 있는 방식으로 해석될지 알 수 없는 경우에 더욱 그렇습니다. 결국, 내 차량 내역 기록에 입력한 내용은 단순히 노스다코타에서 오일 교환을 등록하기 위한 것이었습니다. 악의는 없었지만 그 결과는 나에게 치명적일 수도 있었습니다.
데이터 손상을 방지하기 위한 보안 정책 수립, 앱 및 데이터베이스 액세스 제어, 수동 데이터 입력에 대한 보다 큰 관심 등, 데이터는 거짓말을 하지 않는다는 점, 즉 사용자가 입력한 내용을 정확히 나타낸다는 점, 그리고 데이터를 입력한 사람이 가지고 있을 수 있는 내용을 나타낸다는 점을 기억해야 합니다.