저는 봇 트래픽을 연구하는 전 CIA 사이버 작전 요원입니다. Twitter 계정의 80% 이상이 실제로 가짜일 가능성이 있는 이유는 다음과 같습니다. Twitter만 그런 것은 아닙니다.

댄 우즈

2022년 7월 14일 게시

이 시점에서 여러분은 아마도 인수를 추진하지 않았던 회사인 Twitter와 회사 인수 제안을 철회한 Elon Musk 간의 난항과 새로운 법적 분쟁에 대해 들었을 것입니다.

이 갈등의 중심에는 봇 트래픽이라는 주제가 있는데, 저는 이에 대해 상당히 잘 알고 있습니다. 지난 6년 동안 제 업무는 웹 상호작용을 분석하여 봇, 봇이 타겟으로 삼는 애플리케이션, 그리고 목표를 파악하는 데이터 과학자 팀을 이끄는 것이었습니다.

평균적으로 매일 약 20억 건의 거래가 F5의 봇 방어 인프라를 통해 흐르고 있으며, 우리는 사실상 모든 산업 분야의 수백 개 회사에 봇 트래픽에 대한 브리핑을 실시했습니다.

이러한 경험에 따르면 Twitter의 봇 트래픽은 그들이 공개적으로 표현한 것보다 훨씬 더 많을 가능성이 높으며 내부적으로 믿는 것보다 더 많을 수도 있습니다. 공평하게 말하면 후자는 악의적이거나 원치 않는 봇의 표적이 되지만 이를 제거하기 위해 최고의 기술을 사용하지 않는 모든 조직에 해당할 가능성이 높습니다.

지난 몇 년 동안 봇에 대해 우리가 알게 된 내용과 왜 그런 결론에 도달하기가 그렇게 쉬웠는지에 대해 알아보겠습니다.

봇은 항상 무언가를 성취하려고 시도합니다.

고객이 온라인 계정에 로그인할 수 있도록 하는 조직에서는 로그인 애플리케이션에 대한 자동화를 통해 어떤 유형의 사기를 시도하게 될 것입니다. 온라인에서 특별 가격을 제시하는 조직에서는 자동화를 사용하여 가격, 운임 및 재판매 가격을 수집합니다. 이런 예는 수십 가지가 있습니다.

트위터의 경우 주요 인센티브는 팔로워를 늘리는 것입니다. 팔로워가 많을수록 트윗이 더 흥미로울 것이라는 인식이 있고, 실제로 팔로워가 많은 계정일수록 영향력이 더 큰 경향이 있습니다.

영향력을 확대하려는 목적이 이 모델이 문제가 될 수 있는 부분입니다. 수백만 개의 트위터 계정과 공인 및 일반인의 실제 계정 간의 상호작용을 자동화한다면 얼마나 큰 영향을 미칠 수 있을지 상상해 보세요. 이는 사실상 무한한 자원을 보유한 매우 적극적인 국가 행위자들의 관심을 끌 가능성이 높습니다.

인센티브와 수단이 있다면 봇이 더 많아질 겁니다.

트위터에는 큰 인센티브가 있을 뿐만 아니라, 수단도 있습니다. 인터넷에는 트위터 계정, 팔로워, 좋아요, 리트윗 등을 유료로 제공하는 수많은 서비스(다크웹/딥웹 마켓플레이스 포함)가 있습니다.

연구 목적으로, 제가 만든 트위터 계정에서 이러한 서비스를 시도해 보았습니다. 1,000달러도 안 되는 비용으로 테스트를 계속한 결과, 현재 이 계정의 팔로워 수는 약 10만 명에 달합니다. 저는 한번은 완전히 말도 안 되는 글을 트윗한 뒤 팔로워들에게 돈을 주고 리트윗해 달라고 부탁한 적이 있습니다. 그렇습니다. 이러한 계정은 TY19038461038과 같은 이름을 가지고 있으며, 다른 많은 계정도 팔로우합니다.

저는 자동화를 사용해 Twitter 계정을 만드는 게 얼마나 쉬울지 궁금해지기 시작했습니다. 저는 프로그래머는 아니지만 YouTube와 Stack Overflow에서 자동화 프레임워크에 관해 조사했습니다. 사실, 쉬운 일이었습니다.

테스트를 한 단계 더 발전시키기 위해, 주말에 트위터 계정을 자동으로 생성하는 스크립트를 썼습니다. 내 그다지 정교하지 않은 대본은 어떤 대책에도 막히지 않았습니다. 저는 IP 주소나 사용자 에이전트를 변경하려고 하지 않았고, 제 활동을 숨기기 위한 어떤 조치도 취하지 않았습니다.

기술이 부족한 사람에게도 그렇게 쉬운 일이라면, 기술이 뛰어나고 의욕적인 개인들로 구성된 조직이라면 얼마나 쉬울지 상상해보세요.

기업들은 종종 봇 문제의 규모를 과소평가합니다.

몇 년 전, 미국의 한 소셜 네트워킹 사이트가 F5의 봇 방어 시스템을 구축한 결과, 로그인 트래픽의 99%가 자동화된 것을 발견했습니다. 네, 맞게 읽으셨습니다. 99% 그렇습니다.

실제로 많은 애플리케이션에서 트래픽의 80~99%가 자동화되어 있습니다. 이러한 결과는 특정 사례가 아닙니다. 이는 많은 조직(소매업체, 금융 기관, 통신사, 패스트푸드 레스토랑 등)에서 공통적으로 발견됩니다.

물론, 이는 회사에 있어서 파괴적인 소식이었다. 그들은 봇 문제가 있다는 사실은 알고 있었지만 그렇게 심각할 줄은 상상도 못했습니다. 그 의미는 금세 알아차렸습니다. 해당 고객 계정 중 실제 인간 고객은 극히 일부에 불과했습니다. 나머지는 봇이었습니다.

소셜 네트워킹 기업의 경우, 모든 계정의 하위 집합인 일일 활성 사용자(DAU) 수가 가치 평가에서 큰 역할을 합니다. DAU가 생각했던 것보다 극히 일부에 불과하다는 사실을 공개하자 기업의 가치가 크게 하락했습니다.

봇으로부터 이익을 얻는 기업들이 항상 알고 싶어하는 것은 아닙니다.

누군가는 해당 조직이 진실을 전혀 알지 못하고 대신 단순히 봇 문제가 5% 미만이라고 주장했더라면 해당 회사의 주주들에게 더 나았을 것이라고 주장할 수도 있습니다.

이러한 압력은 DAU 수에 따라 가치가 결정되는 소셜 네트워크 사이트에만 적용되는 것이 아닙니다. 콘서트 티켓, 운동화, 디자이너 지갑, 차세대 iPhone 등 수요가 많지만 재고가 한정된 제품을 판매하는 기업에도 해당됩니다.

이런 제품이 몇 분 만에 봇에 의해 매진되고, 2차 시장에서 엄청나게 부풀려진 가격으로 재판매되는 것을 보면 고객은 짜증이 납니다. 하지만 이 기업은 여전히 전체 재고를 빠르게 매진합니다.

이런 경우, 회사는 봇을 막기 위해 최선을 다하는 것처럼 보이려고 하지만, 실제로는 비공개적으로는 거의 아무것도 하지 않을 수 있습니다 .

트위터만의 문제가 아닙니다. 봇 문제는 모든 사람의 문제입니다.

오늘날 우리가 보고 있는 자동화의 양과 속도, 주어진 인센티브 세트가 끌어들일 가능성이 있는 봇의 정교함, 그리고 내 연구에서 본 대응책의 상대적 부족을 고려할 때, 나는 단 하나의 결론에 도달할 수 있습니다. 사실상 트위터 계정의 80% 이상은 봇일 가능성이 높습니다. 물론, 이것은 제 의견입니다.

저는 Twitter가 모든 회사와 마찬가지로 자사 플랫폼에서 원치 않는 자동화를 방지하려고 노력하고 있다고 확신합니다. 하지만 그들은 매우 동기를 부여받은 행위자들이 행하는 매우 정교한 자동화를 다루고 있을 가능성이 높습니다. 이런 상황에서는 봇 해결은 DIY 프로젝트가 아닙니다. 마찬가지로 정교한 도구가 필요합니다.

하지만 여기에는 훨씬 더 중요한 것이 걸려 있습니다. 봇 문제는 광고 수익이나 주가, 회사 가치 평가보다 더 큽니다. 이런 문제가 지속되면 디지털 세계의 전체 기반이 위협받게 됩니다.

봇이 어디에서나 확산되도록 허용하면 수십억 달러의 비용이 드는 대규모 사기가 발생합니다. 그것은 사람들의 삶을 파괴하고 국가와 사악한 조직이 잘못된 정보를 퍼뜨리고 갈등을 일으키고 심지어 정치 과정에 영향을 미칠 수 있는 도구를 제공합니다. 이는 전 세계적으로 우리가 서로 소통하고 관계를 맺는 능력에 영향을 미치는 사기, 잘못된 정보, 갈등이 증가한다는 것을 의미합니다.

사회 전체가 인터넷과 모바일로 연결된 세상의 편의성, 지식, 오락 및 기타 혜택을 모두 누리고 싶다면, 온라인 자동화 트래픽에 대해 뭔가 해야 합니다. 봇에 맞서 싸울 수 있는 유일한 방법은 우리가 스스로 고도로 정교하게 자동화하는 것입니다.

F5의 글로벌 인텔리전스 책임자인 Dan Woods가 작성