전통적인 가시성, 즉 Monitoring 1.0은 모두 정보에 관한 것입니다. 프로브, 에이전트, 로그 및 추적은 풍부한 디지털 건강 데이터를 제공합니다. 그것은 시스템, 인프라, 네트워크, 플랫폼에서 나옵니다. 이는 실시간으로 사후 처리되어 생성됩니다. 그것은 대량으로 생성되었으며, 오늘날에는 KB로 측정하지 않고 GB로 측정합니다.
솔직히 말해서, 우리는 충분한 데이터를 가지고 있습니다.
우리에게는 그 데이터의 결과물이 없습니다. 즉, 긍정적인 시정 조치로 이어지는 통찰력이 항상 있는 것은 아닙니다.
우리는 종종 이진 상태 지표만을 사용합니다. 빨간색은 나쁘죠. 녹색이 좋습니다. 문제가 있다는 것을 알고 있더라도 문제가 어디서 시작되었는지 알아낼 만큼 충분한 정보가 제공되지 않습니다. 네, 앱 A의 성능이 저하되어 사용자들이 불평하고 있습니다. 하지만 왜 그럴까? 네트워크 탓인가요? 그들의 장치? 플랫폼? 오케스트레이션 환경?
네트워크 문제라는 것을 빨리 알아낸다고 하더라도 왜 그렇게 혼잡한지에 대한 통찰력은 제공되지 않습니다. 사용자가 너무 많은가요? 오늘 세일을 하는 사람이 있나요? 계절에 따라 달라지나요? 최근 업데이트 때문인가요?
변수는 방대하고 위험도 높습니다. 사용자 경험 문제를 해결하지 못하면 수익 감소, 앱 포기, 평판 저하로 이어질 수 있습니다. 사업이 디지털화되면 사업은 디지털 상황에 따라 어려움을 겪게 됩니다.
이것이 바로 우리가 관찰 가능성을 넘어 AIOps로 나아가는 현실입니다. 관찰성(Monitoring 2.0이라고도 함)은 사용자 경험과 비즈니스 성과 간의 관계를 이해하고 안정화하기 위해 노력하는 운영자와 디지털 기업을 위한 이 기술 여정에서 중요한 진전입니다. 하지만 이것은 전투의 절반일 뿐이며 나머지 절반은 분석과 자동화와 관련이 있습니다.
관찰성은 단순히 '가시성 향상' 이상의 의미를 갖습니다. 이는 시스템 수준에서 무슨 일이 일어나고 있는지에 대한 그림을 제공하는 능력입니다. 이는 네트워크, 인프라, 앱 성과를 다채로운 차트로 표시한 대시보드가 아닙니다. 이는 사용자 경험이 현재 어떻게 수행되고 있는지에 대한 전체적인 그림을 그리기 위해 사용 가능한 모든 디지털 건강 데이터의 상관관계를 파악하려는 협력적인 노력입니다. 이는 운영 데이터 플랫폼의 원동력이며 공급업체가 모든 기업에서 "운영 데이터 플랫폼"이라는 탐내는 자리를 차지하기 위해 자리매김함에 따라 상당한 양의 시장 활동이 이루어집니다.
하지만 그것을 달성하더라도 우리는 변함없이 발생하는 문제를 해결하기 위해 노력해야 합니다. 사용자 경험을 아는 것이 절반의 전투라면, 나머지 절반은 그 이유를 알아내고 그에 따라 조치를 취하는 것입니다.
물론, 문제는 거의 모든 조직이 특별한 디지털 경험을 제공하기 위해 필요한 통찰력을 갖추고 있지 않다는 성가신 현실입니다. 기존 분석은 관계를 식별하거나 누락된 통찰력을 발견할 수 있는 데이터 패턴을 인식할 수 없는 틀에 박힌 쿼리입니다. 머신 러닝은 방대한 데이터를 처리하고 성능 저하의 근본 원인을 해결하거나 서비스에 과부하가 걸리거나 액세스가 성공하기 전에 공격을 식별하는 데 필요한 통찰력을 발견하는 수단을 제공하여 솔루션을 제공합니다.
통찰력을 갖는 것만으로는 충분하지 않습니다. 이러한 통찰력을 바탕으로 성과를 개선하거나 공격을 중단하기 위해 신속하게 조치를 취하는 능력도 중요합니다. 정책을 변경하기 위해 수동 검토 및 승인을 삽입하면 문제나 공격에 직면했을 때 조직의 민첩성이 방해를 받습니다.
원격 측정을 통해 얻은 통찰력에 시기적절하게 대응하려면 컴퓨팅에 의존해야 합니다. 공격이 시작된 후 5분 만에 대응하는 것은 너무 늦을 수 있습니다. 일반 소비자의 참을성 부족으로 볼 때, 성능이 저하된 지 2분 후에는 확실히 너무 늦습니다. 우리는 데이터 처리에 있어서 매우 효율적인 컴퓨팅을 구축했습니다. "스파이크와 시냅스 전달 측면에서 뇌는 초당 최대 약 천 개의 기본 작업을 수행할 수 있으며, 이는 컴퓨터보다 1천만 배 더 느립니다." (출처: 노틸러스 ) 수동 단계로 인해 발생하는 속도 저하를 극복하기 위해 이 기능을 활용해야 합니다. 자동화된 프로세스입니다.
데이토나 500 경주에 참가한다면 마지막 코너마다 멈추고 나머지 랩 동안 차를 밀어붙이지는 않을 겁니다. 맞나요? 완전 자율 시스템을 도입하지 않으면 디지털 경험에 이런 일이 일어나고 있습니다.
우리는 오랫동안 서비스를 자동으로 확장하는 시스템을 신뢰해 왔으며, 미래에는 이러한 시스템이 서비스와 데이터를 보호하고 소비자에게 탁월한 디지털 경험을 보장하는 시정 조치를 취할 수 있다는 것을 신뢰하는 법을 배울 것입니다. IT 의사결정권자의 절반 이상(52%)이 이 기능(대체로 AIOps라고 함)이 조직에 전략적 영향을 미칠 것이라는 데 동의했습니다.
이는 완벽하게 기능하는 디지털 경험 전투 계획입니다. 스택의 모든 계층에서 수집된 데이터에 의해 구동되는 폐쇄 루프, 자동화된 운영 방식입니다.
어려움도 있습니다. 오해하지 마십시오. 이것은 간단한 해결책이 아니며, 선반에서 꺼내어 구현할 수 있는 것도 아닙니다. 네트워크에서 인프라에 이르기까지, 보안 및 전달 기술에서 앱에 이르기까지 모든 구성 요소에서 원격 측정 데이터를 수집하는 기능인 풀스택 관찰성은 기존 모니터링 공급업체가 원하는 것만큼 간단하지 않습니다. 분산 클라우드가 표준이 되는 아키텍처에서는 에이전트와 프로브를 기반으로 하는 표준적인 접근 방식은 효율적이지도 비용 효율적이지 않습니다. Open Telemetry 도입을 통해 달성한 것과 같은 기본 원격 측정 생성 기능은 머신 러닝 기반 분석에 필요한 전체 스택 관찰성을 달성하여 원하는 비즈니스 성과와 일치하는 실행 가능한 통찰력을 빠르고 정확하게 생성하는 가장 좋은 방법이 될 것입니다.
자동화 역시 갈 길이 멀다. 오늘날 조직의 절반(52%)이 인프라를 코드로 취급하고 있다는 점을 감안할 때, 많은 기업이 아직 자동화에 "전부" 투자하지 않은 것이 분명합니다. 하지만 이러한 능력은 중요한 단계에 있습니다. 이것이 없다면 폐쇄 루프가 작동할 수도 있겠지만, 어떤 대가를 치르게 될까요? 수동 작업으로 인해 피드백 루프에 장애가 발생하면 지연이 발생하여 기업 고객, 평판 또는 귀중한 데이터가 손실될 수 있습니다.
오늘날 대부분의 조직은 디지털 전환의 두 번째와 세 번째 단계 에서 운영하고 있습니다. 필요성에 의해 동기를 부여 글로벌 팬데믹으로 인해 더 빠르게 움직이기 위해 많은 기업이 전술적 결정을 내렸고, 이제는 디지털 혁신 여정을 계속 진행하기 위해 이러한 결정을 전략적 접근 방식에 통합해야 합니다.
전략적 접근 방식은 관찰 가능성에서 통찰력, 자동화에 이르기까지 폐쇄 루프의 목표를 향해 노력하는 것입니다. 이는 우리가 적응형 앱 이라고 부르는 접근 방식의 일부로, CIO에게 엔터프라이즈 아키텍처를 현대화하기 위한 구조적 청사진을 제공하는 접근 방식으로, 이를 통해 IT는 루프를 닫고 기업이 완전한 디지털 비즈니스로 운영될 수 있도록 지원합니다.