블로그 | CTO 사무실

AI와 OODA 루프: 운영 재구상

로리 맥비티 썸네일
로리 맥비티
2024년 5월 27일 게시

2025년 애플리케이션 전략 보고서의 결과에 따르면, 생성적 AI와 기존 AI의 도입으로 인해 운영이 필연적으로 OODA 루프 기반 모델로 전환될 것으로 나타났습니다.

작년에 제가 생성적 AI가 운영 자동화를 재정의하고 있다고 언급한 것을 기억하실 겁니다. 아마도 그렇지 않을 수도 있고, 아니면 다시 한번 상기시켜 보아야 할 수도 있습니다. 어느 쪽이든, 간단히 요약해 보겠습니다.

"과거에는 디지털 성숙도가 가장 높은 조직은 명확하게 정의된 비즈니스 및 운영 목표에 따라 스크립트를 실행하고 구성을 변경하고 정책을 조정하기 위해 자동화를 사용했습니다. 생성적 AI의 도입으로 그런 것은 거의 시대에 뒤떨어진 것이 되었고, 새로운 목표는 더욱 자율적인 시스템입니다."

이는 작년의 연례 조사를 바탕으로 한 것입니다. 그리고 뭐라고 생각하시나요? 올해의 연구는 그 결론을 더욱 강화할 뿐입니다. 자율성은 더 이상 자동화의 새로운 전선이 아닙니다. 운영팀이 지금 당장 요구하는 바이기도 합니다.

우리는 연례 설문 조사에서 응답자들에게 생성 AI가 도움을 주기를 바라는 모든 운영 작업을 선택하도록 요청했으며, 상위 3개는 생성과 실행의 조합이었습니다.

  1. 57%: 새로운 구성 및 정책을 배포하거나 기존 구성 및 정책을 조정하기 위한 스크립트 생성
  2. 56%: 정책, 사용자 정의 기능 및 구성 생성
  3. 55%: 새로운 구성 및 정책을 배포하거나 기존 구성 및 정책을 조정하기 위한 스크립트를 실행합니다.

그런데 우리는 응답자들이 생성적 AI가 자동으로 실행되는 데 편안함을 느낄 만한 운영 기능이 무엇인지 알아보기 위해 별도의 질문도 했습니다. 응답자의 99%가 적어도 하나 이상의 기능을 선택했다는 사실에 약간 놀랐습니다.

자율적인 운영은 불가피합니다.

이게 OODA 루프와 무슨 상관이 있나요? 음, 커피 한 잔 하세요. 이제 설명드리겠습니다.

OODA 루프란 무엇인가요?

IT 운영에서 OODA 루프(관찰, 방향 설정, 결정, 실행)는 신속한 의사 결정과 적응을 위한 지속적이고 반복적인 프레임워크입니다. 이를 통해 팀은 사전에 문제를 감지하고, 실시간으로 문제의 영향을 평가하고, 정보에 입각한 결정을 내리고, 신속하게 시정 조치를 취할 수 있어 운영상의 혼란을 방지하고 회복력을 향상시킬 수 있습니다.

  • 관찰하다: 실시간으로 로그, 원격 측정 및 시스템 상태를 모니터링합니다.
  • 동양: 이상 현상을 분석하고, 경고를 연관시키고, 맥락에 따른 영향을 평가합니다.
  • 결정하다: 대응의 우선순위를 정하세요. 자동화, 확대 또는 완화를 선택하세요.
  • 행동: 수정 사항을 구현하고, 변경 사항을 롤백하거나 패치를 배포합니다.

빠르고 반복적인 사이클은 더 빠른 MTTR, 더 적은 중단, 더 스마트한 자동화를 의미합니다. 이는 단순히 민첩한 것이 아니라, 끊임없이 적응하는 연속적인 루프입니다. 그리고 IT 운영에 적용되면 모든 것이 달라집니다.

오늘날의 IT 운영

솔직히 말해서 오늘날 우리는 OODA 루프를 제대로 활용하지 못하고 있습니다. SRE는 개념과 밀접하게 연관되어 있지만 대부분의 IT 운영은 여전히 폭포수형 또는 애자일형으로 유지됩니다. 상태. 애자일은 우리를 보다 연속적인 운영 모드로 이끌었지만, 실시간 변화나 빠른 반복을 적절히 처리하지는 못합니다.

다음 표는 높은 수준의 차이점을 강조합니다.

  폭포 기민한 우다
결정 속도

느린

보통의

빠른

유연성

엄격한

적응형

매우 유연함

피드백 루프

지연됨(사이클 종료)

마디 없는

연속적이고 실시간

위험 처리

높음(후기 실패)

중간(빈번한 반복)

낮음(빠른 수정)

프로세스 흐름

선형, 순차

반복적, 증분적

루프 기반의 빠른 반복

변화 대응

변화에 저항하다

변화를 수용하다

공격 변경

주요 목표

예측 가능성 및 구조

빠르게 가치를 전달하세요

앞지르고 기동력을 발휘하다

대부분의 조직은 여전히 워터-스크럼-폴 모드에 머물러 있습니다. 즉, 일부 단계는 민첩하지만 전체 프로세스는 여전히 워터폴 방식입니다. 이러한 혼합형 접근 방식은 모든 것을 느리게 만들고 비효율성을 발생시키는데, 이러한 비효율성은 보다 적응적이고 OODA 기반 모델을 통해 제거할 수 있습니다.

데이터가 모든 것을 말해줍니다

우리의 연례 조사는 OODA 루프로의 전환을 강력히 뒷받침합니다. 조직이 직면하는 과제는 이 접근 방식의 이점과 완벽하게 일치합니다.

  • 관찰 – 높은 구성 오버헤드:
    응답자들은 여러 API와 언어로 인해 구성 관리에 시간의 40~50%를 소비한다고 보고했습니다. AI가 지원하는 OODA 기반 접근 방식은 중복되거나 충돌하는 시스템을 실시간으로 감지하여 이러한 부담을 줄일 수 있습니다.
  • Orient – 데이터 통합 및 표준화:
    데이터 레이크와 OpenTelemetry를 향한 움직임은 "Orient" 단계를 개선하기 위한 중요한 단계입니다. 고품질의 표준화된 데이터는 사건을 맥락화하고 상관관계를 파악하는 능력을 향상시켜 더 빠르고 정확한 의사 결정을 내릴 수 있도록 해줍니다.
  • 결정 – 기능 간 효율성:
    많은 응답자는 SLO/SLI 보고와 근본 원인 분석이 사일로화된 프로세스로 인해 어려움을 겪는 분야라고 강조했습니다. AI 기반 OODA 루프는 이러한 사일로를 허물고 팀 간 협업과 의사 결정을 개선할 것입니다.
  • 행동 - 느리고 반응적인 프로세스:
    현재의 순차적 방법은 문제가 확대될 때까지 조치를 미룹니다. "조치" 단계에서 실시간 분석과 AI를 도입함으로써 팀은 즉시 수정 사항을 배포하여 가동 중지 시간을 줄이고 주요 사고를 방지할 수 있습니다.

결론

데이터는 이를 명확하게 보여줍니다. OODA 루프 기반 운영이 미래입니다.

조직에서는 데이터를 통합하고, AI를 도입하고, 더 큰 자동화를 위해 노력하고 있습니다. OODA와 같은 적응적이고 반복적인 모델로 전환하면 비효율성이 없어지고, 간접비가 줄어들고, 대응성이 향상됩니다.

해당 도구는 이미 존재합니다. 유일한 질문은 다음과 같습니다. 귀하의 조직은 언제 이전할 준비가 되셨나요?