소개
최근 몇 년 동안 중국 산업에서 클라우드 서비스의 비중이 증가하고 있습니다. 기술 기업들은 새로운 기술 혁명의 기회를 포착하여 적극적으로 디지털 전환을 추진하고 클라우드 컴퓨팅, 빅데이터, 인공지능, 블록체인, 사물 인터넷 등 신기술 연구 및 적용을 확대하며 과학기술 서비스 역량을 향상시키고 있습니다. 클라우드 및 가상화 기술의 지속적인 발전으로 데이터 센터 내 애플리케이션 시스템이 기존 물리적 캠퍼스에서 클라우드 플랫폼으로 이전하는 사례가 점점 더 많아지고 있으며, 데이터 센터 클라우드 환경의 동서 트래픽도 크게 증가하고 있습니다. 그러나 기존의 물리적 트래픽 수집 네트워크는 클라우드 환경의 동서 트래픽을 직접 수집할 수 없어 클라우드 환경의 비즈니스 트래픽이 최우선 과제가 되었습니다. 클라우드 환경에서 동서 트래픽 데이터 추출을 실현하는 것은 필연적인 추세가 되었습니다. 클라우드 환경에 새로운 동서 트래픽 수집 기술을 도입함으로써 클라우드 환경에 구축된 애플리케이션 시스템에 완벽한 모니터링 지원이 제공되고, 문제 및 장애 발생 시 패킷 캡처 분석을 통해 문제를 분석하고 데이터 흐름을 추적할 수 있습니다.
1. 클라우드 환경의 동서 트래픽을 직접 수집할 수 없으므로 클라우드 환경의 응용 시스템은 실시간 비즈니스 데이터 흐름에 기반한 모니터링 탐지를 배포할 수 없으며 운영 및 유지 관리 인력은 클라우드 환경에서 응용 시스템의 실제 운영을 적시에 발견할 수 없습니다. 이는 클라우드 환경에서 응용 시스템의 건전하고 안정적인 운영에 숨겨진 이점을 제공합니다.
2. 클라우드 환경에서 동서 트래픽을 직접 수집할 수 없기 때문에 클라우드 환경의 비즈니스 애플리케이션에 문제가 발생했을 때 분석을 위해 데이터 패킷을 직접 추출하는 것이 불가능하며, 이로 인해 오류 위치를 찾는 데 어려움이 있습니다.
3. 네트워크 보안 요구 사항이 점점 더 엄격해지고 BPC 애플리케이션 트랜잭션 모니터링, IDS 침입 탐지 시스템, 이메일 및 고객 서비스 기록 감사 시스템 등 다양한 감사가 시행됨에 따라 클라우드 환경에서 동서 트래픽 수집에 대한 수요 또한 점점 더 시급해지고 있습니다. 위 분석을 바탕으로 클라우드 환경에서 동서 트래픽 데이터 추출을 실현하고, 클라우드 환경에 새로운 동서 트래픽 수집 기술을 도입하여 클라우드 환경에 구축된 애플리케이션 시스템에 완벽한 모니터링 지원을 제공하는 것은 필연적인 추세입니다. 문제 및 장애 발생 시 패킷 캡처 분석을 통해 문제를 분석하고 데이터 흐름을 추적할 수 있습니다. 클라우드 환경에서 동서 트래픽 추출 및 분석을 실현하는 것은 클라우드 환경에 구축된 애플리케이션 시스템의 안정적인 운영을 보장하는 강력한 마법의 무기입니다.
가상 네트워크 트래픽 캡처를 위한 주요 지표
1. 네트워크 트래픽 캡처 성능
동서 트래픽은 데이터 센터 트래픽의 절반 이상을 차지하며, 이를 완벽하게 수집하려면 고성능 수집 기술이 필요합니다. 수집과 동시에 다양한 서비스에 대한 중복 제거, 잘라내기, 민감도 감소와 같은 다른 전처리 작업도 수행해야 하므로 성능 요구 사항이 더욱 높아집니다.
2. 리소스 오버헤드
대부분의 동서 트래픽 수집 기술은 서비스에 적용될 수 있는 컴퓨팅, 저장 및 네트워크 리소스를 점유해야 합니다. 이러한 리소스를 최대한 적게 소모하는 것 외에도, 수집 기술 관리 구현에 따른 오버헤드를 고려해야 합니다. 특히 노드 규모가 확장될 경우 관리 비용 또한 선형적으로 증가할 수 있습니다.
3. 침입 수준
현재 널리 사용되는 인수 기술은 하이퍼바이저 또는 관련 구성 요소에 추가적인 인수 정책 구성을 추가해야 하는 경우가 많습니다. 이러한 정책은 비즈니스 정책과의 잠재적 충돌 외에도 하이퍼바이저 또는 기타 비즈니스 구성 요소의 부담을 가중시키고 서비스 SLA에 영향을 미치는 경우가 많습니다.
위 설명을 통해 클라우드 환경에서의 트래픽 수집은 가상 머신 간 동서 트래픽과 성능 문제에 집중해야 함을 알 수 있습니다. 동시에, 클라우드 플랫폼의 동적 특성을 고려할 때, 클라우드 환경에서의 트래픽 수집은 기존 스위치 미러링 방식을 벗어나 유연하고 자동화된 수집 및 모니터링 배포를 실현하여 클라우드 네트워크의 자동화된 운영 및 유지 관리 목표에 부합해야 합니다. 클라우드 환경에서의 트래픽 수집은 다음과 같은 목표를 달성해야 합니다.
1) 가상머신 간 동서 트래픽 캡처 기능 구현
2) 캡처링은 컴퓨팅 노드에 배포되며 분산 수집 아키텍처는 스위치 미러로 인해 발생하는 성능 및 안정성 문제를 방지하기 위해 사용됩니다.
3) 클라우드 환경에서 가상 머신 리소스의 변화를 동적으로 감지하고, 가상 머신 리소스의 변화에 따라 수집 전략을 자동으로 조정할 수 있습니다.
4) 캡처 도구는 서버에 미치는 영향을 최소화하기 위해 과부하 보호 메커니즘을 갖춰야 합니다.
5) 캡처링 툴 자체에 트래픽 최적화 기능이 있습니다.
6) 캡처링 플랫폼은 수집된 가상 머신 트래픽을 모니터링할 수 있습니다.
클라우드 환경에서 가상 머신 트래픽 캡처 모드 선택
클라우드 환경에서 가상 머신 트래픽을 캡처하려면 수집 프로브를 컴퓨팅 노드에 배포해야 합니다. 컴퓨팅 노드에 배포할 수 있는 수집 지점의 위치에 따라 클라우드 환경에서 가상 머신 트래픽 캡처 모드는 세 가지 모드로 구분할 수 있습니다.에이전트 모드, 가상 머신 모드그리고호스트 모드.
가상 머신 모드: 클라우드 환경의 각 물리적 호스트에 통합 캡처링 가상 머신이 설치되고, 캡처링 소프트 프로브가 캡처링 가상 머신에 배포됩니다. 호스트의 트래픽은 가상 스위치의 가상 네트워크 카드 트래픽을 미러링하여 캡처링 가상 머신으로 미러링됩니다. 이후 캡처링 가상 머신은 전용 네트워크 카드를 통해 기존 물리적 트래픽 캡처 플랫폼으로 전송됩니다. 이후 각 모니터링 및 분석 플랫폼으로 분산됩니다. 이 방식의 장점은 기존 비즈니스 네트워크 카드와 가상 머신에 대한 간섭 없이 소프트 스위치 바이패스 미러링을 통해 가상 머신의 변경 사항을 감지하고 특정 수단을 통해 정책의 자동 마이그레이션을 구현할 수 있다는 것입니다. 단점은 트래픽을 수동적으로 수신하는 가상 머신을 캡처링하는 방식으로는 과부하 보호 메커니즘을 구현할 수 없으며, 미러링 가능한 트래픽 크기는 가상 스위치의 성능에 따라 결정되어 가상 스위치의 안정성에 어느 정도 영향을 미친다는 것입니다. KVM 환경에서 클라우드 플랫폼은 이미지 흐름 테이블을 일관되게 발행해야 하므로 관리 및 유지 보수가 복잡합니다. 특히 호스트 머신에 장애가 발생하면 캡처링하는 가상 머신은 비즈니스 가상 머신과 동일하며 다른 가상 머신이 있는 다른 호스트로 마이그레이션됩니다.
에이전트 모드: 클라우드 환경에서 트래픽을 캡처해야 하는 각 가상 머신에 캡처링 소프트 프로브(Agent Agent)를 설치하고, Agent Agent 소프트웨어를 통해 클라우드 환경의 동서 트래픽을 추출하여 각 분석 플랫폼에 배포합니다. 장점은 가상화 플랫폼과 독립적이며, 가상 스위치 성능에 영향을 미치지 않고, 가상 머신과 함께 마이그레이션할 수 있으며, 트래픽 필터링을 수행할 수 있다는 것입니다. 단점은 관리해야 할 에이전트가 너무 많고, 장애 발생 시 Agent 자체의 영향을 배제할 수 없다는 것입니다. 기존 운영 네트워크 카드를 공유하여 트래픽을 분산해야 하므로 비즈니스 상호 작용에 영향을 미칠 수 있습니다.
호스트 모드: 클라우드 환경의 각 물리적 호스트에 독립적인 수집 소프트 프로브를 배포하여 호스트에서 프로세스 모드로 작동하고, 캡처된 트래픽을 기존 물리적 트래픽 캡처 플랫폼으로 전송합니다. 이 솔루션의 장점은 완전한 우회 메커니즘, 가상 머신, 비즈니스 네트워크 카드 및 가상 머신 스위치에 대한 침입 방지, 간단한 캡처 방식, 편리한 관리, 독립적인 가상 머신 유지 관리 불필요, 가볍고 소프트 프로브 수집을 통해 과부하 방지를 달성할 수 있다는 것입니다. 호스트 프로세스로서, 미러링 전략의 배포를 안내하기 위해 호스트 및 가상 머신 리소스와 성능을 모니터링할 수 있습니다. 단점은 일정량의 호스트 리소스를 소모해야 하며, 성능에 미치는 영향에 주의해야 한다는 것입니다. 또한, 일부 가상 플랫폼은 호스트에서 캡처 소프트웨어 프로브 배포를 지원하지 않을 수 있습니다.
업계의 현재 상황을 보면, 가상 머신 모드는 퍼블릭 클라우드에 적용되고, 에이전트 모드와 호스트 모드는 프라이빗 클라우드에 일부 사용자를 두고 있습니다.
게시 시간: 2024년 11월 6일