본문으로 건너뛰기

Host 모니터링

아래는 참고 문서를 기반으로 exemONE의 Host(서버) 모니터링 기능을 정리한 내용입니다.


exemONE Host(서버) 모니터링 개요

1. 수집 항목

CPU

  • CPU Usage (%) - CPU 사용률
  • CPU Load - 1/5/15분 평균 Load Average
  • CPU 상세정보: Vendor ID, Model Name, MHz, Cache Size, Family, Model, Stepping
  • CPU Physical/Logical Count (물리/논리 코어 수)

Memory

  • Memory Used / Free / Total
  • Memory Used Detail: free, buffers, cached, available, inactive
  • Swap 정보: Swap Name, Type, Size, Used, Priority

Disk

  • Disk Usage (%), Disk I/O
  • Mount Name, Device Name, Disk Type
  • Read/Write Requests, Read/Write Bytes
  • Queue Length, Used Space, Free Space

Network

  • Network receive/send (Bytes In/Out)
  • bps(in/out), BPS(in/out), PPS(in/out)
  • Dropped(in/out), Error(in/out), Overrun(in/out)

Process

  • PID, PPID, Process Name, Args, User Name, Start Time
  • CPU(%), Virtual Memory, Real Memory
  • Process Limits (Soft/Hard Limit)

추가 수집 항목

  • GPU 모니터링: GPU Utilization, Memory Utilization, Temperature, Power, Fan Speed, Clock 등 (Host Agent 3.0.23 이상 필요, 참고 문서)
  • TCP Port 모니터링: Port 상태(LISTENING/비정상) 수집 (참고 문서)
  • Installed Package: 설치된 패키지 이름, 버전, 릴리즈, 설치일, 크기, 라이선스

2. 화면 구성

Host 모니터링 화면은 Infrastructure > Host 메뉴에서 접근하며, 다음 5개 영역으로 구성됩니다 (참고 문서):

영역설명
Global Time모니터링 재생 여부 선택 (실시간 데이터 조회)
FiltersHost Group, Server 기준 필터링 (AND 조건, 검색 지원)
Host Card상태별 호스트 수 표시 (Total / Active / Inactive)
Host Map헥사 맵 형태로 개별 호스트 상태 시각화 (마우스오버 시 CPU/Memory/Disk 등 표시)
Host List그리드 형태의 호스트 목록 (Host Name, IP, Alert, Status, CPU/Memory/Disk Usage, Agent, OS 정보)

Host 화면


3. Host Detail Slide (상세 화면)

Host Map이나 Host List에서 호스트를 클릭하면 Host Detail Slide가 열리며, 8개 탭으로 구성됩니다 (참고 문서):

주요 내용
InformationPlatform(OS, 아키텍처, Boot Time 등), CPU 상세, Memory, Network(IP/MAC), File System, User Tags
MetricCPU Usage, Memory Used, Disk I/O, Network, CPU Load, Memory Used Detail 차트 (최근 5분 기본)
Process프로세스 목록 및 상세 (PID, CPU%, 메모리, Limits 등)
Network네트워크 인터페이스별 bps, BPS, PPS, Dropped, Error, Overrun 정보
Disk디스크별 I/O, Read/Write, Queue Length 등 + Disk Detail Slide
Installed Package설치된 패키지 목록 (이름, 버전, 릴리즈, 설치일 등)
Relational Information연관 타겟 정보 (Target Name, Platform, Type, Kind, Version, Status)
Alert호스트 관련 알람 이력 (Rule Name, Alert Name, Target, Last Triggered 등)

Host Detail Slide


4. 주요 기능 요약

  • 실시간 모니터링: Global Time을 통해 실시간 데이터를 조회하며, Metric 탭에서는 최근 데이터 기간 설정 가능
  • 필터링 및 검색: Host Group/Server 기준 필터, 각 목록에서 이름 검색 기능 제공
  • 시각적 상태 확인: Host Map(헥사 맵)으로 전체 호스트 상태를 한눈에 파악, Host Card로 Active/Inactive 수 확인
  • 드릴다운: Host → Disk Detail, Network Detail, Process Detail로 계층적 상세 조회 가능
  • 알람 연동: Host Detail의 Alert 탭에서 해당 호스트의 알람 이력 확인 가능
  • 연관 정보 조회: Relational Information 탭으로 해당 호스트에 연결된 DB 인스턴스, WAS 등 타겟 확인
  • GPU 모니터링: NVIDIA GPU 리소스(Utilization, Temperature, Memory, Power 등) 모니터링 지원
  • TCP Port 모니터링: 특정 포트의 LISTENING 상태 감시 및 알람 설정 가능