Host 모니터링
아래는 참고 문서를 기반으로 exemONE의 Host(서버) 모니터링 기능을 정리한 내용입니다.
exemONE Host(서버) 모니터링 개요
1. 수집 항목
CPU
- CPU Usage (%) - CPU 사용률
- CPU Load - 1/5/15분 평균 Load Average
- CPU 상세정보: Vendor ID, Model Name, MHz, Cache Size, Family, Model, Stepping
- CPU Physical/Logical Count (물리/논리 코어 수)
Memory
- Memory Used / Free / Total
- Memory Used Detail: free, buffers, cached, available, inactive
- Swap 정보: Swap Name, Type, Size, Used, Priority
Disk
- Disk Usage (%), Disk I/O
- Mount Name, Device Name, Disk Type
- Read/Write Requests, Read/Write Bytes
- Queue Length, Used Space, Free Space
Network
- Network receive/send (Bytes In/Out)
- bps(in/out), BPS(in/out), PPS(in/out)
- Dropped(in/out), Error(in/out), Overrun(in/out)
Process
- PID, PPID, Process Name, Args, User Name, Start Time
- CPU(%), Virtual Memory, Real Memory
- Process Limits (Soft/Hard Limit)
추가 수집 항목
- GPU 모니터링: GPU Utilization, Memory Utilization, Temperature, Power, Fan Speed, Clock 등 (Host Agent 3.0.23 이상 필요, 참고 문서)
- TCP Port 모니터링: Port 상태(LISTENING/비정상) 수집 (참고 문서)
- Installed Package: 설치된 패키지 이름, 버전, 릴리즈, 설치일, 크기, 라이선스
2. 화면 구성
Host 모니터링 화면은 Infrastructure > Host 메뉴에서 접근하며, 다음 5개 영역으로 구성됩니다 (참고 문서):
| 영역 | 설명 |
|---|---|
| Global Time | 모니터링 재생 여부 선택 (실시간 데이터 조회) |
| Filters | Host Group, Server 기준 필터링 (AND 조건, 검색 지원) |
| Host Card | 상태별 호스트 수 표시 (Total / Active / Inactive) |
| Host Map | 헥사 맵 형태로 개별 호스트 상태 시각화 (마우스오버 시 CPU/Memory/Disk 등 표시) |
| Host List | 그리드 형태의 호스트 목록 (Host Name, IP, Alert, Status, CPU/Memory/Disk Usage, Agent, OS 정보) |

3. Host Detail Slide (상세 화면)
Host Map이나 Host List에서 호스트를 클릭하면 Host Detail Slide가 열리며, 8개 탭으로 구성됩니다 (참고 문서):
| 탭 | 주요 내용 |
|---|---|
| Information | Platform(OS, 아키텍처, Boot Time 등), CPU 상세, Memory, Network(IP/MAC), File System, User Tags |
| Metric | CPU Usage, Memory Used, Disk I/O, Network, CPU Load, Memory Used Detail 차트 (최근 5분 기본) |
| Process | 프로세스 목록 및 상세 (PID, CPU%, 메모리, Limits 등) |
| Network | 네트워크 인터페이스별 bps, BPS, PPS, Dropped, Error, Overrun 정보 |
| Disk | 디스크별 I/O, Read/Write, Queue Length 등 + Disk Detail Slide |
| Installed Package | 설치된 패키지 목록 (이름, 버전, 릴리즈, 설치일 등) |
| Relational Information | 연관 타겟 정보 (Target Name, Platform, Type, Kind, Version, Status) |
| Alert | 호스트 관련 알람 이력 (Rule Name, Alert Name, Target, Last Triggered 등) |

4. 주요 기능 요약
- 실시간 모니터링: Global Time을 통해 실시간 데이터를 조회하며, Metric 탭에서는 최근 데이터 기간 설정 가능
- 필터링 및 검색: Host Group/Server 기준 필터, 각 목록에서 이름 검색 기능 제공
- 시각적 상태 확인: Host Map(헥사 맵)으로 전체 호스트 상태를 한눈에 파악, Host Card로 Active/Inactive 수 확인
- 드릴다운: Host → Disk Detail, Network Detail, Process Detail로 계층적 상세 조회 가능
- 알람 연동: Host Detail의 Alert 탭에서 해당 호스트의 알람 이력 확인 가능
- 연관 정보 조회: Relational Information 탭으로 해당 호스트에 연결된 DB 인스턴스, WAS 등 타겟 확인
- GPU 모니터링: NVIDIA GPU 리소스(Utilization, Temperature, Memory, Power 등) 모니터링 지원
- TCP Port 모니터링: 특정 포트의 LISTENING 상태 감시 및 알람 설정 가능