본문으로 건너뛰기

Kubernetes Container 모니터링

이제 모든 참고 문서의 내용을 확인했습니다. 상세한 답변을 드리겠습니다.


exemONE Kubernetes Container 모니터링 상세 가이드

exemONE의 Kubernetes > Container 메뉴에서 Kubernetes 환경의 컨테이너를 종합적으로 모니터링할 수 있습니다. 화면은 Filters, Container List로 구성되며, 각 컨테이너를 클릭하면 Container Detail Slide에서 5개 탭의 상세 정보를 확인할 수 있습니다.

참고 문서: Kubernetes Container

1. 화면 구성

구성 요소설명
Global Time모니터링 재생 여부를 선택합니다. 실시간 데이터만 조회 가능합니다.
FiltersContainer 화면의 필터 항목을 선택합니다.
Container ListContainer 목록을 보여줍니다.

2. Filters (필터)

참고 문서: Kubernetes Container Filters

항목설명
Cluster클러스터 하위의 필터 항목을 보여줍니다. 클릭 시 클러스터 항목을 접힌 상태로 보여줍니다.
Search필터 항목 검색 기능입니다. 대소문자 구분 없이 입력합니다. 검색 결과가 없을 경우 'No data.'를 보여줍니다.
Filter Item항목을 전체 선택한 상태로 보여줍니다. 필터 항목 선택에 따라 화면이 변경되며, OR 조건으로 데이터를 보여줍니다. 클릭 시 필터 항목을 접힌 상태로 보여줍니다.

3. Container List (컨테이너 목록)

참고 문서: Kubernetes Container List

기능

항목설명
SearchContainer 목록에서 Pod 정보를 검색합니다. 대소문자 구분 없이 입력합니다. 검색 결과가 없을 경우 '데이터가 없습니다.'를 보여줍니다.
Option클릭 시 Grid의 옵션(컬럼 설정 등)을 보여줍니다.
Container ListContainer의 목록을 Grid 형태로 보여줍니다.

Grid 수집 항목

항목설명
Container NameContainer의 이름 (클릭 시 Container Detail Slide 오픈)
NamespaceContainer가 배포되어 있는 Namespace의 이름
Pod Name파드의 이름
StatusContainer의 현재 Status
Alert마지막 발생된 알람 정보
vCorevCore 개수
CPU LimitContainer의 CPU Limit
CPU Usage/Limit(%)Container의 CPU Limit 대비 사용량
CPU Usage/Node Alloc(%)Node의 할당된 사용량 대비 CPU Usage
Memory LimitContainer의 Memory Limit
Mem Usage/Limit(%)Container의 Memory Limit 대비 사용량
Mem Usage/Node Alloc(%)Node의 할당된 사용량 대비 Mem Usage
RXContainer의 네트워크 수신(RX)
TXContainer의 네트워크 송신(TX)
ImageContainer의 Image
AgeContainer의 Age (가동 시간)

4. Container Detail Slide (상세 슬라이드)

참고 문서: Kubernetes Container Detail Slide

Container List에서 컨테이너 이름을 클릭하면 열리는 상세 화면입니다. 5개 탭으로 구성됩니다.

구성 요소설명
TitleContainer 목록에서 클릭한 데이터의 이름을 보여줍니다.
Slide History슬라이드 이력 탐색
Close 클릭 시 Detail Slide가 닫힙니다.
TabInformation, Metric, Relational Information, Alert, Log

4.1 Information(K8S) 탭

참고 문서: Kubernetes Container Information

Container Detail Slide(K8S)의 정보를 확인하는 화면입니다.

Kubernetes 환경에 맞는 14개 항목의 Machine 정보를 제공합니다:

항목설명
Container Name컨테이너 이름
Container ID컨테이너 ID
Container Status컨테이너 상태
Cpu by Limit컨테이너의 CPU 제한 수치
Cpu by Request컨테이너의 CPU 최소 요구 수치
Memory by Limit컨테이너의 메모리 제한 수치 (unlimit인 경우 host total memory)
Memory by Request메모리 최소 요구 수치
Image컨테이너 이미지 정보
Cluster Name클러스터 이름
Namespace Name네임스페이스 이름
Node Name노드 이름
Pod Name파드 이름
Last Status마지막 Status
Restart Count재시작 횟수

4.2 Metric 탭

참고 문서: Kubernetes Container Metric

Container Detail Slide의 Metric 정보를 확인하는 화면입니다. Default 최근 5분 데이터를 보여줍니다.

12개 성능 지표를 차트로 제공합니다:

지표설명
CPU User Usage (%)컨테이너의 CPU User 사용량
CPU System Usage (%)컨테이너 CPU System 사용량
Memory RSS (bytes)컨테이너의 RSS memory
Memory Workingset (bytes)컨테이너의 workingset (usage – inactivefile)
Network Receive (bytes)네트워크 Receive bytes
Network Transmit (bytes)네트워크 Transmit bytes
Network Receive Errors (count)디바이스 드라이버에서 감지한 Receive 에러 패킷 수
Network Transmit Errors (count)디바이스 드라이버에서 감지한 Send 에러 패킷 수
Filesystem Read (bytes)Disk에서 읽기 한 bytes
Filesystem Write (bytes)Disk에서 쓰기 한 bytes
CPU Throttling Count (count)Throttling 되는 횟수
CPU Throttling (ms)Throttling 상태에 머무르는 시간

4.3 Relational Information 탭

참고 문서: Kubernetes Container Relational Information

Container Detail Slide의 연관 타겟 정보를 확인하는 화면입니다.

기능설명
Global Time실시간 데이터를 조회합니다.
Search타겟 목록을 검색합니다. 대소문자 구분 없이 입력합니다. 검색 결과가 없을 경우 'No data'를 보여줍니다.
Option 클릭 시 Grid의 옵션을 보여줍니다.
Target ListTarget List를 Grid 형태로 보여줍니다.

Grid 수집 항목

항목설명
Target Name타겟 이름
Platform타겟 플랫폼
Type타겟 타입
Kind타겟 타입의 벤더 정보
Version버전
Status현재 상태
Description설명

4.4 Alert 탭

참고 문서: Kubernetes Container Alert

Container Detail Slide의 Alert 정보를 확인하는 화면입니다.

기능설명
Global Time실시간 데이터를 조회합니다.
Search알람 로그 목록을 검색합니다. 대소문자 구분 없이 입력합니다. 검색 결과가 없을 경우 'No data'를 보여줍니다.
Option 클릭 시 Grid의 옵션을 보여줍니다.
Alert LogsAlert Logs를 Grid 형태로 보여줍니다.

Grid 수집 항목

항목설명
Rule Name룰의 이름 (클릭 시 Alert Detail Slide 오픈)
Alert NameAlert 이름
TargetAlert 발생 타겟
Last Triggered최근 Alert 발생 시간
Rule Type룰의 유형
Last Alert마지막 Alert 항목 (Normal / Warning / Critical)
Threshold알람 발생 조건
Value현재 지표의 값

4.5 Log(K8S) 탭

참고 문서: Kubernetes Container Log

Container Detail Slide의 Log(K8S) 정보를 확인하는 화면입니다. 다양한 로그 검색 기능을 제공합니다.

기능설명
Radio Button검색할 로그를 선택합니다. Search current log: 최근 로그를 검색합니다. Select Time: 설정된 시간에 발생한 로그를 검색합니다 (클릭 시 Time 활성화).
Toggle최근 로그 출력 방식을 설정합니다. Current Head Log: 로그 파일 앞부분을 출력합니다. Current Tail Log: 로그 파일 뒷부분을 출력합니다.
Check box이전 종료된 컨테이너의 로그 출력 여부를 선택합니다.
Line로그 출력 라인 수를 설정합니다.
Get 클릭 시 현재 로그 목록 데이터를 가져옵니다.
Copy 클릭 시 텍스트가 복사됩니다.
Expansion 클릭 시 새로운 Current Log 창이 생성됩니다.

5. Container OS 리소스 사용률(Usage) 지표

참고 문서: Container OS 리소스 사용률 지표 가이드

exemONE K8S Agent에서 각 컨테이너의 limit 값 대비 실제 메모리 및 CPU 사용률을 산출하는 지표입니다.

5.1 Container Memory Usage by Limit

  • 컨테이너별 limit 값 대비 메모리 사용률을 나타냅니다.
  • limit 값은 container-agent의 USE_NODE_RESOURCE_FOR_UNLIMIT 옵션 설정에 따라 데이터가 수집됩니다.

5.2 Container CPU Usage by Limit

  • 컨테이너별 limit 값 대비 CPU 사용률을 나타냅니다.
  • limit 값은 container-agent의 USE_NODE_RESOURCE_FOR_UNLIMIT 옵션 설정에 따라 데이터가 수집됩니다.

주의사항

USE_NODE_RESOURCE_FOR_UNLIMIT 옵션의 설정에 따라 limit 데이터 수집 및 사용률 산출 방식이 달라질 수 있으므로, 옵션 설정 현황을 반드시 확인하시기 바랍니다.


6. 수집 항목 종합 정리

카테고리수집 항목
Container List 항목 (16개)Container Name, Namespace, Pod Name, Status, Alert, vCore, CPU Limit, CPU Usage/Limit(%), CPU Usage/Node Alloc(%), Memory Limit, Mem Usage/Limit(%), Mem Usage/Node Alloc(%), RX, TX, Image, Age
Information 항목 (14개)Container Name, Container ID, Container Status, Cpu by Limit, Cpu by Request, Memory by Limit, Memory by Request, Image, Cluster Name, Namespace Name, Node Name, Pod Name, Last Status, Restart Count
Metric 성능 지표 (12개)CPU User Usage (%), CPU System Usage (%), Memory RSS (bytes), Memory Workingset (bytes), Network Receive (bytes), Network Transmit (bytes), Network Receive Errors (count), Network Transmit Errors (count), Filesystem Read (bytes), Filesystem Write (bytes), CPU Throttling Count (count), CPU Throttling (ms)
Relational Information 항목 (7개)Target Name, Platform, Type, Kind, Version, Status, Description
Alert 항목 (8개)Rule Name, Alert Name, Target, Last Triggered, Rule Type, Last Alert, Threshold, Value
Usage 지표Container Memory Usage by Limit, Container CPU Usage by Limit

7. 접근 방법

  1. exemONE에 로그인합니다.
  2. 좌측 메뉴에서 Kubernetes > Container를 클릭합니다.
  3. Filters에서 모니터링할 Cluster 및 필터 항목을 선택합니다.
  4. Container List에서 각 컨테이너의 Namespace, Pod Name, CPU/Memory Usage, Network 등 핵심 지표를 Grid 형태로 확인합니다.
  5. 특정 컨테이너를 클릭하면 Container Detail Slide가 열리며, 5개 탭(Information, Metric, Relational Information, Alert, Log)을 통해 상세 모니터링이 가능합니다.