인프라 모니터링 UI에서 Hosts [호스트] UI 페이지는 인프라 문제를 이해하고 해결할 수 있는 기본 위치입니다.
팁 이 문서에서는 2023년 4월에 추가된 새로운 Hosts [호스트] UI에 대해 설명합니다. 새 보기와 Classic [기본] 보기 간에 전환할 수 있습니다. 2023년 8월 30일에 클래식 UI의 수명이 종료될 예정입니다.
one.newrelic.com > All capabilities > Infrastructure
사용 사례 예시 Hosts [호스트] 페이지는 인프라의 문제를 조사하기 위해 이동하는 곳입니다. 다음은 고객이 문제를 진단하는 데 사용하는 일반적인 워크플로우의 한 예입니다.
APM 요약 페이지 에서 Kafka 서비스에 문제가 있음을 확인합니다. 처리량이 떨어졌고 많은 오류가 있습니다.APM에 표시되는 인프라 데이터를 기반으로 호스트 문제라고 생각하고 인프라 Hosts [호스트] 페이지를 클릭합니다. Hosts [호스트] 페이지는 자동으로 Kafka 서비스로 필터링됩니다. 해당 서비스를 실행하는 호스트의 절반이 CPU %를 최대로 초과한 것을 볼 수 있습니다.호스트 구성 변경이 문제의 원인일 수 있다고 의심되는 경우 Inventory [인벤토리] 탭으로 이동하여 호스트별 시스템 구성을 확인하십시오. 호스트 탐색 및 분석을 위한 UI 기능 Hosts [호스트] UI에서 사용할 수 있는 몇 가지 중요한 UI 기능이 있습니다. 이를 사용하는 방법을 이해하면 이 UI를 최대한 활용하는 데 도움이 됩니다.
A. 필터 표시줄: 보고 싶은 호스트를 필터링합니다. 팁은 필터 막대 를 참조하십시오.
B. 저장된 보기: 원하는 보기(필터, 사용자 정의 차트 및 테이블 선택을 포함할 수 있음)를 만들면 Save [저장 을] 클릭합니다.
C. 차트 옵션: 각 차트에 대해 다른 측정항목으로 전환할 수 있으며 ...
클릭하여 공유 가능한 링크 가져오기 및 해당 측정항목에 대한 알림 생성을 포함하여 더 많은 차트 옵션을 볼 수 있습니다.
D. 그룹화 기준: 차트 결과를 특정 속성별로 그룹화하는 데 사용합니다. 예를 들어 CPU 사용량이 가장 높은 AWS 지역을 awsRegion
로 그룹화하여 표시할 수 있습니다.
E. 속성 필터: 특정 속성 값을 가진 호스트로 호스트를 필터링할 수 있습니다. 예를 들어,
F. 호스트 테이블: 기본적으로 25개의 호스트가 표시되도록 선택됩니다. 테이블 열과 속성 필터를 사용하여 호스트를 탐색하고 표시할 다른 호스트를 선택합니다. 표를 CSV로 내보낼 수 있습니다.
G. 호스트 세부 정보: 호스트 테이블의 특정 호스트에 대해
아이콘을 클릭하면 로그 보기, 엔터티 맵 보기 등의 옵션을 포함하여 자세히 알아볼 수 있는 추가 옵션이 표시됩니다.
호스트 UI 페이지의 탭 호스트 UI 페이지에서 사용할 수 있는 탭에 대한 자세한 내용은 다음과 같습니다.
요약 탭 Hosts [호스트] 페이지의 Summary [요약] 탭은 호스트 성능에 대한 개요를 제공합니다.
one.newrelic.com > All capabilities > Infrastructure
이 페이지 상단의 타일은 호스트, 애플리케이션, 이벤트 및 경고에 대한 개요를 제공합니다. 이러한 타일을 사용하여 호스트에 대한 세부 정보를 보거나 전체 Summary [요약] 페이지를 특정 호스트로 필터링합니다.
Summary [요약] 페이지의 시간 선택기는 메트릭 타일과 차트만 조정하지만 호스트 테이블은 조정 하지 않습니다 . Hosts [호스트] UI의 다른 탭에는 시간 선택기가 설정한 시간 범위를 반영하는 테이블이 있습니다.
시스템 UI System [시스템] 탭은 시스템 개요를 제공합니다. Summary [요약] 탭과 비슷하지만 시스템의 일부 측면에 대한 보다 자세한 정보를 검색할 수 있습니다.
one.newrelic.com > All capabilities > Infrastructure > Hosts > System
System [시스템] 페이지에 표시되는 기본 차트는 다음과 같습니다.
CPU % : SystemSample
이벤트에 대한 여러 다른 측정항목에서 파생된 측정항목입니다. 특히 cpuPercent
속성은 cpuUserPercent
, cpuSystemPercent
, cpuIoWaitPercent
및 cpuStealPercent
의 집계입니다.
부하 평균 5분 : 지난 5분 동안 시스템에서 작업을 수행하기 위해 대기 중인 작업 수의 평균을 나타냅니다.
메모리 여유 % : 여유 메모리 바이트의 양을 사용된 메모리 바이트의 양과 비교합니다.
이러한 차트를 생성하는 데 사용되는 데이터에 대한 자세한 내용은 SystemSample 을 참조하십시오.
네트워크 UI 네트워크 페이지는 네트워크 전반에 걸쳐 개별 호스트, 웹 서버 또는 기타 리소스 그룹의 상태와 성능에 대한 실시간 가시성을 제공합니다. 기본 차트는 패킷별 대역폭 메트릭, 바이트별 대역폭 및 초당 오류를 표시합니다.
one.newrelic.com > All capabilities > Infrastructure > Hosts > Network
개별 인터페이스에 대한 세부 정보는 다음을 수행하는 데 도움이 될 수 있습니다.
네트워크 전체 또는 선택한 호스트의 포화 수준을 검사합니다.
특정 리소스 간의 부하 분산을 비교합니다.
유사한 호스트 간의 용량 패턴에서 예상치 못한 차이를 식별합니다.
감지된 상위 5개 네트워크 오류를 평가합니다.
이 실시간 네트워크 데이터는 구매 결정을 내리기 전에 네트워크를 재구성하거나 부하를 재조정하거나 기타 예방적 유지 관리 조치를 취하여 오류를 해결할지 여부를 결정하는 데 도움이 될 수 있습니다.
이러한 차트를 생성하는 데 사용되는 데이터에 대한 자세한 내용은 NetworkSample 을 참조하십시오.
프로세스 UI 프로세스 탭을 사용하여 호스트에서 실행 중인 프로세스에 대한 정보를 얻고 프로세스 메트릭에 대한 경고를 설정합니다. 프로세스 탭에는 개별 프로세스 또는 프로세스 그룹에 대한 CPU 백분율, I/O 바이트 및 메모리 사용량과 같은 데이터가 표시됩니다.
one.newrelic.com > All capabilities > Infrastructure > Hosts > Processes
Processes [프로세스] 탭에서 CPU 비율은 호스트가 아닌 개별 프로세스로 범위가 지정됩니다. 이 때문에 CPU 백분율 메트릭은 전체 시스템의 리소스를 고려하지 않습니다. 대신 각 프로세스가 차지하는 단일 CPU 코어의 양을 보여줍니다.
이러한 차트를 생성하는 데 사용되는 데이터에 대한 자세한 내용은 ProcessSample 을 참조하십시오.
다음은 문제를 정확히 찾아내고 경고를 설정하는 방법의 예입니다.
Hosts [호스트] 페이지에서 클러스터의 CPU 비율이 평소보다 훨씬 높다는 것을 알 수 있습니다.
프로세스 페이지로 이동하여 해당 클러스터의 프로세스로 필터링합니다.
동일한 프로세스의 여러 인스턴스에 과도한 CPU 백분율이 있음을 알 수 있습니다.
문제를 수정한 후 해당 프로세스 유형에 대한 CPU 백분율이 특정 임계값을 초과할 때 트리거되는 경고 조건을 생성하기로 결정합니다.
스토리지 UI one.newrelic.com > All capabilities > Infrastructure > Hosts > Storage
저장소 탭을 사용하면 장치의 전체 사용률, 디스크 사용량 또는 I/O 작업을 포함하여 리소스의 용량과 효율성을 모니터링할 수 있습니다. 이를 통해 다음을 수행할 수 있습니다.
예상치 못한 패턴을 조사하십시오. 예를 들어 I/O 작업을 균일하게 처리하지 않는 미러링된 시스템의 클러스터입니다.
디스크 공간이 완전히 소진되기 전에 사용량 수준을 모니터링하십시오.
하나 이상의 호스트에 문제가 있는 경우 알림 조건을 설정합니다. 예를 들어 읽기 또는 쓰기 작업을 위한 긴 처리 시간, 백분율 또는 바이트를 기반으로 한 디스크 가용성 또는 사용률 등
일반 처리 요청보다 높거나 낮은 호스트를 재배포할 위치에 대해 정보에 입각한 결정을 내립니다.
비상 사태가 발생하기 전에 데이터를 사용하여 인프라 예산에 대한 추가 또는 변경 계획을 세우십시오.
이러한 차트를 생성하는 데 사용되는 데이터에 대한 자세한 내용은 StorageSample 을 참조하십시오.
컨테이너 Containers [컨테이너] 탭을 사용하여 호스트에서 실행 중인 컨테이너에 대한 정보를 얻고 컨테이너 메트릭에 대한 경고를 설정합니다. 이 탭에는 개별 컨테이너 또는 컨테이너 그룹에 대한 CPU 백분율, I/O 바이트 및 메모리 사용량과 같은 데이터가 표시됩니다. 이 정보를 사용하여 다음을 수행합니다.
인프라 데이터 인프라 데이터에 대해 자세히 알아보려면 인프라 데이터를 참조하십시오.