Skip to content

minority opinions

Menu
  • Home
  • 꿀팁정리 & 자기계발
  • 기술 정보 & 테크 소식
  • 이슈 뉴스 정리
  • 주식 경제
  • Tags
Menu
Storage 통합 모니터링

Storage 통합 모니터링

Posted on 6월 24, 20206월 24, 2023 by Daniel J.

스토리지 CPU 상태 모니터링 (이외 IOPS,Latency,Bandwidth,DISK 용량 모두 모니터링중)

10여대 스토리지 운영중 (대략 800TB, 다양한 벤더, VM 10,000대 이상 운영중) 여러가지 벤더라 cli 명령도 다 틀리고 제공되는 모니터링 툴도 벤더별로 다 제각각이라 관리적인 측면이나 모니터링 측면에서 짜증남…

스토리지 이슈 발생시…. VM 전체가 영향을 받아 서비스에 큰 문제 발생… 그래서 스토리지 모니터링이 상당히 중요한 서비스임..

Point :

아래 스크립트를 크론에 등록하여
curl을 사용하여
influxdb 로 넣고
kapacitor 로 실시간 감시
임계치 부합되면 alert
화면은 grafana 모니터링

script 


#!/bin/bashnetapp01_cpu=`snmpwalk -v 2c -c public x.x.x.x .1.3.6.1.4.1.789.1.2.1.3.0 | awk -F ” ” ‘{print $4}’`    .    .netapp08_cpu=`snmpwalk -v 2c -c public x.x.x .1.3.6.1.4.1.789.1.2.1.3.0 | awk -F ” ” ‘{print $4}’`
# emcemc01_cpu=`/data/storage/emc/check_xio_cpu.sh 10.200.x.x user ‘User01’ | awk -F “:” ‘{print $2″ “$4” “$6” “$8}’ |  sed -e ‘s/ /+/g’ | bc -l`emc01_cpu=`echo “$emc01_cpu/4” | bc`
# hp 3parsshpass -p ‘xxxx’ ssh -p 22 user@10.200.x.x ‘statcpu -iter 1 -t’ > /data/storage/Storage-3par-cpu.txt        
hp3par_cpu=`cat /data/storage/Storage-3par-cpu.txt | awk -F ” ” ‘{print  sum += $4} END {print “sum=”sum/4}’ | grep sum | awk -F “=” ‘{print $2}’`
hp3par_cpu=`echo “scale=1; 100-$hp3par_cpu” | bc`

# netapp sshpass -p ‘xxxxxxx’ ssh -p 22 admin@x.x.x.x ‘statistics node show’ > /data/storage/Storage-8060-cpu.txt
netapp8060_01_cpu=`grep xxxxxxxxx-01 /data/storage/Storage-8060-cpu.txt | awk -F ” ” ‘{print $2}’`netapp8060_02_cpu=`grep xxxxxxxxx-02 /data/storage/Storage-8060-cpu.txt | awk -F ” ” ‘{print $2}’`

# data insert
curl -i -XPOST ‘http://x.x.x.x:8086/write?db=public’ –data-binary ‘storage_cpu,storage=netapp01 value=’$netapp01_cpu’               .               .               .storage_cpu,storage=emc01 value=’$emc01_cpu’storage_cpu,storage=hp3par value=’$hp3par_cpu’storage_cpu,storage=netapp_8060_01 value=’$netapp8060_01_cpu’               .storage_cpu,storage=netapp_8060_04 value=’$netapp8060_04_cpu”

– 스토리지 cpu 90% 이상일때 email, slack 로 알람 통보  (tick script 예제) 

cat storage_cpu.tick 

stream       
|from()           
.measurement(‘storage_cpu’)           
.groupBy(‘storage’)       
|window()           
.period(2m)           
.every(3m)       
|alert()           
.details(”’           
<h1>{{ .ID }}</h1>           
<b>Status  : {{ .Level }}</b><br>           
<b>Trigger : Storage CPU(%)</b><br>           
<b>Storage : {{ index .Tags “storage” }}</b><br>           
<b>Value   : {{ index .Fields “value” }}</b><br>             
 ”’)           
.message(‘{{ .Level}}: {{ .Name }}/{{ index .Tags “storage” }} CPU(%): {{ index .Fields “value” }}’)           .warn(lambda: “value” > 89)           
.crit(lambda: “value” > 94)           
.log(‘/data/alert_log/storage_cpu.log’)           
.email()           
.slack()   

임계치 발생시 Slack 알람 화면

Azure Monitor Storage 인사이트를 사용하여 스토리지 서비스 모니터링

이 글 공유하기:

  • 페이스북에 공유하려면 클릭하세요. (새 창에서 열림) Facebook
  • 클릭하여 X에서 공유 (새 창에서 열림) X
  • 인쇄하기 (새 창에서 열림) 인쇄
  • 클릭하여 친구에게 이메일로 링크 보내기 (새 창에서 열림) 전자우편
  • Telegram에 공유하려면 클릭하세요. (새 창에서 열림) Telegram
  • WhatsApp에 공유하려면 클릭하세요. (새 창에서 열림) WhatsApp

이것이 좋아요:

좋아하기 가져오는 중...

관련

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

Category

  • Article (66)
  • Uncategorized (178)
  • 게임 소식 (13)
  • 기술 정보 & 테크 소식 (260)
  • 꿀팁정리 & 자기계발 (317)
  • 블로그 (26)
  • 사건 사고 (64)
  • 역사 (35)
  • 영화 & 드라마 & 애니메이션 (27)
  • 이슈 뉴스 정리 (207)
  • 정치 인물 사회 (122)
  • 주식 경제 (119)

Recent Posts

  • 위고비(Wegovy) 효능과 가격(1펜) 정리

    위고비(Wegovy) 효능과 가격(1펜) 정리

    2월 16, 2025
  • 도메인 URL 주소 단축하는 사이트 모음

    도메인 URL 주소 단축하는 사이트 모음

    1월 30, 2025
  • 5년전 정혜수 MBC 기상캐스터가 해고당하면서 올린 글

    5년전 정혜수 MBC 기상캐스터가 해고당하면서 올린 글

    1월 28, 2025
  • MBC 기상캐스터 오요안나 자살과 집단 괴롭힘 가해자

    MBC 기상캐스터 오요안나 자살과 집단 괴롭힘 가해자

    1월 27, 2025
  • 홍장원 전 국정원 1차장 좌파이력 정리

    홍장원 전 국정원 1차장 좌파이력 정리

    1월 22, 2025

Popular Posts

©2025 minority opinions | Design: Newspaperly WordPress Theme
%d