check_ganglia_metric

ภาพหน้าจอของซอฟแวร์:
check_ganglia_metric
รายละเอียดซอฟแวร์:
รุ่น: 2012.02.28
วันที่อัพโหลด: 15 Apr 15
ผู้พัฒนา: Michael T. Conigliaro
การอนุญาต: ฟรี
ความนิยม: 1

Rating: 3.0/5 (Total Votes: 1)

check_ganglia_metric เป็นปลั๊กอิน Nagios ที่ช่วยให้คุณที่จะเรียกการแจ้งเตือนในปมประสาทตัวชี้วัดใด ๆ
check_ganglia_metric เป็นแรงบันดาลใจอย่างมากจากวลาดิเมีย check_ganglia_metric.php Vuksan แต่มันมาพร้อมกับจำนวนของการปรับปรุง

การติดตั้ง

# PIP ติดตั้ง check_ganglia_metric
... หรือ:
# easy_install check_ganglia_metric
ปมประสาทกำหนดค่า
เว้นแต่เซิร์ฟเวอร์ Nagios ของคุณและปมประสาท Meta ภูตกำลังทำงานอยู่ในพื้นที่เดียวกัน, คุณอาจจำเป็นต้องแก้ไข gmetad.conf ของคุณเพื่อให้การเชื่อมต่อระยะไกลจากเซิร์ฟเวอร์ Nagios ของคุณ
หากต้องการให้มีการเชื่อมต่อจาก nagios-server.example.com:
trusted_hosts nagios-server.example.com
หากต้องการให้มีการเชื่อมต่อจากทุกครอบครัว (อาจจะมีความเสี่ยงด้านความปลอดภัย):
all_trusted บน
การทดสอบในบรรทัดคำสั่ง
อันดับแรกให้ดูว่า check_ganglia_metric สามารถสื่อสารกับปมประสาท Meta ภูต:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& nbsp; - metric_host = host.example.com --metric_name = cpu_idle
สถานะตกลง Idle CPU = 99.3% | cpu_idle = 99.3% ;;;;
"สถานะ OK" ข้อความแสดงให้เห็นว่าเป็นคนที่ทำงาน check_ganglia_metric หากคุณกำลังมีปัญหาในการนี​​้เพื่อให้การทำงานลองอีกครั้งกับการบันทึก verbose เปิดใช้งาน (--verbose) เพื่อที่จะได้รับความเข้าใจที่ดีขึ้นในสิ่งที่เกิดผิด
ตอนนี้ขอลองตั้งค่าเกณฑ์การแจ้งเตือน:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& nbsp; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
สถานะที่สำคัญไม่ได้ใช้งาน CPU = 99.6% | cpu_idle = 99.6% ;; 99 ;;
เราบอก check_ganglia_metric ที่จะกลับมา "ที่สำคัญ" สถานะถ้า CPU Idle มากกว่า 99 "สถานะที่สำคัญ" ข้อความแสดงให้เห็นว่ามันทำงาน โปรดทราบว่า check_ganglia_metric ช่วงแยกวิเคราะห์และเกณฑ์ตาม Nagios อย่างเป็นทางการแนวทางการพัฒนาปลั๊กอิน
หากต้องการดูรายการที่สมบูรณ์ของตัวเลือกบรรทัดคำสั่งที่มีคำอธิบายสั้น ๆ เรียก check_ganglia_metric กับตัวเลือก --help
Nagios กำหนดค่า
ครั้งแรกที่สร้างคำนิยามของคำสั่ง:
กำหนดคำสั่ง {
& nbsp; command_name check_ganglia_metric
& nbsp; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS --metric_name $ = $ ARG1 --warning $ = $ ARG2 --critical $ = $ arg3 $
}
ตอนนี้คุณสามารถใช้คำสั่งข้างต้นในคำนิยามบริการของคุณ:
กำหนดบริการ {
& nbsp; service_description CPU ไม่ได้ใช้งาน - ปม​​ประสาท
& nbsp; ใช้ some_template
! & nbsp; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
& nbsp; host_name host.example.com
}
นี้จะทำงานได้ดีจนบางสิ่งบางอย่างผิดพลาดกับ check_ganglia_metric (เช่นไฟล์แคชไม่สามารถอ่าน / เขียนไป, ภูตปมประสาท Meta ไม่สามารถเข้าถึง ฯลฯ ) ณ จุดที่ให้บริการที่อาศัย check_ganglia_metric ทุกคนจะล้มเหลวอาจจะจุกคุณมีการแจ้งเตือน เราสามารถป้องกันไม่ให้ผ่านการใช้การอ้างอิงบริการ
สิ่งแรกที่เราต้องการคือความหมายคำสั่งสำหรับการตรวจสอบอายุของไฟล์:
กำหนดคำสั่ง {
& nbsp; command_name check_file_age
& nbsp; command_line / usr / lib / nagios / ปลั๊กอิน / check_file_age -f ARG1 $ $ $ -w ARG2 -c $ $ $ arg3
}
ต่อไปเราจะกำหนดบริการที่จะตรวจสอบอายุของไฟล์แคช check_ganglia_metric ของ โปรดทราบว่าในการที่จะมีประสิทธิภาพอย่างแท้จริงบริการนี​​้จะต้องมีการตรวจสอบอย่างน้อยเป็น (ยิ่งมากขึ้น) บ่อยกว่าการตรวจสอบอื่น ๆ ที่ใช้ check_ganglia_metric:
กำหนดบริการ {
& nbsp; service_description แคชสำหรับ check_ganglia_metric
& nbsp; ใช้ some_template
& nbsp;! check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60 120
& nbsp; host_name localhost
& nbsp; check_interval 1
& nbsp; max_check_attempts 1
}
และในที่สุดเราตั้งค่าการพึ่งพาบริการที่เกิดขึ้นจริง โปรดทราบว่าผมได้เปิดใช้งาน use_regexp_matching ใน Nagios ซึ่งช่วยให้ผมที่จะใช้แสดงผลปกติในคำสั่งของฉัน โดยการเกาะ "- ปมประสาท" ในตอนท้ายของการให้บริการทุกที่อาศัย check_ganglia_metric ผมสามารถบันทึกตัวเองมากของความพยายาม:
กำหนด servicedependency {
& nbsp; host_name localhost
& nbsp; service_description แคชสำหรับ check_ganglia_metric
& nbsp; dependent_host_name *.
& nbsp;. dependent_service_description * - ปม​​ประสาท $
& nbsp; execution_failure_criteria คพี
}
ตอนนี้ถ้ามีอะไรผิดพลาดกับ check_ganglia_metric เพียงหนึ่งการแจ้งเตือนจะถูกส่งออกเกี่ยวกับแฟ้มแคชและทั้งหมดขึ้นอยู่กับการตรวจสอบการให้บริการจะถูกหยุดชั่วคราวจนกว่าคุณจะแก้ไขปัญหาที่ทำให้เกิด check_ganglia_metric ที่จะล้มเหลว เมื่อปัญหาได้รับการแก้ไขคุณจะต้องปรับปรุงการประทับเวลาในแฟ้มแคชเพื่อใส่ "แคชสำหรับ check_ganglia_metric" บริการกลับเข้ามาในรัฐ OK (ซึ่งจะช่วยให้การตรวจสอบการให้บริการขึ้นอยู่เพื่อดำเนินการต่อ):
& nbsp; สัมผัส /var/lib/nagios/.check_ganglia_metric.cache
เคล็ดลับและ
มันเป็นไปได้ที่จะได้รับรายชื่อของครอบครัวที่มีอยู่และตัวชี้วัดโดยการช่วยให้ "verbose มากกว่า" การเข้าสู่ระบบ (-vv) ตั้งแต่ตัวเลือก metric_host และ METRIC_NAME จะต้องคุณจะมีนิด ๆ หน่อย ๆ ของ "ไก่และไข่" ปัญหาที่นี่ แต่ที่ตกลง เพียงแค่จัดหาข้อมูลบางหุ่น ปลั๊กอินจะเกิดข้อผิดพลาดออกมาในตอนท้ายกับ "เจ้าภาพ / ตัวชี้วัดไม่พบข้อผิดพลาด" แต่ไม่ก่อนที่จะทิ้งแคช:
& nbsp; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& nbsp; - metric_host = --metric_name หุ่น = -vv หุ่น

มีอะไรใหม่ ในข่าวประชาสัมพันธ์นี้:

  • เพิ่ม - ตัวเลือก -metrics_max_age
  • ผสาน CHANGELOG.rst เป็น README.rst

ต้องการ

  • หลาม
  • Nagios

ข้อ จำกัด

  • ไม่ทำงานกับงูหลาม 2.4

ซอฟต์แวร์ที่คล้ายกัน

logchart
logchart

11 May 15

spy
spy

14 Apr 15

Iotop
Iotop

20 Feb 15

daemonwatch
daemonwatch

14 Apr 15

ความคิดเห็นที่ check_ganglia_metric

ความคิดเห็นที่ไม่พบ
เพิ่มความคิดเห็น
เปิดภาพ!
ค้นหาตามหมวดหมู่