در دنیای امروزی که زیرساختها روزبهروز پیچیدهتر میشوند، مانیتورینگ به یکی از ارکان اصلی مدیریت سرورها، شبکه و سرویسهای ابری تبدیل شده است.
اما همانطور که زیرساختها به سمت Infrastructure as Code حرکت کردند، مانیتورینگ هم از حالت دستی به شکل جدیدی از اتوماسیون رسیده است:
مدلی به نام Monitoring as Code (MaC).
در این مقاله از نوین هاست یاد میگیریم که Monitoring as Code چیست، چرا جایگزین روشهای سنتی مانیتورینگ میشود، و چطور با ابزارهای محبوب Prometheus و Grafana میتوانیم سیستم مانیتورینگ خود را بهصورت کدنویسیشده طراحی، مستقر و کنترل کنیم.
Monitoring as Code چیست؟
Monitoring as Code یعنی تعریف، مدیریت و نگهداری کل سیستم مانیتورینگ از طریق کد و فایلهای نسخهپذیر بهجای انجام تنظیمات دستی.
به زبان سادهتر:
بهجای اینکه در Grafana بهصورت دستی داشبورد بسازید یا در Prometheus Ruleها را با ویرایش فایلهای محلی تغییر دهید، همه چیز در فایلهای YAML یا JSON نوشته میشود، داخل Git ذخیره میگردد، و از طریق CI/CD منتشر میشود.
این مدل، مانیتورینگ را تبدیل به بخشی از زیرساخت بهعنوانکد میکند — دقیق، قابل تکرار، قابل نسخهبندی و خودکار.
چرا Monitoring as Code اهمیت دارد؟
در محیطهایی با دهها سرور، سرویس و Container، تغییر دستی در تنظیمات Prometheus یا Grafana میتواند باعث ناهماهنگی، خطا و دوبارهکاری شود.
Monitoring as Code این مشکلات را حل میکند.
مزایا:
- اتوماسیون کامل: دیگر نیازی به ویرایش دستی داشبوردها یا Ruleها نیست.
- نسخهبندی در Git: هر تغییر قابل ردیابی و بازگشتپذیر است.
- هماهنگی بین محیطها: محیط تست، Stage و Production مانیتورینگ یکسانی دارند.
- مقیاسپذیری: افزودن سرور یا سرویس جدید فقط با یک Commit انجام میشود.
- همراستا با DevOps: مانیتورینگ هم مثل کد توسعه، در فرآیند CI/CD مدیریت میشود.
Prometheus چیست؟
Prometheus یک سیستم مانیتورینگ متنباز است که ابتدا توسط SoundCloud ساخته شد و حالا توسط CNCF (Cloud Native Foundation) پشتیبانی میشود.
این ابزار دادههای متریک را جمعآوری، ذخیره و تحلیل میکند.
ویژگیهای کلیدی Prometheus:
- مدل داده تایمسری (Time-Series Database)
- مکانیزم Pull-based (سرورها متریکها را نمیفرستند، Prometheus آنها را جمع میکند)
- زبان پرسوجوی مخصوص بهنام PromQL
- پشتیبانی از Exporterهای فراوان (Linux, MySQL, Nginx, Docker, Node Exporter و …)
- Alertmanager برای اعلان هشدارها
Grafana چیست؟
Grafana ابزاری است برای Visualization و Dashboard سازی.
این نرمافزار دادههای جمعآوریشده توسط Prometheus (و سایر دیتاسورسها مثل InfluxDB, Loki, Elasticsearch) را به نمودار و داشبوردهای پویا تبدیل میکند.
در رویکرد Monitoring as Code، داشبوردهای Grafana بهصورت JSON تعریف میشوند و میتوان آنها را داخل Git ذخیره و بهصورت خودکار Deploy کرد.
معماری پایه مانیتورینگ با Prometheus و Grafana
در مدل معمولی، معماری سیستم اینطور است:
[Server / Node Exporter] → Prometheus → Alertmanager → Grafana
- Node Exporter روی هر سرور نصب میشود تا متریکهای CPU، RAM، Disk و غیره را منتشر کند.
- Prometheus این متریکها را در بازههای زمانی مشخص جمعآوری میکند.
- Alertmanager بر اساس Ruleها هشدارها را مدیریت و ارسال میکند.
- Grafana دادهها را در قالب نمودار نمایش میدهد.
در Monitoring as Code، این چهار بخش همگی از طریق فایلهای YAML و JSON کنترل میشوند، نه از طریق رابط گرافیکی.
نمونه ساختار فایلهای Monitoring as Code
در این رویکرد، فایلهای زیر معمولاً در Git نگهداری میشوند:
monitoring/
├── prometheus.yml
├── rules/
│ ├── cpu_alerts.yml
│ └── disk_alerts.yml
├── grafana_dashboards/
│ ├── system_overview.json
│ └── nginx_status.json
├── exporters/
│ └── node_exporter.sh
└── docker-compose.yml
هر Commit در این پوشه یک نسخه جدید از کل سیستم مانیتورینگ است.
مثال: پیکربندی Prometheus به صورت کد
global:
scrape_interval: 15s
scrape_configs:
- job_name: "novinhost_servers"
static_configs:
- targets: ["192.168.1.10:9100", "192.168.1.11:9100"]
در این مثال، Prometheus هر ۱۵ ثانیه متریکها را از Node Exporter سرورها جمعآوری میکند.
مثال: Rule برای هشدار CPU بالا
groups:
- name: cpu_alerts
rules:
- alert: HighCPUUsage
expr: avg(rate(node_cpu_seconds_total{mode="system"}[2m])) > 0.8
for: 1m
labels:
severity: warning
annotations:
summary: "CPU usage is high"
description: "CPU usage above 80% for more than 1 minute"
این Rule اگر مصرف CPU بیش از ۸۰٪ باشد، هشدار ارسال میکند.
مثال: داشبورد Grafana به عنوان کد
{
"dashboard": {
"title": "NovinHost Server Overview",
"panels": [
{
"type": "graph",
"title": "CPU Usage",
"targets": [
{
"expr": "100 - (avg by(instance) (rate(node_cpu_seconds_total{mode=\"idle\"}[5m])) * 100)",
"legendFormat": "{{instance}}"
}
]
}
]
}
}
این JSON یک داشبورد برای نمایش مصرف CPU در Grafana ایجاد میکند.
استقرار خودکار (Automated Deployment)
در محیطهای حرفهای، فایلهای مانیتورینگ بهصورت خودکار با CI/CD Pipeline منتشر میشوند.
مثلاً با GitLab CI یا Jenkins میتوانید:
- فایلهای YAML/JSON را Validate کنید.
- تغییرات را روی Prometheus و Grafana اعمال کنید.
- Alertmanager را Reload کنید.
نمونه Stage ساده در GitLab CI:
stages:
- validate
- deploy
validate:
script:
- promtool check config prometheus.yml
- promtool check rules rules/*.yml
deploy:
script:
- systemctl reload prometheus
- curl -X POST http://grafana.local/api/dashboards/db --data @dashboard.json
امنیت و پایداری در Monitoring as Code
هرچقدر مانیتورینگ حیاتیتر شود، امنیت آن نیز اهمیت بیشتری پیدا میکند.
در محیطهای تولید (Production)، توصیه میشود:
- از TLS برای ارتباط Prometheus و Exporterها استفاده کنید.
- از Basic Auth یا OAuth در Grafana بهره ببرید.
- از High Availability برای Prometheus و Alertmanager استفاده کنید.
- پشتیبانگیری منظم از فایلهای پیکربندی و داشبوردها انجام دهید.
Monitoring as Code در Kubernetes
در محیطهای Kubernetes، ترکیب Helm یا Helmfile برای استقرار Prometheus و Grafana بسیار متداول است.
در این حالت همه چیز — از Namespace گرفته تا Rule و Dashboard — در قالب فایل تعریف میشود.
نمونه Helmfile:
releases:
- name: prometheus
chart: prometheus-community/prometheus
values:
- values-prometheus.yaml
- name: grafana
chart: grafana/grafana
values:
- values-grafana.yaml
مزایای Monitoring as Code برای هاستینگ و DevOps
- یکپارچگی در محیطها
همان Ruleها و داشبوردها در همه سرورها تکرار میشوند. - سرعت در استقرار
مانیتورینگ یک سرور جدید فقط با یک Commit فعال میشود. - مستندسازی خودکار
فایلهای YAML و JSON بهترین داکیومنت سیستم شما هستند. - مدیریت تیمی و کنترل تغییرات
همه تغییرات از طریق Git Review میگذرد. - انعطاف در مقیاسپذیری
مناسب برای مدیریت دهها یا صدها Node در هاستینگ مدرن.
چکلیست راهاندازی سریع Monitoring as Code
✅ نصب Prometheus و Grafana (Docker Compose یا Kubernetes)
✅ فعالسازی Node Exporter روی سرورها
✅ تعریف Jobها و Ruleها در YAML
✅ ذخیره فایلها در Git
✅ افزودن Dashboard JSON در Grafana
✅ ساخت Pipeline برای Validate و Deploy
✅ تست هشدارها و امنیت
نتیجهگیری
Monitoring as Code یک تحول واقعی در مدیریت زیرساخت و هاستینگ است.
با تبدیل تنظیمات مانیتورینگ به کد، میتوان سیستمهای پیچیده را دقیق، تکرارپذیر و بدون خطا کنترل کرد.
Prometheus و Grafana دو ابزار کلیدی این انقلاب هستند — ترکیبی از قدرت تحلیل داده و نمایش زنده که به تیمهای DevOps امکان میدهد همیشه یک گام جلوتر از خطاها باشند.
نوین هاست یار نوین شماست
در نوین هاست، ما باور داریم که مانیتورینگ مؤثر، پایه پایداری هر زیرساخت است.
با استفاده از ابزارهای نوین مانند Prometheus، Grafana و Monitoring as Code، تیم فنی نوین هاست توانسته زیرساختی بسازد که بهصورت هوشمند سلامت سرورها، ترافیک شبکه و سرویسهای ابری را زیر نظر دارد.