Comment ajouter un tableau de bord Prometheus à Grafana

Un article de Matt Toback de raintank, la société derrière Grafana

introduction

Grafana est le constructeur de graphes et de tableaux de bord de pointe pour la visualisation d’infrastructures de séries temporelles et de métriques d’application, mais il est souvent utilisé dans d’autres domaines, notamment les capteurs industriels, la domotique, la météo et le contrôle de processus. Il fournit un moyen puissant et élégant pour créer, explorer et partager des tableaux de bord et des données avec votre équipe et le monde.

Dans ce didacticiel, vous apprendrez à ajouter Prometheus en tant que source de données à votre instance Grafana et à installer un tableau de bord Prometheus Server Statistics préconfiguré.

Conditions préalables

Pour suivre ce tutoriel, vous aurez besoin de:

Étape 1 - Ajout de Prometheus en tant que source de données Grafana

Dans cette section, nous allons configurer Grafana pour accéder à votre serveur Prometheus en tant que source de données. Chaque serveur Prometheus est une source de données distincte. Si vous configurez plusieurs serveurs Prometheus, répétez cette section pour chacun.

Accédez à l’écran principal de Grafana à «+ http: //: 3000 / +» et connectez-vous à votre compte administrateur.

Cliquez sur l’icône Grafana dans le coin supérieur gauche pour afficher le menu principal. Sélectionnez * Sources de données * pour accéder à la page de la liste des sources de données. Cliquez sur * Ajouter un nouveau * dans la barre de navigation supérieure. Vous devriez voir ce qui suit:

image: https: //assets.digitalocean.com/articles/grafana_prometheus/4ST1Bt3.png [base de données Prometheus]

Utilisez les valeurs suivantes pour créer une nouvelle source de données:

  • + Nom +: Prométhée

  • + Type +: Prométhée

  • + URL +: http: //, (le port par défaut est 9090)

  • + Access +: proxy

  • + Basic Auth +: Activé ou désactivé, selon la configuration de votre serveur Prometheus.

Cliquez sur * Ajouter * pour ajouter votre source de données, puis cliquez sur * Tester la connexion * pour vérifier que tout fonctionne correctement. En cas de succès, passez à l’étape suivante pour importer votre tableau de bord.

Étape 2 - Importation du tableau de bord de statistiques Prometheus

Cette section téléchargera un tableau de bord officiel Prometheus Stats pré-construit et vous expliquera comment l’importer dans Grafana.

Téléchargez le dernier tableau de bord Prometheus de deux manières:

  1. Faites un clic droit et enregistrez le lien suivant: Prometheus Stats - Default Grafana Dashboard

  2. Accédez directement au fichier JSON du tableau de bord dans votre navigateur: + http: // grafana.org / assets / dashboards / prometheus-dash.json +

La vue d’importation se trouve dans la liste déroulante Sélecteur de tableau de bord, à côté des boutons Nouveau tableau de bord et Liste de lecture.

Pour importer un tableau de bord à partir d’un fichier JSON local, cliquez sur le bouton * Choisir un fichier * dans la section * Importer un fichier *. Recherchez le fichier + prometheus-dash.json + téléchargé sur votre système de fichiers local et importez-le.

image: https: //assets.digitalocean.com/articles/grafana_prometheus/HGL0BSi.gif [Importer]

  • Remarque: * Si vous avez nommé votre source de données autrement que + Prometheus +, vous devrez rechercher et remplacer le nom de la source de données dans le fichier + .json +. Ouvrez-le avec:

nano prometheus-dash.json

Recherchez ce qui suit et remplacez le nom de fichier de la source de données par le nom que vous l’avez nommé:

prometheus-dash.json

"datasource": "",

Après avoir importé le tableau de bord Prometheus, vous accédez immédiatement au tableau de bord Prometheus Stats et, si tout est correctement configuré, vous commencerez à consulter les statistiques de votre serveur Prometheus.

image: https: //assets.digitalocean.com/articles/grafana_prometheus/TuWTZpv.png [Tableau de bord des statistiques de promotion]

  • Important *: Cliquez sur le bouton Enregistrer dans le menu du haut pour enregistrer votre tableau de bord au sein de votre instance Grafana. Si vous n’enregistrez pas votre tableau de bord, il n’apparaîtra pas dans votre Grafana après la fermeture de votre navigateur.

Étape 3 - Affichage du tableau de bord des statistiques Prometheus

Une fois l’importation réussie, vous serez immédiatement dirigé vers votre nouveau tableau de bord unsaved. Ce tableau de bord a été créé avec l’aide de l’équipe Prometheus, en soulignant les mesures de base couramment utilisées pour dépanner votre serveur Prometheus.

image: https: //assets.digitalocean.com/articles/grafana_prometheus/prom_dash.png [Tableau de bord Prometheus]

Les panneaux individuels et les mesures rapportées sont les suivants:

Graphes statistiques simples

  • * Temps de disponibilité *: Ce graphique de statistiques unique est le temps de disponibilité, ou le temps écoulé depuis la mise en ligne du serveur Prometheus. En un coup d’œil, cette statistique est utile pour savoir si votre serveur a récemment redémarré.

  • * Série de mémoires de stockage locales *: Ce panneau affiche le nombre actuel de séries conservées en mémoire, à partir de la valeur + De + spécifiée dans la plage de temps du tableau de bord. Par défaut, c’est + maintenant.

  • * Longueur de la file d’attente de stockage interne *: Idéalement, cette longueur de file d’attente doit être vide (0) ou faible.

  • * Échantillon ingéré *: ce graphique affiche le nombre d’échantillons ingérés par le serveur Prometheus, mesurés au cours des 5 dernières minutes, par série chronologique dans le vecteur de plage. Lors du dépannage d’un problème sur IRC ou Github, il s’agit souvent de la première statistique demandée par l’équipe Prometheus. Ce nombre doit correspondre au nombre de métriques que vous pensez ingérer.

La requête * Samples Ingested * est la suivante:

rate(prometheus_local_storage_ingested_samples_total[5m])

Éraflures

Prometheus efface les métriques des travaux instrumentés, directement ou via une passerelle intermédiaire pour les travaux éphémères. Le graphique * Scrapes de cibles * indique la fréquence de grattage des cibles mesurée au cours des 5 dernières minutes, par série chronologique dans le vecteur de distance. Le graphique * Durée de la note * indique la durée de prise des notes avec les centiles disponibles en série. La durée de raclage indique le 50ème percentile (0,5), le 90ème percentile (0,9). et 99e centile (0,99) en trois séries distinctes pour aider à identifier les valeurs aberrantes susceptibles de fausser les données.

La requête * Scrapes * cible est la suivante:

rate(prometheus_target_interval_length_seconds_count[5m])

La requête * Scrape Durée * est la suivante:

prometheus_target_interval_length_seconds{quantile!="0.01", quantile!="0.05"}

Durée d’évaluation de la règle

Ce panneau de graphique trace la durée d’exécution de toutes les évaluations. Les 50e centiles (0,5), 90e centiles (0,9) et 99e centiles (0,99) sont présentés sous forme de trois séries distinctes pour aider à identifier les valeurs aberrantes susceptibles de fausser les données.

Étape 4 - Analyse des données du tableau de bord Prometheus

Pour un serveur Prometheus qui fonctionne depuis peu, vos graphiques doivent apparaître assez plats et petits.

À long terme, ces graphiques varieront considérablement en fonction de votre cas d’utilisation et de votre charge de travail. En général, vous voulez que tous ces graphiques restent stables. Si plus de cibles sont en train d’être éraflées et / ou qu’elles commencent à exporter plus de métriques, le nombre d’échantillons ingérés, les séries de mémoire et les éraflures de cibles par seconde augmenteront - ce à quoi on pouvait s’attendre.

Si les éraflures cibles chutent de manière inattendue ou que leur latence augmente, vous devez en déterminer la cause. Par exemple, un client peut commencer à exporter 1 million de métriques au lieu des 10 000 métriques habituelles ou une personne peut exporter une série chronologique avec une étiquette différente pour chaque utilisateur. Ces deux facteurs entraîneraient une augmentation du temps de latence des mises au rebut. Ainsi, lorsqu’un graphique monte soudainement, vous devez rechercher si une application vient juste d’être considérablement développée ou si elle peut être mal instrumentée.

Une évaluation lente des règles est également un bon indicateur du fait que le nœud sur lequel le serveur Prometheus est exécuté n’est tout simplement pas suffisant pour gérer la charge.

Étape 5 - Personnalisation des graphiques et des métriques

Vous avez maintenant un tableau de bord Prometheus ajouté à votre instance Grafana avec un ensemble de statistiques de serveur Prometheus préconfigurées.

Grafana vous donne le pouvoir de visualiser toute métrique disponible sur votre serveur Prometheus, le tout accessible dans un éditeur de requête Prometheus spécialisé. Pour accéder à l’éditeur de requête sur n’importe quel panneau, cliquez sur la zone de titre du panneau pour afficher le menu du panneau. Cliquez sur * Modifier *. L’onglet * Métriques * sera pré-sélectionné pour vous et fournira un accès direct à la requête et aux options disponibles pour la source de données Prometheus.

image: https: //assets.digitalocean.com/articles/grafana_prometheus/graf-prom-animated.gif [Gif animé]

Au fur et à mesure que des modifications sont apportées dans l’éditeur de requête, le graphique se met instantanément à jour pour afficher vos modifications.

Conclusion

Pour obtenir une liste complète des mesures disponibles, vous pouvez accéder à http: // ++ / metrics (le port 9090 est le port par défaut).

Chacune de ces métriques peut être copiée et collée dans l’éditeur de requêtes Grafana. Jusqu’à ce que vous sauvegardiez votre tableau de bord, aucune de vos modifications ne remplacera le tableau de bord existant.

Alors expérimentez, amusez-vous et commencez à visualiser!

Related