cAdvisor + Prometheus收集本机和docker容器数据

cAdvisor + Prometheus收集本机和docker容器数据

在这个万物结可容器化的时代,监控显的尤为重要,在本篇文章,我们将对服务器的相关容器和本机数据利用 Cadvisor 进行收集,通过 Prometheus 作为数据源,利用 Grafana 进行展示。

dockerkubernetes 集群的监控有多种,比如:

  • docker: cAdvisor 收集本机以及容器的监控数据
  • kubernetes:cAdvisor+InfluxDB+Grafana
  • kubernetes:Heapster+InfluxDB+Grafana

下面简单说一下谷歌 cAdvisor普罗米修斯 结合的监控,在 grafana 展示,各个文档请看官方介绍

https://prometheus.io/
https://github.com/google/cadvisor

部署Cadvisor

具体操作是在每台运行 docker 服务的主机上都跑一个 cAdvisor 容器, 博主这边是采用 docker-compose 的方式进行部署,然后我先给大家贴一下 yml

  cadvisor:
    image: google/cadvisor
    restart: always
    ports:
      - "8080:8080"
    volumes:
      - /:/rootfs:ro
      - /var/run:/var/run:rw
      - /sys:/sys:ro
      - /var/lib/docker/:/var/lib/docker:ro

当容器的 STATUSUP 的时候就成功启动了, cAdvisor 为我们提供主机的信息的相关 API:

http://IP:8080/metrics
http://IP:8080/containers
http://IP:8080/docker

默认访问的的话,大概就是这个样子,也有相关数据的可视化图表,但是这远远不够,我们还是统一采用 grafana,进行集中式展示,方便查看各个主机的信息,在使用 grafana 之前,我们还需要将这些数据用 Prometheus 进行收集

20201114112525

注意

有可能启动会出现这个问题:

W1112 08:18:11.930612       1 manager.go:349] Could not configure a source for OOM detection, disabling OOM events: open /dev/kmsg: no such file or directory
E1112 08:18:58.568289       1 static.go:75] Failed to write response: write tcp 172.19.0.6:8080->61.140.208.205:53633: write: broken pipe
W1112 08:48:55.102473       1 container.go:409] Failed to create summary reader for "/docker/42ef2fbef15ce20a5fc2caaebaccc7712b179855ce8384f34cbdae1f7d30920f": none of the resources are being tracked.
I1114 02:36:19.568227       1 manager.go:1212] Exiting thread watching subcontainers
I1114 02:36:19.568254       1 manager.go:432] Exiting global housekeeping thread
I1114 02:36:19.568269       1 cadvisor.go:212] Exiting given signal: terminated
W1114 02:36:20.574582       1 manager.go:349] Could not configure a source for OOM detection, disabling OOM events: open /dev/kmsg: no such file or directory
I1114 02:37:41.416194       1 manager.go:1212] Exiting thread watching subcontainers
I1114 02:37:41.416215       1 manager.go:432] Exiting global housekeeping thread
I1114 02:37:41.416227       1 cadvisor.go:212] Exiting given signal: terminated
W1114 02:37:42.407178       1 manager.go:349] Could not configure a source for OOM detection, disabling OOM events: open /dev/kmsg: no such file or directory

之后处理方法如下:

sudo mount -o remount,rw '/sys/fs/cgroup'
sudo ln -s /sys/fs/cgroup/cpu,cpuacct /sys/fs/cgroup/cpuacct,cpu

部署Prometheus

这个我们也采用 docker-compose 进行部署,统一方便

  prometheus:
    image: prom/prometheus:latest
    restart: always
    ports:
      - "9090:9090"
    volumes:
      - ./prometheus/prometheus.yml:/etc/prometheus/prometheus.yml
      - type: volume
        source: prometheus
        target: /prometheus

volumes:
  prometheus:
    driver: local
    driver_opts:
      type: none
      o: bind
      device: /var/www/ghost-docker-compose/prometheus/data
  • prometheus.yml
global:
  scrape_interval:     15s
  evaluation_interval: 15s

scrape_configs:
  - job_name: 'prometheus'
    static_configs:
    - targets: ['prometheus:9090']

  - job_name: 'cadvisor'
    static_configs:
    - targets: ['cadvisor:8080']

成功后方问 ip:9090 , 就能看到界面了,然后我们配置一下 Prometheus 让他能看到 Cadvisor 这个服务,Status -> Targets 看到 UP 状态就是成功了

Status-Configuration 里面可以看到配置文件,Targets 里面查看已经建立的节点。普罗米修斯 Graph 搜索查看条件语法见 https://prometheus.io/docs/querying/basics/

20201114112506

我们可以在 Graph 栏目选择一条指令测试一下,是否可以成功获取到信息

20201114112447

部署Grafana

grafana 是从 prometheus 获取数据并展示,第一步添加 prometheus 数据库,第二步用网上的模板画图,这边直接 docker 一条龙

  grafana:
    image: grafana/grafana:latest
    volumes:
      - type: volume
        source: grafana
        target: /var/lib/grafana
    ports:
      - "3000:3000"

volumes:
  prometheus:
    driver: local
    driver_opts:
      type: none
      o: bind
      device: /var/www/ghost-docker-compose/prometheus/data
  grafana:
    driver: local
    driver_opts:
      type: none
      o: bind
      device: /var/www/ghost-docker-compose/grafana

添加DataSource

我们先进行 data Source 的添加

20201114112415

关于 Access 的选择

访问模式控制如何处理对数据源的请求。如果没有其他说明,则 Server 应该是首选方式。
服务器访问模式(默认):
所有请求都将从浏览器发出到Grafana后端/服务器,后者再将请求转发到数据源,从而避免可能的跨域资源共享(CORS)要求。 如果选择此访问方式,则需要可以从grafana后端/服务器访问该URL。
浏览器访问模式:
所有请求都将从浏览器直接向数据源发出,并且可能会受到跨域资源共享(CORS)的要求。 如果选择此访问方式,则需要可以从浏览器访问URL。

导入图表-可视化查看

20201114112358

然后我们需要 import 一个图表对数据进行可视化,但是图表从哪里来呢?官方已经有很多图表,所以我们需要找到合适自己的图表,并记录下他们的图表 ID 这样我们就可以远程加载了。

20201114112337

这边给大家找了一个 ID: 11600

20201114112322

选择我们上个步骤添加的数据源,这样就可以看到 Cadvisor 收集的信息啦

20201114112250

您的支持是对我最大的鼓励!

发表于: 作者:憧憬。
关注互联网以及分享全栈工作经验的原创个人博客和技术博客,热爱编程,极客精神
Github 新浪微博 SegmentFault 掘金专栏