天津大寺网站建设,写作神器 自动生成,如何做家教网站赚钱,汽车门户网站开发网络监控主要包括网络链路监控和网络设备监控#xff0c;通常系统运维人员会比较关注。 
一、网络链路监控 
网络链路监控主要包含三个部分#xff0c;网络连通性、网络质量、网络流量。 
连通性和质量的监控手段非常简单#xff0c;就是在链路一侧部署探针#xff0c;去探…网络监控主要包括网络链路监控和网络设备监控通常系统运维人员会比较关注。 
一、网络链路监控 
网络链路监控主要包含三个部分网络连通性、网络质量、网络流量。 
连通性和质量的监控手段非常简单就是在链路一侧部署探针去探测链路另一侧的目标通过 ICMP、TCP、HTTP 等协议发送探测数据包分析回包的结果。典型的指标有丢包率、延迟、回包是否匹配预期条件等。 
网络流量监控则关注流量大小以及流量内容。流量大小广泛应用于水位管理比如机器网卡、交换机的接口、外网出口、专线带宽等及时发现网络瓶颈。分析流量内容则可以识别过度耗用带宽的用户和应用程序验证网络 QoS 策略等。 
1、ICMP探测 
Categraf 的 ICMP 探测使用 Ping 插件相关配置在 conf/input.ping/ping.toml主要是配置要探测的目标地址。 
[[instances]]
targets  [ 10.4.5.6, 10.4.5.7 ]
labels  { regioncloud, productn9e }[[instances]]
targets  [ 10.4.5.8 ]
labels  { regioncloud, productzbx } 
Ping 插件可以采集到目标是否连通、延迟时间、丢包率等指标可以据此做网络链路的监控。比如机房专线的探测只需要在某个机房部署 Categraf来探测另一个机房的设备。 
2、TCP 探测 
很多时候机器是禁 Ping 的此时 TCP 探测就派上用场了。TCP 探测用的是 Categraf 的 net_response 插件配置文件在 conf/input.net_response/net_response.toml。实际这个插件既可以探测 TCP 的响应也可以探测 UDP 的响应。 
[[instances]]
targets  [10.2.3.4:22,localhost:6379,:9090
] 
原理也很简单就是 Categraf 向目标地址发起网络连接。如果能连通就认为是正常的指标值上报为 0如果失败就是非 0 的值。监控指标名字是 net_response_result_code。 
如果是 UDP 的端口是无法发起连接探测的。此时采用内容匹配探测即通过 UDP 发个字符串给探测目标理论上探测目标很快就会给出回复。我们来检查回复内容如果回复内容包含特定字符串就表示探测目标活着。 
3、HTTP探测 
HTTP 探测和 TCP 的探测逻辑几乎完全一致只不过 HTTP 是七层协议Categraf 可以解析到 Status code、Response body 这些更细粒度的信息。 
[[instances]]
targets  [http://localhost,https://www.baidu.com
] 
很多公司都会在所有的机器上部署 AgentAgent 会开一个 HTTP 端口这样就可以通过探测这些 HTTP 端口知道 Agent 是否存活进而反推机器的存活性。 
HTTP 插件可以对返回的 Response 做规则匹配比如判断 Response body 中是否包含特定的字符串或者 Status code 是否是指定的值等。 
二、网络设备监控 
网络设备监控的典型手段有三个一个是 Ping 监控探测是否存活。另一个是通过 SNMP 获取指标比如各个网口的状态、流量、包量等。最后一个是 SNMP Trap一般网络设备有问题都会发出 Trap 消息这些 Trap 消息很有价值分析这些 Trap 消息是常用且有效的监控手段。 
1、SNMP 指标获取方式 
要采集网络设备的监控指标一定要了解 SNMP 协议。简单来讲就是交换机上有个组件叫 SNMP agent即 snmpd 监听 UDP 161 端口提供查询服务。SNMP manager比如Categraf可以向 SNMP agent 发起查询请求传入的参数是 OIDSNMP agent 返回 OID 对应的监控数据。 
Categraf 提供了 SNMP 插件配置文件在 conf/input.snmp/snmp.toml核心配置就是 SNMP agent 的连接地址以及要采集的 OID 列表。 
2、SNMP Trap 
与 SNMP 采集指标的方式不同Trap 消息是由交换机里的 SNMP agent 发消息给 SNMP manager也是走的 UDP 协议与指标采集的数据流向相反。 用 Trap 机制做事件监控是比较便捷的方式交换机出现关键问题的时候都会立刻发出 Trap 消息。我们只要在 Trap Receiver 中配置消息匹配规则指定什么样的消息应该产生告警即可。但是匹配规则肯定是需要用人类易读的方式这就需要借助 MIB 库把 Trap 中的 OID 翻译成人类易读的字符串。 此文章为8月Day5学习笔记内容来源于极客时间《运维监控系统实战笔记》推荐该课程。