自我介绍 - itdks.su.bcebos.com

33

Upload: others

Post on 16-Oct-2021

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 自我介绍 - itdks.su.bcebos.com
Page 2: 自我介绍 - itdks.su.bcebos.com

自我介绍

n 姓名: 刘亮

n 部门: ops-dev

n 介绍: 硬件运维开发

Page 3: 自我介绍 - itdks.su.bcebos.com

目录

1 背景概述

2 工作阐述

3 具体介绍

4 总结回顾

5 后续安排

Page 4: 自我介绍 - itdks.su.bcebos.com

一、背景概述

Page 5: 自我介绍 - itdks.su.bcebos.com

硬件是啥?

Page 6: 自我介绍 - itdks.su.bcebos.com

更细的粒度!

Page 7: 自我介绍 - itdks.su.bcebos.com

痛点&难点工作内容繁琐上架,搬迁,装机...

工作量大1W+台/人

硬件质量不可控新机器故障

故障处理效率低异常发现,过滤,日志收集

人肉运维风险大ssh/telnet/..

硬件性能没把握硬件性能数据空白

Page 8: 自我介绍 - itdks.su.bcebos.com

自动化&智能化

Page 9: 自我介绍 - itdks.su.bcebos.com

宗旨

Page 10: 自我介绍 - itdks.su.bcebos.com

二、工作阐述

Page 11: 自我介绍 - itdks.su.bcebos.com

核心-硬件生命周期

选型测试

故障处理

数据采集

到货上架

报废下架

硬件

Page 12: 自我介绍 - itdks.su.bcebos.com

生命周期管理

Page 13: 自我介绍 - itdks.su.bcebos.com

三、具体介绍

Page 14: 自我介绍 - itdks.su.bcebos.com

预备知识

nagios

watcheropsdb

deploy

gitlab

Related Platform

关联平台

Page 15: 自我介绍 - itdks.su.bcebos.com

详细介绍 - erWatcher

Page 16: 自我介绍 - itdks.su.bcebos.com

详细介绍 - erOpsdb

Page 17: 自我介绍 - itdks.su.bcebos.com

总体架构

Page 18: 自我介绍 - itdks.su.bcebos.com

Walle & NetSpider

Page 19: 自我介绍 - itdks.su.bcebos.com

服务器平台-walle

Page 20: 自我介绍 - itdks.su.bcebos.com

平台一览

Page 21: 自我介绍 - itdks.su.bcebos.com

当前收益

Page 22: 自我介绍 - itdks.su.bcebos.com

平台一览

Page 23: 自我介绍 - itdks.su.bcebos.com

实现难点

硬件配置格式统一 定制抓取工具 格式化规则集

信息100%cover 两套抓取系统互补 及时变更+主动同步 watcher数据断线监控

Page 24: 自我介绍 - itdks.su.bcebos.com

网络设备平台-netspider

Page 25: 自我介绍 - itdks.su.bcebos.com

平台一览

Page 26: 自我介绍 - itdks.su.bcebos.com

实现难点

硬抓取弹性线性扩展 多目标抓取docker实例

自动HA Marathon+Mesos

异步任务调度 Celery拆分独立模块

Page 27: 自我介绍 - itdks.su.bcebos.com

四、总结回顾

Page 28: 自我介绍 - itdks.su.bcebos.com

Before VS. Now

选型靠读文档 到货人工核查 故障人肉报修 配置变更跑命令 故障率分析空白

选型性能自动采集分析对比报告

到货一体化检测 故障自动报修追踪 硬件配置一键变更 故障率分析发现批次

问题

Page 29: 自我介绍 - itdks.su.bcebos.com

当前收益

1. 节省大量的运维人力

1. 逐渐去人肉运维2. 操作可审计可追踪3. 数据可视化

1. 质量数据可视化2. 售后服务自动追踪3. 确保安全的硬件交付

1. 到货检测自动化2. 故障报修自动化

成本降低

风险可控

质量可靠

效率提高

Page 30: 自我介绍 - itdks.su.bcebos.com

当前收益

变更自动化快捷安全

数据仓库集中管理

数据抓取方便可靠

1. Netspider配置方便2. Opsdb一键上架下架3. 弹性线性扩容4. 数据准确覆盖全

1. 摈弃人肉操作2. 批量操作快捷3. opsdb一键变更4. 可追踪可审计5. 权限明晰

1. 配件仓库2. AS码管理3. 专线管理4. 任务管理

Page 31: 自我介绍 - itdks.su.bcebos.com

五、后续安排

Page 32: 自我介绍 - itdks.su.bcebos.com

后续安排

到货上架

基于机器学习的自动预警

故障率分析发现批次异常

选型测试

监控 预警

数据分析

优化现有流程更效率 业务定制硬件搭配

Page 33: 自我介绍 - itdks.su.bcebos.com

Q&A