面对上万台云主机环境,如何对其进行管理才能实现高效安全的运维?这篇“万台云主机环境下的运维管理之道”可以为您找到答案。

企业痛点

 

客户是国内著名的企业级区块链解决方案和服务提供商。客户的云资源部署在某公有云上,在全球各大主要Region均有分布,总数达数万台规模。

客户希望能够采购一套轻量级运维管理平台,解决数万台云主机的高效和安全运维的需求

 

解决方案

 

通过深入分析客户场景,我们提出了以新钛云服自研TiOps作为解决方案的核心组成部分,实现在大规模云主机场景下高效和安全运维的目标。

一、TiOps部署架构设计

新钛云服为客户设计的TiOps部署架构如下图所示:

    
图1:TiOps部署架构图

 

二、TiOps架构设计要点

 

1、全球分布式部署架构

因客户云主机遍布在全球各区域,为解决网络连通性的挑战,并提高运维作业的分发效率和成功率,我们设计和部署了全球分布式架构。

在各区域内使用Agent+Proxy模式,将运维操作产生的主要工作量集中到该区域内部,减少网络传输成本,提高执行效率和成功率。

 

2、全动态CMDB构建与更新

客户在使用云主机过程中,急切需要一套CMDB,提供对云上资源的动态监控,实现云上资源的同步更新。

新钛云服TiOps多云管理和CMDB模块完全满足客户对资产管理和更新的需求。TiOps多云管理模块通过对接云API实时监控云上资源的变化,自动对接CMDB功能,实现资产的全动态构建和实时更新,让客户实时掌控基础设施资产。

图2:TiOps对接主流公有云

图3:TiOps CMDB管理模块

 

3、作业编排实现全自动化运维

新钛云服TiOps作业编排模块,将客户复杂的运维操作定义为一系列具备条件判断能力的顺序执行作业。

图4:TiOps 作业编排模块

 

客户收益

 

一、优化的总体拥有成本

新钛云服TiOps具有轻量级、部署方便、支持大规模分布式部署、学习成本低的优势,有效的降低了客户的总体拥有成本(Total Cost of Ownership,TCO)。

 

二、实现了云基础设施的高效运维

新钛云服TiOps自动化对接公有云API,实现资产的自动化资产管理和自动化运维管理,极大的解决了手工运维操作的人工成本,数十倍的提高了大规模云基础设施环境下的运维效率。

 

三、增强的安全性

新钛云服TiOps自带堡垒机功能,进一步增强了整体安全性,助力保障了客户数字资产。

 

关于新钛云服

新钛云服是国内领先的专业云管理与安全服务商,致力于以按需付费的云管理与安全服务为用户赋能,帮助客户以一个人力的成本、一周的时间,建立起到达成熟互联网公司级别的运维和安全平台与服务能力。

新钛云服拥有优秀的技术专家团队,公司成员中技术人员占比80%以上,核心成员来自盛大、腾讯、华为、IBM、金山等知名企业,在互联网技术架构、云计算产品和解决方案领域有丰富的实践经验。

 

新钛云服拥有丰富的资源,与国内外公有云、链路以及IDC供应商建立深度合作关系,在北上广建立云互联POP点,推出多云及自动化运维管理平台。