-
AWS助力某游戏公司成功迁移至AWS
项目背景
盛趣游戏前身盛大游戏,是网络游戏开发商、运营商和发行商,立足“科技赋能文化”的新文化产业定位,盛趣游戏全面推进“精品化”、“全球化”、“新文化”三大战略,以科技为骨、文化为翼,用科技激活文化的精髓,致力成为一家打造极致互动体验的科技文化企业。本次项目新钛云服协助盛趣从本地IDC机房区域迁移至AWS公有云。整个迁移过程涵盖云架构设计、POC验证、迁移、部署及后续的持续技术咨询服务。本次项目为一期建设阶段。本次建设包含需求分析、架构设计、落地实施以及项目验收等。项目需求分析
本次需要迁移前端服务到AWS,迁移前需要详细了解盛趣游戏在目前基础设施资源使用情况、业务部署架构;梳理业务模块,了解数据使用量等诸多信息。电商平台前端业务系统
-
WAF 网络应用防火墙
-
MSE微服务网关
-
K8S集群
-
Kubernetes容器镜像服务
-
PTS压测
-
DCDN全站加速
-
Linux服务器等
业务可观测
业务监控需要进行可观测展示,包括Prometheus监控、Grafana展示、云监控进行配置和调整。需要依据告警级别通过不同的方式发送告警,例如邮件、飞书等。需要对监控告警方案调研、验证功能以及给客户演示是否满足需求。日志系统
盛趣游戏目前使用ELK日志服务,客户本次迁移的生产服务器预计80台左右,为了使客户顺利的迁移到AWS需要解决客户应用日志收集的需求,计划采用LogHub的方案实现。盛趣游戏有较多的业务应用日志,需要对各个业务日志收集流水线进行调试。DevOps
盛趣游戏采用自建Jenkins服务器进行CICD流水线发布。需要进行流水线改造适配AWS环境来保证前端业务能够顺利发布。业务架构图
基础设施的设计
-
VPC设计:生产环境VPC用于容纳生产环境,开发和测试VPC独立于生产环境VPC;
-
子网设计:根据安全分区要求,分为公有子网、私有子网、DB子网;公共子网(DMZ)部署面向公网访问服务器,VPC、NAT Gateway、堡垒机和ELB等;私有子网(External)部署只允许通过NAT Gateway访问外网的应用服务器;私有子网(Internal)部署只允许内部访问且无外网访问需求的服务;
-
资源选型设计:实例类型、操作系统、EBS类型、IOPS;
-
IAM:研发、运维、管理等部门创建IAM用户和用户组,遵循最小权限策略赋予对应的权限;开启强制设置MFA多因子认证;
-
定义NACL:控制所有子网层面的进出流量;
-
定义安全组:控制所有实例层面的进出流量;
-
开启CloudTrail记录资源的操作记录,可追溯性;
迁移方案的设计
-
MSE微服务网关在AWS上的实现需要进行PoC;
-
WAF托管规则需要在AWS WAF上进行PoC,利用AWS WAF实现基于IP速率的访问控制、SQL注入防护、反爬虫、恶意机器人等功能;
-
Kubernetes容器集群和镜像需要通过部署AWS的EKS集群和ECR镜像来进行迁移;
-
日志收集方案计划采用AWS Loghub解决方案集中式进行日志搜集,帮助客户在单个控制面板收集、分析和显示。同时可以整合来自不同来源的日志文件,收集来自Cloudfront、ELB、EC2应用日志文件;
-
监控告警方案的设计,客户使用习惯需要依据告警级别将警报发送至不同的SNS,以触发不同的告警方式来接受来自不同资源的告警,例如:CPU、内存、CPU利用率、网络IO等。
验收标准
对于本次项目的验收标准,是以在与客户互相确认通过的迁移计划中所列出的每个阶段时间节点内完成的工作安排以及针对本阶段用于验收的交付物进行评审、评估和测试。在确定每个交付物满足特定交付的验收标准,并客户在书面验收上进行确认,已完成整个验收过程。在交付物在客户验收期内不能满足或者不符合,由项目经理进行双方沟通并确定在所要求的范围内进行纠正不符合项,以使交付物达到和满足验收标准。达到验收标准后,双方确认项目验收报告并签字。迁移项目WBS
NoWork itemWork Item descriptionResourcesCompleteion dateWorking hours1Planning phase271.1项目管理筹备召开项目启动会议、确定沟通管理、质量管理等项目管理机制彭凯2022/4/2821.2项目分析对资源梳理及分析形成文档徐磊2022/5/581.3业务分析梳理客户现有业务流程,根据客户提供的信息产出需求文档等徐磊2022/5/571.4资产分析当前业务运行时资源消耗进行分析,包括资源利用率,峰值数据等祝祥2022/5/261.5迁移评估完成项目需求评估报告徐磊2022/5/642Desgin Phase732.1方案设计根据需求分析报告以及AWS最佳实践设计aws平台架构,包括完了架构、系统架构、安全架构,充分考虑业务的稳定性、可靠性、安全性和可扩展性徐磊2022/5/982.2成本分析迁移后成本分析于子琪2022/5/842.3迁移设计设计项目迁移计划,包括sow、变更管理、风险管控、沟通计划等徐磊2022/5/1152.4安全规范对本次迁移设定安全规范祝祥2022/5/1052.5项目管理规划设计沟通会彭凯2022/5/1232.6网络设计VPC设计,gateway设计等网络设计于子琪2022/5/1642.7网络/系统安全网络和系统安全设计祝祥2022/5/1742.8业务方案设计前端业务方案设计徐磊2022/5/1982.9监控方案设计监控方案设计夏超2022/5/1552.10日志方案设计日志方案设计祝祥2022/5/1952.11CI/CD方案设计CI/CD 方案设计夏超2022/5/1772.12测试方案设计根据迁移计划设计测试方案,包含测试用例、边界数据等徐磊2022/5/1972.13服务培训计划针对该项目完成服务培训计划徐磊2022/5/1952.14项目管理方案计划确认沟通会彭凯2022/5/1933Deployment Phase923.1基础环境基础环境搭建完成于子琪2022/5/2353.2网络部署网络部署及测试于子琪2022/5/2553.3安全环境安全组件部署及测试祝祥2022/5/2653.4CI/CD环境流水线服务部署及测试夏超2022/5/3053.5项目沟通基础环境部署沟通会彭凯2022/5/3123.6容器迁移容器镜像迁移部署夏超2022/6/263.7数据库迁移自建实例迁移至 Amazon RDS祝祥2022/6/653.8缓存迁移自建实例迁移至 Amazon Elasticache祝祥2022/6/853.9消息迁移自建MQ迁移至Amazon MQ徐磊2022/6/1273.10数据迁移S3文件数据迁移徐磊2022/6/253.11数据校验数据迁移完整性校验徐磊2022/6/1473.12项目沟通数据迁移沟通会彭凯2022/6/1623.13日志服务部署OSS 部署及可视化定制祝祥2022/6/2073.14监控服务部署监控部署及告警集成夏超2022/6/2173.15连通测试对整个系统做联通性测试,确认各组件通信正常夏超2022/6/2253.16基础测试对整个系统做集成性测试,确认功能正常徐磊2022/6/2353.17测试报告完成迁移系统测试报告徐磊2022/6/2873.18项目管理项目进度更新,沟通管理和反馈,变更记录和通报彭凯2022/6/3024Review phase694.1业务测试协助客户完成内部业务测试于子琪2022/7/754.2业务切换数据采集切换徐磊2022/7/834.3完整性测试业务流完整性测试夏超2022/7/1454.4项目管理系统切换沟通会彭凯2022/7/1424.5测试报告验收测试报告徐磊2022/7/1754.6运维管理日常运维于子琪2022/7/21104.6优化分析负载分析徐磊2022/7/2154.7优化配置配置优化于子琪2022/7/2154.8运维手册运维手册夏超2022/7/2474.9培训手册培训材料徐磊2022/7/2474.10项目管理项目验收沟通会彭凯2022/7/2424.11项目培训项目培训徐磊2022/7/2884.12项目验收项目验收报告彭凯2022/7/315新钛云服项目团队资源分配矩阵
Project PhasePMSASAPEngineers总计规划2025027设计6067073实施6086092验证9060069总计2302380261项目实施过程可交付成果
序号 可交付成果 时间节点 1 整体方案概览 2023/5/9 2 成本分析报告 2023/5/8 3 系统迁移方案 2023/5/11 4 安全设计方案 2023/5/16 5 网络设计方案 2023/5/17 6 监控设计方案 2023/5/15 7 日志设计方案 2023/5/19 8 CI/CD 设计方案 2023/5/17 9 实施方案 2023/5/19 项目收益
新钛云服实施团队在项目执行过程严格按照项目管理计划所执行,最终按照客户预期完成一期迁移项目。AWS多年来的行业经验能够满足游戏企业在国内和全球化部署时更高的安全合规要求。同时,AWS平台能够灵活地选择资源的购买方式,动态调整使用资源,可以满足某些资源用量突增或者临时需要快速对服务器升配的需求;并且在存储、带宽以及成本优化方面帮助用户节约成本。总结收益为以下几点:-
成本优势。AWS的云服务定价更加灵活和优惠,特别是对于大容量和高配置的用户。迁移到AWS可以降低整体基础设施成本,提高运营效率。
-
更丰富的服务。AWS提供超过165种云服务,涵盖计算、存储、数据库、网络、分析、机器学习、物联网等领域。
-
更高的安全性。AWS作为全球公认的云服务安全领导者,在数据保护、网络安全、风险管理等方面具备更强的技术实力和丰富的经验。迁移到AWS可以更好保障电商平台业务的安全稳定运行。
-
更优的业务连续性。AWS可提供跨区域的业务持续性解决方案,确保业务在区域间快速恢复和中断迁移,最大限度减少对终端用户的影响。
-
更丰富的合作伙伴。AWS丰富的合作伙伴生态系统,可以为电商平台提供各类应用程序、工具软件和服务。这有利于平台拓展第三方服务,丰富用户体验。
-