项目背景
中免日上互联科技有限公司是中国免税品集团(简称:中免集团)携手日上免税行打造的顶级品牌零售电商平台。平台秉承“以用户信任为基石、为用户创造价值为核心”的经营理念,坚守正品行货、倡导品质消费、持续创新、不断为用户和合作伙伴创造价值,努力构建全球时尚和奢侈品零售生态体系。 中免日上正成为国内外顶级品牌开拓中国市场的重要合作伙伴。
目前中免日上核心电商系统部署在阿里云上海区域。随着阿里云近期暴露的大规模服务中断,中免日上对阿里云的基础设施底层设计以及服务的高可用性和稳定性存在顾虑。客户倾向于寻找更稳定的云来保证业务连续性。同时,阿里云在数据保护和合规方面的不足也促使客户寻找一家能提供更高安全合规要求的云供应商。业务层面,中免日上主要业务是在国内销售海外进口免税品,与阿里集团旗下业务有重叠。
本次项目新钛云服协助中免日上从阿里云上海区域迁移部署电商平台前端应用到AWS宁夏区域。整个迁移过程涵盖云架构设计、POC验证、迁移、部署及后续的持续技术咨询服务。
本次项目为一期建设阶段。本次建设包含需求分析、架构设计、落地实施以及项目验收等。
项目需求分析
本次需要迁移电商前端服务到AWS,迁移前需要详细了解中免日上在阿里云上的资源使用情况、业务部署架构;梳理业务模块,了解数据使用量等诸多信息。
电商平台前端业务系统
-
WAF 网络应用防火墙
-
MSE微服务网关
-
K8S集群
-
ACR容器镜像服务
-
PTS压测
-
DCDN全站加速
-
Linux服务器等
业务可观测
业务监控需要进行可观测展示,包括Prometheus监控、Grafana展示、云监控进行配置和调整。需要依据告警级别通过不同的方式发送告警,例如邮件、飞书等。需要对监控告警方案调研、验证功能以及给客户演示是否满足需求。
日志系统
中免日上目前使用阿里云SLS托管日志服务,客户本次迁移的生产服务器预计80台左右,为了使客户顺利的迁移到AWS需要解决客户应用日志收集的需求,计划采用LogHub的方案实现。中免日上有较多的业务应用日志,需要对各个业务日志收集流水线进行调试。
DevOps
中免日上采用自建Jenkins服务器进行CICD流水线发布。需要进行流水线改造适配AWS环境来保证前端业务能够顺利发布。
业务架构图
基础设施的设计
-
VPC设计:生产环境VPC用于容纳生产环境,开发和测试VPC独立于生产环境VPC;
-
子网设计:根据安全分区要求,分为公有子网、私有子网、DB子网;公共子网(DMZ)部署面向公网访问服务器,VPC、NAT Gateway、堡垒机和ELB等;私有子网(External)部署只允许通过NAT Gateway访问外网的应用服务器;私有子网(Internal)部署只允许内部访问且无外网访问需求的服务;
-
资源选型设计:实例类型、操作系统、EBS类型、IOPS;
-
IAM:研发、运维、管理等部门创建IAM用户和用户组,遵循最小权限策略赋予对应的权限;开启强制设置MFA多因子认证;
-
定义NACL:控制所有子网层面的进出流量;
-
定义安全组:控制所有实例层面的进出流量;
-
开启CloudTrail记录资源的操作记录,可追溯性;
迁移方案的设计
-
MSE微服务网关在AWS上的实现需要进行PoC;
-
WAF托管规则需要在AWS WAF上进行PoC,利用AWS WAF实现基于IP速率的访问控制、SQL注入防护、反爬虫、恶意机器人等功能;
-
阿里ACK容器集群和镜像需要通过部署AWS的EKS集群和ECR镜像来进行迁移;
-
日志收集方案计划采用AWS Loghub解决方案集中式进行日志搜集,帮助客户在单个控制面板收集、分析和显示。同时可以整合来自不同来源的日志文件,收集来自Cloudfront、ELB、EC2应用日志文件;
-
监控告警方案的设计,客户使用习惯需要依据告警级别将警报发送至不同的SNS,以触发不同的告警方式来接受来自不同资源的告警,例如:CPU、内存、CPU利用率、网络IO等。
验收标准
对于本次项目的验收标准,是以在与客户互相确认通过的迁移计划中所列出的每个阶段时间节点内完成的工作安排以及针对本阶段用于验收的交付物进行评审、评估和测试。在确定每个交付物满足特定交付的验收标准,并客户在书面验收上进行确认,已完成整个验收过程。在交付物在客户验收期内不能满足或者不符合,由项目经理进行双方沟通并确定在所要求的范围内进行纠正不符合项,以使交付物达到和满足验收标准。达到验收标准后,双方确认项目验收报告并签字。
迁移项目WBS
No
|
Work item
|
Work Item description
|
Resources
|
Completeion date
|
Working hours
|
1
|
Planning phase
|
|
|
|
27
|
1.1
|
项目管理
|
筹备召开项目启动会议、确定沟通管理、质量管理等项目管理机制
|
彭凯
|
2022/4/28
|
2
|
1.2
|
项目分析
|
对阿里云资源梳理及分析形成文档
|
徐磊
|
2022/5/5
|
8
|
1.3
|
业务分析
|
梳理客户现有业务流程,根据客户提供的信息产出需求文档等
|
徐磊
|
2022/5/5
|
7
|
1.4
|
资产分析
|
当前业务运行时资源消耗进行分析,包括资源利用率,峰值数据等
|
祝祥
|
2022/5/2
|
6
|
1.5
|
迁移评估
|
完成项目需求评估报告
|
徐磊
|
2022/5/6
|
4
|
2
|
Desgin Phase
|
|
|
|
73
|
2.1
|
方案设计
|
根据需求分析报告以及AWS最佳实践设计aws平台架构,包括完了架构、系统架构、安全架构,充分考虑业务的稳定性、可靠性、安全性和可扩展性
|
徐磊
|
2022/5/9
|
8
|
2.2
|
成本分析
|
迁移后成本分析
|
于子琪
|
2022/5/8
|
4
|
2.3
|
迁移设计
|
设计项目迁移计划,包括sow、变更管理、风险管控、沟通计划等
|
徐磊
|
2022/5/11
|
5
|
2.4
|
安全规范
|
对本次迁移设定安全规范
|
祝祥
|
2022/5/10
|
5
|
2.5
|
项目管理
|
规划设计沟通会
|
彭凯
|
2022/5/12
|
3
|
2.6
|
网络设计
|
VPC设计,gateway设计等网络设计
|
于子琪
|
2022/5/16
|
4
|
2.7
|
网络/系统安全
|
网络和系统安全设计
|
祝祥
|
2022/5/17
|
4
|
2.8
|
业务方案设计
|
前端业务方案设计
|
徐磊
|
2022/5/19
|
8
|
2.9
|
监控方案设计
|
监控方案设计
|
夏超
|
2022/5/15
|
5
|
2.10
|
日志方案设计
|
日志方案设计
|
祝祥
|
2022/5/19
|
5
|
2.11
|
CI/CD方案设计
|
CI/CD 方案设计
|
夏超
|
2022/5/17
|
7
|
2.12
|
测试方案设计
|
根据迁移计划设计测试方案,包含测试用例、边界数据等
|
徐磊
|
2022/5/19
|
7
|
2.13
|
服务培训计划
|
针对该项目完成服务培训计划
|
徐磊
|
2022/5/19
|
5
|
2.14
|
项目管理
|
方案计划确认沟通会
|
彭凯
|
2022/5/19
|
3
|
3
|
Deployment Phase
|
|
|
|
92
|
3.1
|
基础环境
|
基础环境搭建完成
|
于子琪
|
2022/5/23
|
5
|
3.2
|
网络部署
|
网络部署及测试
|
于子琪
|
2022/5/25
|
5
|
3.3
|
安全环境
|
安全组件部署及测试
|
祝祥
|
2022/5/26
|
5
|
3.4
|
CI/CD环境
|
流水线服务部署及测试
|
夏超
|
2022/5/30
|
5
|
3.5
|
项目沟通
|
基础环境部署沟通会
|
彭凯
|
2022/5/31
|
2
|
3.6
|
容器迁移
|
容器镜像迁移部署
|
夏超
|
2022/6/2
|
6
|
3.7
|
数据库迁移
|
阿里自建实例迁移至 Amazon RDS
|
祝祥
|
2022/6/6
|
5
|
3.8
|
缓存迁移
|
阿里自建实例迁移至 Amazon Elasticache
|
祝祥
|
2022/6/8
|
5
|
3.9
|
消息迁移
|
阿里自建MQ迁移至Amazon MQ
|
徐磊
|
2022/6/12
|
7
|
3.10
|
数据迁移
|
S3文件数据迁移
|
徐磊
|
2022/6/2
|
5
|
3.11
|
数据校验
|
数据迁移完整性校验
|
徐磊
|
2022/6/14
|
7
|
3.12
|
项目沟通
|
数据迁移沟通会
|
彭凯
|
2022/6/16
|
2
|
3.13
|
日志服务部署
|
OSS 部署及可视化定制
|
祝祥
|
2022/6/20
|
7
|
3.14
|
监控服务部署
|
监控部署及告警集成
|
夏超
|
2022/6/21
|
7
|
3.15
|
连通测试
|
对整个系统做联通性测试,确认各组件通信正常
|
夏超
|
2022/6/22
|
5
|
3.16
|
基础测试
|
对整个系统做集成性测试,确认功能正常
|
徐磊
|
2022/6/23
|
5
|
3.17
|
测试报告
|
完成迁移系统测试报告
|
徐磊
|
2022/6/28
|
7
|
3.18
|
项目管理
|
项目进度更新,沟通管理和反馈,变更记录和通报
|
彭凯
|
2022/6/30
|
2
|
4
|
Review phase
|
|
|
|
69
|
4.1
|
业务测试
|
协助客户完成内部业务测试
|
于子琪
|
2022/7/7
|
5
|
4.2
|
业务切换
|
数据采集切换
|
徐磊
|
2022/7/8
|
3
|
4.3
|
完整性测试
|
业务流完整性测试
|
夏超
|
2022/7/14
|
5
|
4.4
|
项目管理
|
系统切换沟通会
|
彭凯
|
2022/7/14
|
2
|
4.5
|
测试报告
|
验收测试报告
|
徐磊
|
2022/7/17
|
5
|
4.6
|
运维管理
|
日常运维
|
于子琪
|
2022/7/21
|
10
|
4.6
|
优化分析
|
负载分析
|
徐磊
|
2022/7/21
|
5
|
4.7
|
优化配置
|
配置优化
|
于子琪
|
2022/7/21
|
5
|
4.8
|
运维手册
|
运维手册
|
夏超
|
2022/7/24
|
7
|
4.9
|
培训手册
|
培训材料
|
徐磊
|
2022/7/24
|
7
|
4.10
|
项目管理
|
项目验收沟通会
|
彭凯
|
2022/7/24
|
2
|
4.11
|
项目培训
|
项目培训
|
徐磊
|
2022/7/28
|
8
|
4.12
|
项目验收
|
项目验收报告
|
彭凯
|
2022/7/31
|
5
|
新钛云服项目团队资源分配矩阵
Project Phase
|
PM
|
SA
|
SAP
|
Engineers
|
总计
|
规划
|
2
|
0
|
25
|
0
|
27
|
设计
|
6
|
0
|
67
|
0
|
73
|
实施
|
6
|
0
|
86
|
0
|
92
|
验证
|
9
|
0
|
60
|
0
|
69
|
总计
|
23
|
0
|
238
|
0
|
261
|
项目实施过程可交付成果
序号 |
可交付成果 |
时间节点 |
1 |
整体方案概览 |
2023/5/9 |
2 |
成本分析报告 |
2023/5/8 |
3 |
系统迁移方案 |
2023/5/11 |
4 |
安全设计方案 |
2023/5/16 |
5 |
网络设计方案 |
2023/5/17 |
6 |
监控设计方案 |
2023/5/15 |
7 |
日志设计方案 |
2023/5/19 |
8 |
CI/CD 设计方案 |
2023/5/17 |
9 |
实施方案 |
2023/5/19 |
项目收益
新太云服实施团队在项目执行过程严格按照项目管理计划所执行,最终按照客户预期完成一期迁移项目。
AWS多年来的行业经验能够满足电商企业在国内和全球化部署时更高的安全合规要求。同时,AWS平台能够灵活地选择资源的购买方式,动态调整使用资源,可以满足某些资源用量突增或者临时需要快速对服务器升配的需求;并且在存储、带宽以及成本优化方面帮助用户节约成本。总结收益为以下几点:
-
成本优势。AWS的云服务定价更加灵活和优惠,特别是对于大容量和高配置的用户。迁移到AWS可以降低整体基础设施成本,提高运营效率
-
更丰富的服务。AWS提供超过165种云服务,涵盖计算、存储、数据库、网络、分析、机器学习、物联网等领域。
-
更高的安全性。AWS作为全球公认的云服务安全领导者,在数据保护、网络安全、风险管理等方面具备更强的技术实力和丰富的经验。迁移到AWS可以更好保障电商平台业务的安全稳定运行
-
更优的业务连续性。AWS可提供跨区域的业务持续性解决方案,确保业务在区域间快速恢复和中断迁移,最大限度减少对终端用户的影响
-
更丰富的合作伙伴。AWS丰富的合作伙伴生态系统,可以为电商平台提供各类应用程序、工具软件和服务。这有利于平台拓展第三方服务,丰富用户体验。