最大的单集群OpenStack公有云生产环境
2016年底,建成最大的OpenStack公有云平台之一
2017年5月,建成最大的OpenStack私有云平台之一
……
几个月前,当中国移动在OpenStack Days China上首次公布其OpenStack应用实践与规划时,恐怕很多人跟我一样吃了一惊!作为全球最大的电信运营商,没想到它在OpenStack领域已经默默做了如此多工作,并成绩斐然,着实令人意外。正所谓“船大难掉头”,从另一方面也看得出中国移动对公司战略转型的决心,而不甘于做“管道服务商”,其要在IT领域具备核心能力。
为什么说是最大的单集群OpenStack公有云生产环境?中国移动目前已经上线了位于广州和北京的两个集群,单机房1000个节点,共计2000个节点。并且,其还正在全国其他地区部署4000台服务器,到2016年底,将完成4个集群共计6000个节点规模的公有云建设。
除了公有云之外,到2017年5月,中国移动还计划建成最大的OpenStack私有云平台之一,第一阶段建成位于哈尔滨和呼和浩特的两个数据中心,每数据中心3000节点,共计6000节点。
毫无疑问,中国移动的OpenStack大规模部署实践在全球的应用案例中也算得上比较靠前的。它部署OpenStack的背后有哪些故事,近日ZD至顶网记者到访了中国移动苏州研发中心,中国移动OpenStack的研发、落地也正是源于这里——中移(苏州)软件技术有限公司。
从OpenNebula到OpenStack的决心
其实,中国移动最早启动类似于IaaS技术的研发工作并非采用OpenStack,而是OpenNebula。回顾中国移动的技术架构演进,中移(苏州)软件技术有限公司副总经理孙少陵表示,移动“大云”自2009年起基于OpenNebula开始研发,历经1.0/2.0两个版本,自2013年才开始采用OpenStack架构研发,并分别于2014年和2015年发布基于Icehouse版本的BigCloud3.0和基于Kilo版本的BigCloud4.0。
中移(苏州)软件技术有限公司副总经理孙少陵
在2011年前后,中国移动在OpenNebula的贡献度已经是全球最多,因为投入大量的技术研发,也已经变成了OpenNebula的一个标杆。
2013年,中国移动转而选择OpenStack是一个艰难的过程,因为已经投入研发了三、四年的产品突然要放弃,这需要一个巨大的决心,而OpenStack表现出来的影响和价值让其没有犹豫的时间,也正是因为基于对未来的判断,中国移动毅然选择了OpenStack。
由于这样的历史原因,中国移动的OpenStack有自己的独特特点,一是要对两个异构的集群,即OpenStack的集群和原来在OpenNebula的集群统一管理,孙少陵说,原来有超过1000台服务器是跑在OpenNebula基础之上。二是也要对下层许多的虚拟化解决方案如KVM、VMware等进行统一管理,这意味着对于原生的OpenStack需要进行大量的应用开发与测试工作,“中国移动用了大概一到两年的时间,在这个领域积累了大量的经验,也突破了很多困难。”
另外在中国移动的私有云方面,因为它要承载中国移动未来全部的IT支撑系统和内部业务系统,所以它也是全球业务最复杂,对系统的可靠性、安全性要求最高,也是规模最大的私有云系统之一。同时,整个私有云不仅要支持虚拟化的资源,同时也要向用户分配物理机,能够灵活管理物理机。
在此方面,中国移动苏州研发中心又取得了多个“第一”的成绩:最大的规模的ironic用户案例,共计4500裸机服务节点;第1个大规模manila用户案例,数百节点;第1个大规模senlin用户案例,数千虚拟机。
源于复杂的业务需求,中国移动苏州研发中心投入了大量的精力和人力开发OpenStack。三年多的时间,苏研已快速形成研发能力。并且目前,中国移动在OpenStack社区中Mitaka版本的贡献度排名第47位,不断地把经验反馈给社区。
创新OpenStack上的SDN软硬混合管理
中国移动的OpenStack实践不只体现在大规模上,还具有许多创新性,例如其私有云搭建在SDN的软件网络上,这是第1个ironic、manila集成基于软硬件结合SDN方案用户案例,孙少陵说,这个SDN是一个软硬混合的解决方案,在全球没有先例。
为什么是软硬混合的SDN?中国移动在推广云计算时发现一个很尴尬的问题,早期部署的两三千台服务器做虚拟化,但大部分的IT系统却跑不上去,因为原来很多系统是基于小型机部署。孙少陵举例,“以中国移动的BOSS系统来说,大多用IBM最高端的小型机搭起来,还有Oracle最大规模的数据库,可能还得分库,一个小的数据库分成5、6个,所以这种情况下用虚拟化是不现实的。”
中国移动提出云计算平台必须支持物理机,但不是传统方式,传统方式给客户分配一个物理机,无法对其进行监控和管理,用户也没有自服务权限。现在ironic能够做到对物理机的管理和虚拟机类似,用户可以自服务地订购、退订、开机、停机,也可以对资源进行有效分配、回收等。这也是为什么中国移动6000台服务器中有4500台物理机的原因。
混合环境带来的问题是,既有软件的交换系统、又有硬件的交换系统,还要进行统一管理,系统之间如何进行互通和资源调配?原来OpenStack没有人解决过这个问题,OpenStack早期更关注的是虚拟资源的管理,中国移动在软硬混合SDN的探索,对未来整个OpenStack的发展起到很重要的作用。
在明年5月,中国移动将建成私有云和公有云共计12000节点、也将是最大规模的SDN应用案例。
中国移动苏州研发中心数据中心
联合合作伙伴提升OpenStack性能
“在对OpenStack一路探索过程中,英特尔是我们很重要的一个伙伴。”孙少陵指出,双方不仅仅是在整个技术发展方面的研讨;同时,在整个研发的过程当中,包括像刚才提到的对于Ironic的功能完善和优化等,中国移动与英特尔联合做了很多的开发工作,并且英特尔也联合社区,回馈给我们很多这个领域的成果。
在OpenStack大规模系统测试方面,苏研和英特尔的合作取得了比较重要的成果。中国移动公有云在北京1000个节点部署完成后,双方开始了对OpenStack的性能测试和提升上,也就是考验OpenStack到底能做到多好。
孙少陵强调了两个测试用例:第一,2000个并发创建虚机去考验Nova性能到底能达到一个什么样的水平。最开始,原生的系统部署上以后测试结果不理想,成功率只有58.4%,这对中国移动在电信级系统上是不可想象的。之后,中国移动和英特尔一起做了大量的优化工作,最后我们把它提升到99.9%。第二,Nova性能达标之后,去考验OpenStack对外部请求的处理能力。最开始原生系统也只能达到每秒1.78个请求的水平,双方经过优化以后提升了3倍,到每秒5.49个请求。
这给OpenStack上千台物理机上的可伸缩性、可扩展性、动态扩容性和大规模服务能力,提供了一个很好的例证。
小结
有了OpenStack大规模在建案例和在实践中积累的经验,中国移动积极拥抱OpenStack,并基于此构建完整的云计算产品体系和云平台。通过构建新型IT架构,苏研致力于提升公司IT自主创新和自主研发能力,助力集团公司战略转型。
同时,中国移动正在准备申请OpenStack黄金会员,并正在加大回馈社区的支持力度。在将要举办的OpenStack巴塞罗那峰会上,中国移动也在积极申请OpenStack Superuser,说不定届时会是一个惊喜!