西班牙马德里,3月16日:西班牙政府正努力阻止新冠病毒在马德里的传播态势。照片中,一位佩戴口罩及手套的女性正在Atocha火车站的自动扶梯上观看手机。截至目前,马德里已经至少确诊3544例COVID-19感染病例,其中至少213人死亡。西班牙政府已经宣布进入紧急状态,并准备封闭整个西班牙以阻止病毒流入。
COVID-19(新冠病毒)的快速传播已经在全球范围内引发疫情大流行,诸多城市处于封闭状态,各国政府也已经进入危机模式。现在,各个行业的从业者只能选择居家办公,而我们的IT框架又该如何适应这种新的“数据流形式”?有报告指出,微软团队在欧洲遭遇到“与消息收发相关的功能问题”。如果软件巨头都身陷困境,云骨干网络又要如何在持续增加的压力之下继续维持运转?
时至今日,我们已经生活在一个始终以移动为中心、云原生程度持续提升的新世界当中。在这个世界里,对数据服务的访问能力已经成为业务发展的前提性保证。因此,除了恐慌性的物资采购之外,我们也有理由将目光投向负责提供中央数据基础设施的云数据中心,思考它们要如何在这场浩劫中继续保持坚挺。
配置程序
在疫情蔓延的背景之下,我们当然有必要在数据中心配置领域引入新的关注重点,这就是驱动设施运作的两大要素:技术要素,与人力要素。
从技术层面来看,数据中心配置主要体现为“服务器资源”基础的筹备,旨在保证我们拥有充足的处理能力、内存/存储容量、网络连接性(对接的网关应该具备足以就会数据输入/输出需求的带宽)以及充足的辅助性服务(例如大数据分析引擎等)。只有配置牢固稳定,才能满足用户越来越多的智能服务需求。
有时候,我们还得移动数据以应对可能出现的数据需求峰值;有时候,我们需要将数据与应用程序放置在能够更高效、更经济地交付数据的位置……而最终,我们早晚需要购买新的服务器单元,数据中心的总体规模也将随之持续扩展。
而从人力角度出发,数据中心配置则涉及规划程序,用以确保机构内的工作人员能够在疫情影响下继续有效完成工作。包括Interxionx在内的不少数据中心专业企业已经在设施中推出“休息舱”等各类小型居住设施。不过考虑到疫情爆发仍将持续数月,因此立足中长期,这类方案的实用性仍然有待观察。
数据瓶颈
如果能够远程办公的群体开始大规模推广这种新型工作方式,那么全世界的IT网络应该能够在疫情影响下保持正常运转。毕竟单从理论角度来看,我们只是将数据流量从办公室转移到家庭或者其他区域。微软团队在欧洲遇到的功能问题也将很快得到解决——毕竟问题的根源在于数据加载瓶颈,而非出于应用程序本身存在的任何深层次架构缺陷。
但必须承认的是,要继续保持正常的原有数据交换量,网络连接性必须得到快速提升。换句话说,互联网服务供应商(ISP)可能需要直面只属于自己的难题。其他连接与协作应用程序(包括WhatsApp、Skype、Slack、Zoom以及WebEx等)可能也会迎来负担提升,不过好在他们的核心数据流将由云端承载,因此应用程序本体受到的冲击不算太大。总而言之,数据峰值必然出现,只是对各个区域的具体压力有所区别。
这并不是说云计算中的一切仍将如常运转,因为要想为来自更多位置、更多应用程序的更多用户提供更高的数据吞吐量,就必须设置更多数据库,而安全风险也将随之提升。如果把数据中心看作一部音响,我们不可能把云负载的音量开到最大,又天真地指望其不会引发丝毫失真、噪声振动甚至是暂时性失聪等风险。
关于COVID-19疫情期间的云容量问题,Amazon Web Services(AWS)最近发表声明称,其有信心满足客户在这段特殊时期下的容量需求。尽管如此,也有其他报告指出,由于病毒的持续爆发,亚马逊的Prime基础设施(供应链终端配送侧)已经开始面临巨大压力。
Eric Troyer是总部位于澳大利亚的网络即服务(NaaS)供应商Megaport公司的CMO。Troyer强调称,不少数据中心运营商实际上已经开始启用具有军事背景的技术人员与现场操作人员。
之所以选择这种方案,是因为具有军方背景的人员在服役期间拥有更严格的行动纪律。有趣的是,早在H1N1非典疫情爆发期间,就已经有多家数据中心运营商在关键位置部署全天候待命的专职个人,旨在减少基础设施的外来人员数量。在整个疫情周期内,内部卫生已经成为核心要点,各家运营商也采取一系列措施以确保医疗团队在保障人员健康的同时,遏制病原体的传播能力。
Troyer认为:随着越来越多的企业要求其员工在家中办公,使用Slack与Teams等协作工具必然会对住宅宽带服务供应商提出资源挑战。此外,他也建议在新冠病毒流行的当下推广云基础设施与平台技术(IaaS及PaaS),帮助普通员工在家中访问公有云环境中运行的业务应用程序。Megaport公司报告称,他们已经在过去几周内与客户开展多轮“对话”,讨论如何设计并扩展容量以满足需求。
英国Interxion公司执行董事Andrew Fray表示,他们正准备进入COVID-19的应对“阶段”,意味着管理人员将开始部署远程办公方案,并为危机条件下的设施充分运行做好充分准备。他指出,数据中心运营商在各个司法辖区内必须遵循当地政府提出的指导方针,同时尽可能为跨国客户提供规程一致性方案。
最“云”的云,也离不开人力
Fray表示,“虽然很多客户已经具备远程管理工作负载的能力,但数据中心的本质仍是一座物理实体,即使最「云」的云也需要人力进行服务器重启与布线。因此,我们有必要回顾混合云计算为什么能够得到广泛认可与支持。混合云代表的是以灵活按需方式增加及减少(纵向及横向规模伸缩)数据处理与存储的容量及选项。随着危机的加深,云计算行业面临的最大挑战,在于如何在任意时间/地点交付这种容量与选项。”
对于任何一个希望全面实现远程办公的国家来说,Fray表示其首先需要搞定的就是重新评估网络与应用程序设计这项前提性工作。
Fray补充道,“随着成千上万甚至更高数量级的远程工作人员开始从陌生位置接入业务网络,其中将不可避免地出现大量通信瓶颈。面对这种用户极度分散且地处偏远的情况,网络架构与云架构必须通过软件定义网络(SDN)技术处理各类工作负载,以避免所有请求指向同一入口点并对性能造成负面影响。”
自主化的优势
随着新冠病毒的大肆蔓延,我们能否让前几年在头条新闻中大放异彩的自主计算与人工智能(AI)成为新的投疫利器?早在2019年9月,我们就注意到甲骨文公司开始将IT自主层引入其数据库产品以减少人为错误。现在考验来了,这些系统能不能持续自主运行,让工作人员安心在家中自我隔离、多喝热水?
开源文档数据库厂商Couchbase公司产品与解决方案营销副总裁Jeff Morris指出,“当前全托管云数据库的优势在于,它们能够在任意位置进行部署与管理,而最终用户几乎不会受到任何影响。幸运的是,凭借强大的基础设计,这些全托管云数据库具备极强的容错性、自动更新、自我修复、弹性扩展能力并提供自动化主动管理功能,能够帮助最终用户摆脱繁琐的运营工作,同时减少数据库基础设施的维护成本。”
疫情当中,是否蕴藏着新的机遇?
虽然在本文中,我们讨论的主要是新冠病毒爆发对数据主干造成的影响。但大家应该可以看到,在疫情的步步紧逼之下,全世界都开始朝着云优先、虚拟化优先的方向快速推进。如今,不需要布道者大费口舌,企业及个人用户也开始切身体会到,键盘直指云端深层IT服务的时代正在来临。
文件协作与数据管理厂商Panzura公司CEO Patrick Harr表示,“我坚信,无论是疫情大流行、9/11事件还是其他大规模自然灾害,业务的正常运转都将成为高优先级事项。而作为业务连续性的基础,系统必须允许人们随时随地实现远程工作。这种体验将为云优先时代与SaaS优先时代带来更强大的推动力,并以企业固有架构组成部分的形式给传统数据中心带来不容忽视的冲击。”
因此,至少从计算层面来看,云计算有望经受住COVID-19病毒的考验。剩下的唯一问题就是,你经受得住吗?所以,请记得勤洗手、多通风,咱们疫情后见!