走出舒适区 都得熬个春晚工程
文|吴俊宇
“集中力量办大事”,这是中国古老而传统的习惯。
这种策略的价值在于,调动一切可调动的资源,凝聚上上下下的士气,打一场毕其功于一役的战争。
春晚,作为互联网企业的“哥德巴赫猜想”,绝对是一家企业组织能力、技术能力的练兵场。
把目光拉到2015年,微信、支付宝、淘宝、百度依次成了春晚红包的发放者。
2020年,现在到了快手时间——快手今年会不会宕机?
可能难免有个几秒钟,但都可以理解,毕竟BAT也都经历过。这就像是成长路上必不可少的磕磕绊绊。春晚不可避免会让企业遭受阵痛,然而阵痛之下,每一次宕机都意味着企业将具备一颗更强大、更成熟的心脏。
每一个越过春晚之门的企业或产品,都会在接下来的1-2年内实现质变。
我曾在《春晚红包宕机史,也是半部中国互联网技术进步史》一文中提到:
春晚流量规模,未来可能正是5G和IoT时代“常规需求”。提前排兵布阵,百利无一害。
因为无论技术架构、组织架构,都会在春晚的磨砺下得到成长。
某种意义上说,春晚战事会让每一个处在青春期的企业、组织走向成熟。
一
走出舒适区
企业容易长时间停留在舒适区内,而不打开视野去挑战一些更难的事情。然而,长期停留在舒适区内容易导致上下怠惰,缺乏战斗力。
哪怕BAT级别的大象都是如此。
AKF公司的初创合伙人马丁.阿伯特在他的《The Art of Scalability》(《架构即未来》)中曾阐述工程师的某种惰性:
工程师天生会对自己能够完成的工作保持过分乐观的态度,如果他们推脱过去能够完成的工作量,这会是一个明显的信号,说明他们自觉生产力下降了。
然而,在技术每天都在进化,流量每天都在扩张的今日。不进步便意味着退步。
纵观过去五年春晚红包战事,会发现每一家企业都是在挑战自己的舒适区——无论是组织舒适区,还是技术舒适区。
2015年春节,腾讯拿下了春晚红包赞助权。
一年前的2014年,微信红包横空出世奇袭珍珠港。对腾讯而言,支付业务绝对是“非舒适区”,过往财付通在和支付宝的竞争屡屡处在下风。
然而,春晚成了转折点。
历经春晚工程后,2015年9月,腾讯FiT成立,“连接人与金融”,整合微信支付和 QQ钱包两大平台,连接用户、商户和金融机构,为14亿人提供金融产品与服务成为了这个部门的任务。2016年以后,腾讯FIT技术逐渐为春节红包构建了一套“多点多活、多地多中心”的分布式交易系统。
2016年支付宝不甘落后中标春晚红包。
对支付宝而言,春晚带来的流量狂潮同样难以承载。
然而,历年观看春晚的人数大约在7亿多,支付宝的年度活跃用户4亿多,至于用户的行为习惯,没有任何参考模型。
每秒亿级的任务是过往双十一从未遇到过的,这种“业务洪峰”传统集中式的架构完全不能承受,云计算的金融技术架构是松耦合、开放协同才能承载。
支付宝内上千个业务、技术预案和完备的应急响应体系支持。业务需要参数化、配置化,满足业务多样性需求,降低客户端版本升级困难带来的冲击。
2016年那年,蚂蚁金服顺势组织架构调整,当时的蚂蚁金服CEO井贤栋在内部邮件中称在“今天的数字化以及未来的物联网时代”,蚂蚁金服将用DT技术和思想去重构金融产品和服务。
2019年的百度抢下了春晚红包。
为支持春晚项目,百度被迫技术进化,让全自动自如扩容缩容,技术体系弹性容器设计,智能调度系统智能感知不同地区资源紧张程度成为日常。
百度一度在在2周内采购到货3000台服务器,还需要运营商资源为百度核心IDC提供近10T带宽和数十个CDN节点等资源。
一年后百度AI体系大一统,原AIG(AI技术平台体系)、TG(基础技术体系)、ACG(百度智能云事业群组)整体整合为“百度人工智能体系”(AI Group、缩写为AIG)。
纵观过去几年BAT在春晚前后的变化就会发现,企业技术架构和组织架构在春晚红包战后的一段时间,都会逐渐进化调整。
组织架构、技术架构乃至企业管理的统一,往往会为接下来的业务扩张打好基础。企业或产品线往往会从青春期走向成熟期。
二
视频的难点
春晚工程就是逼企业走出舒适区的最佳战事。
坦率说,BAT过去几年都经历了宕机,不管是云栖社区还是腾讯云社区,都在事后传授相关经验,讲述自家的宕机故事。
春晚第一次走进视频时代,视频云的难点可以随手数出来。
视频是需要云存储、网络节点等基础设施做支撑的,这就像是一个人不能缺少“骨架”和“血管”。视频云就是背后的“骨架”和“血管”。
视频在用户点击服务时是需要降低延迟的,这就像是一个人的“神经网络”一定要正常。视频云就是背后的“神经网络”。
短视频产品需要提供各种美颜、工具和玩法。这就像是每一个人的“衣服”都不一样,视频云还会为每一个视频产品套上不同的“衣服”。
快手当然也会遇到难题。当然,这是幸福的烦恼。
首先是技术难点。
要储备足够的服务器,置办齐足以应对春晚的基础设施。还需要准备资源充足的CDN。
视频不同于文本,占有带宽比文本大50-100倍。按照快手的用户体量,峰值几亿用户同时观看视频,全国300T所有带宽给到快手使用可能都不够。如何在带宽有限的情况下,保障所有用户的正常体验,这对快手的技术能力提出挑战。
作为短视频社区,相对于其它互联网业务,快手需要海量用户场景下,技术上提供强大的富媒体处理能力,以及高性能可伸缩的AI架构能力。AI技术贯穿全程,内容审核、内容生产、内容分发、内容消费各个环节均应用了AI技术。
产品依赖富媒体能力和AI能力的特点,进一步增加了技术挑战。峰值流量下还要保障正常的短视频、直播、推荐业务正常进行,这对各个业务稳定性都提出了考验。
快手借春晚项目完成了一些技术的改造和积累,比如基础架构上的升级,服务器等基础资源的储备。在春晚的洗礼之下,快手也形成了面向未来的技术架构。
超大规模弹性云调度容灾方案;
超高并发下帐号体系架构和中台;
支撑春晚百倍流量的推荐系统架构;
亿级在线实时互动直播可用性架构;
事实上,在BOSS直聘搜索快手和抖音,会发现双方所处阶段完全不同,招聘重点也不太一样。快手把招聘重点放在了研发工程师、测试工程师、架构工程师等技术人员上。
相反,字节跳动的今日头条和抖音则是放在了广告营销人员这个重点上。
这和两家企业所处的阶段是不一样的。字节跳动处于相对较为成熟的阶段,产品、用户的扩张已经告一段落,营收和变现是当下的重心。
快手则是还需要用户拉新、技术扩容。事实上快手的技术架构也正在因此得到跃升——而且是面向未来2-3年市场竞争环境的跃升。
快手显然是一个从青春期走向成熟期的少年,它拥有了面向下一代的基础设施。
其次是组织难点。
企业在不同阶段都要设计出适合自身的组织架构,以此适应企业的发展需求。尤其是创业公司,它在高速成长过程中组织需要不断发展、建设、重塑。
组织就像是青春期孩子的一双鞋,这双鞋需要不断随着孩子的成长更换尺码。
快手是一家创业企业,过去除了BAT外,还没有一家创业企业操盘春晚红包的案例。这样一家创业企业开始变得有血性,必然也需要搭配上更敏捷、成熟的组织架构。
在这次春晚战事中,快手团队数百人聚集在同一办公室内接受指挥调度,从座次到汇报机制都被重新设计了,除夕当晚总指挥部领导了三十多个指挥官,通过临场决策的方式对事件进行快速反应。
要知道,过去传统的流水线组织下,不同角色技术人员很难对于某一业务领域有持续的理解和沉淀。但是通过这种春晚级别的战事考验,技术团队成员得到完整历练,会对业务、技术、组织都有更深理解,可以为团队培养出既懂技术,也懂业务的复合型人才。
这样一个指挥调度体系在经过春晚的洗礼之后,它在今后的业务中同样可以发挥作用。快手的技术中台以及组织能力会因此变得更强悍。
埃里克·G.弗拉姆豪茨在《企业成长之痛:创业型企业如何走向成熟》中把企业从初创到成熟分成了四个阶段——快手当前其实处于第三阶段,也就是扩张阶段。
这个阶段的要求是,具备规范的组织结构,以及能够统合企业资源、体系的基础架构。这也恰恰是快手当下的需求。考虑到过往BAT在经历春晚战事之后的组织架构升级调整,快手经历这一轮作战之后,上上下下被炮火所洗礼。
春晚则是这一次组织磨合的最佳机会,也是应对未来流量狂潮的最佳练兵场。
三
面向未来
春晚的挑战很快在疫情中得到了检验。
要知道,春节疫情期间,一批互联网教育公司、在线流媒体平台纷纷“挂了”。
由于日常技术基础设施储备不足,结果频频宕机,企业在疫情期间纷纷开始忙着服务器扩容、优化架构,这些突如其来的手忙脚乱其实都是快手在春节前夕春晚战备阶段所经历的。
左林右狸在《只有挑战,才能赋予快手奔跑的意义》一文中提到了一个细节:
快手是幸运的。春节之后疫情的原因,线上数据增长,服务器需求增加,春节项目积攒下来的服务器派上了用场。
快手的春晚战事,让它技术无缝连接了面向未来的流量狂潮。
尤其是在疫情之后,越来越多企业加速上云,国家层面更是号召提出“新基建”这样一个口号——推动企业集体转向云计算、5G和人工智能等新兴技术视为承载数字化、智能化升级的核心基础设施。
短视频迟早会面向未来。
我在招聘网站上发现,快手正在招聘中台架构师岗位,其中有几个要求很有意思。
设计与搭建跨业务通用的在线个性化推荐系统架构;
参与分布式推荐策略服务的搭建和优化;
参与分布式在线机器学习平台(模型训练和预估)的搭建;
参与推荐云平台的开发,用最简单的接口提供推荐系统迭代部署运维一站式解决方案。
你看,这一系列要求其实都是围绕快手的技术架构和组织架构所展开的。
回到前文中所说的“架构即未来”这个观点——快手其实已经在布局未来。
尤其是第一条“设计与搭建跨业务通用的在线个性化推荐系统架构”,很可能是在为接下来的业务扩张打地基。
业务决定架构。企业的技术架构搭建,是其业务需求的体现。
架构决定组织。前台业务贴近用户、基于场景;中台架构有服务能力强、抽象能力强、架构能力强、数据能力强;基础设施则是有提供计算、存储和网络的运维团队。
组织决定流程。什么样的组织,就会什么样的流程。
仔细看快手这次春晚战事会发现,它的前期的方案设计(视频红包玩法),到中期的技术基础设施建设(服务器和CDN的筹备),再到后期的现场指挥调度,几乎形成了一整套完整体系。
创新的业务、创新的架构、创新的组织以及创新的流程,在短短两个月左右的时间中迅速上线,迅速迭代,迅速经受疫情考验。快手更成熟了,也更有底气了。
一场春晚级的战事,带来了春晚级的技术架构、组织架构,更将带来一家能够应对国民级战事的互联网公司。
新闻推荐
本报讯(通讯员成常胜王曙东梁晓军)通过对2020年春节后(2月3日-3月1日)和2019年春节后(2月11日—3月10日)四周近28...