互联网乐蜂网桃花节促销,流量激增15倍的技术保障

米花 发表 于:7年前 浏览量:170

聚美优品"301大促"当日上午便出现网站"瘫痪"情况。而他们的竞争对手桃花节促销,流量激增15倍,怎么从技术上解决呢?

“桃花节”是国内正品化妆品网购网站乐蜂网一年一度的大型促销活动,今年乐蜂网“桃花节”期间(2月28日—3月31日),不仅刷新了最长时间促销 记录,也创造其建站史上最大并发访问记录,其促销高峰期用户流量一度达到平时15倍以上,乐蜂网的系统如何抗住这些压力,技术支撑部门在大促销前后做了哪 些事,日前,CSDN采访了乐蜂网的运维总监周秋野。

★记者:秋野,你好,请简单给我们做一下自我介绍。

周秋野:好的,我是乐蜂网的运营总监,在桃花节大促销期间做整个技术运营团队牵头人,负责整个公司的促销季活动的安排和应对以及应急处理的工作。

★记者:乐蜂网为桃花节准备的技术团队大概是怎样的?

周秋野:公 司为桃花节成立了专门的团队,这个团队倒不是特别只为桃花节成立的,而是站在公司战略发展的层面。因为乐蜂网每个季度或定期都会举行大的促销活动,这逐渐 成为一个惯例。每次在大促之前都会成立一个团队,从各部门挑选核心员工组成。在项目前期,这些人都会被拉到一起开会,讨论活动的市场投放、需求分析、新上 的功能、产品、预估值等。

拿到这些数据后,技术部门会做系统扩容和改造方案,到现在已经逐步成为一些标准化的操作流程,经过一两次 大促销之后,后进入项目组的员工基本都会知道,第一问题会出现在哪里,瓶颈出现在哪里,挖出这些问题后有针对性的解决。另外,我们内部会做大量数据分析, 将资源合理的调配,查缺补漏。

为乐蜂网桃花节做技术产品支持的专门团队的核心员工有30多人,30多人会把属于自己的任务先领走,然后每个人会带着一些小团队去做事情,整个大促销的时候技术和产品的支持人员能达到百人以上。

★记者:技术部门是从桃花节之前多久开始准备预案和系统优化的?

周秋野:从老板去年10月份定下来办活动的时候就开始准备了,当初给的指标是担住比平时大3倍的流量。当 时整个现网系统里问题还比较多,因为之前也没有做过太多的优化,主要问题是数据库耦合度太高。另外,代码性能、SQL优化、单点问题等都是比较致命的。所 以我们从去年10月份开始就逐步的去优化和调整扩容系统,一直持续到今年1月份左右。70%的问题基本都搞定了,剩下的一大部分就是针对应急的解决方案,我们主要考虑了降级的办法。比如说,某个功能太花哨,有可能出现问题的,便把这个功能给关闭了,优先确保整个购物和下单主流程必须是顺畅的,否则就全盘皆输了。

之 前方案有过变动,到1月份的时候,领导突然告诉我们,要按照5倍的流量去准备。因为我们之前已经是按5倍的流量去做的方案,不用改动特别多就能承受住。结 果年后上班以后,2月19日有人告诉我们要按照10倍的量去准备,并且(桃花节的)时间还提前了,所以有点措手不及,但因为之前的准备工作还比较充分,后 期的这些事情做起来还比较顺畅。

★记者:桃花节做技术方案的时候预计届时会比平常的流量增加多少?实际当天的访问流量跟预期的差距有多少?

周秋野:
最后老板给的命令是抗住10倍的流量压力,结果当天来了差不多15倍+,但是我们准备的时候是按照20倍去做的技术方案。

★记者:如果当天流量超过20倍呢,你们计划怎么应对?

周秋野:可以通过限流(访问次数和频率),让绝大数人能够访问。另外,我们可以通过BI的数据分析,挖掘全网里面购买力(购买量)大的城市用户,对于其他城市做分流或减缓的操作,优先保证主用户的访问。

★记者:刚才谈到的降级处理和功能取舍,能举几个实际的例子吗?

周秋野:我举个例子,比如数据库访问,如果出现了异常问题,我们可以让应用程序在短时间内不去使用数据库,而是采用缓存系统来做存储数据,或者读取数据。这种状态能维持20分钟到半小时左右,一般情况下,如果出现大的事情,我们在20分钟或者半个小时内可以去简单处理解决掉了。

如 果能搞定这个故障,我们就可以回归到原来的常规状态。如果搞不定的话,我们可以切到数据库的备份节点或其他的机房,对这个数据进行快速恢复。假设没有降 级,如果数据库出现问题,就有可能在这个时间段内,用户的访问或者下订单的所有操作,全都是无效的。通过降级至少有一个缓步的策略,等于从侧面提供服务。 但是这种状态下提供的未必是完全的服务,可能会挑一些主要服务。

★记者:跟预案相比实际发生的哪些事是最出乎意料的?

周秋野:3 月1日当天400电话网络挂掉很出乎我们的意料。其实不光是乐蜂网,竞争对手包括很多电商行业公司都出现这个问题,这个事打的我们有点措手不及。因为当时 很多用户来进行咨询、下单,或者投诉。400电话挂了,影响非常大,电话都被打爆了。后来转到内网的座机电话,把201的电话公布出去,所有的人都变成了 客服,结果也被打爆了,半个小时还是四十分钟之后400恢复了,基本上才撑过去。

★记者:这次桃花节最感动的瞬间是哪一刻?

周秋野:有 两个最感动瞬间。第一个是2月27日的零点(迎来了促销活动的开始以及第一轮秒杀),用户流量突破了历史上一个很高的值,公司所有领导包括CEO、 COO、CPO等都站在我们身边一起去迎接这个时间点。当时公司用了三个52寸的高清电视来查看流量值和在线人数,我们纷纷在这些数值旁边拍照留念。

秒 杀系统是电商公司里都做过这种活动的,有可能做好的会比较成功;如果做得不好会快速的直接挂掉。秒杀活动对于我们系统来说,做得还是不错的,扛住了这么多 的正常访问,定单数也不少,没出现过任何的问题。还有一个最感动时刻是2月28号的零点,基本上整个24小时撑过去了之后,这是一个比较兴奋的时间点,我 们提前准备了两瓶香槟,小小的庆祝了一下,大家也稍微的松了一口气。
本文由 米花发表。转载请注明出处:https://www.mihua.net/list/0/3549.html

发表评论

您的昵称:

猜你喜欢

最近更新