不久前,国内某大型视频网站“崩了”登上热搜。大批追剧用户被迫从“别人家甜甜的恋爱”回到现实,展开了浩浩荡荡的奔走相告,催促该产品尽快修复bug。一直以来,中国头部互联网APP由于用户体量大,以及爆款电视剧播放至高潮剧情等现象级事件发生,服务器“开小差”并不罕见,但显然用户仍然无法接受。
而聚焦全球化互联网产品来看,考虑到其用户结构多元、用户总量更高,一旦服务稳定性出现偏差,或将上演真正意义上的“人潮汹涌”。对此,凭借全球累计近24亿的产品安装用户数成为出海“顶流”的茄子科技(海外SHAREit Group),则以系统化的技术逻辑,将稳定性嵌入自身DNA中,更好满足海外市场用户的互联网数字娱乐获取需求。
目前,茄子科技已建设出一套系统化的解决方案,通过技术平台与开发、测试、应用等整个软件周期建立触点,有序落实开发程序,全面确保稳定性。
开发阶段,茄子科技即有系列规范和本地校验流程,用以提前发现问题,从源头把关。提交MR之际则为第二重关卡,系统将自动执行预设的校验流程,全部完成后才能合入主干。测试阶段,则会在常规测试外,叠加全面的自动化测试。上线应用之后,将依托APM平台采集和处理稳定性指标,排查线上问题。据了解,即使问题发生在真实场景,APM平台也能实现分钟级报警,并且自动把问题分配到相关成员。
对于互联网企业来说,运用技术建立专业化的基础架构,能够有效保证用户使用体验,避免“日常崩溃”成为品牌标签。不过,由于服务器稳定性受到多重复杂因素影响,严密的故障管理机制成为茄子科技在风险预防之外的重要一环,以应对真实的服务器崩溃,快速恢复正常的产品运营。
故障管理包括技术工具和团队两个方面。技术上,茄子科技基础研发团队基于客户端链路埋点,以及服务端限流降级等一系列技术方案的需求,输出一系列的支持工具和平台,同时还打通了公司多个内部系统,让开发部门在解决问题时能得到更全面的信息,方便定位问题、解决问题。
团队配合上,故障发生后相关团队将快速成立临时“作战室”,解决线上故障,针对一些底层的业务组件,茄子科技还会和云厂商一起联合排障;故障结束后,各个业务方会共同复盘原因,列出整改措施,最终输出至故障知识库,便于调取查阅。
整体来看,茄子科技的稳定性系统以数据为核心,以技术平台为依托。但茄子科技认为,稳定性的范畴不应仅局限在技术架构的建设上,还要扩大至涵盖组织、人、工具等多方面,推进完整的稳定性体系建设,形成一整套闭环系统化的流程。
如今,国内网络环境中习惯对服务器“开小差”玩梗、造话题,甚至有网民将企业以此取得的热度与其用户粘性相对等。事实上,服务器的稳定指向用户体验、数据安全等更加严肃的互联网命题。从此维度来看,茄子科技(海外SHAREit Group)的全面的技术架构和审慎的管理机制更显企业责任感。未来,越来越多中国互联网企业将布局全球市场“百景图”,为海量用户提供数字服务,值得其思考的不仅仅是自身的技术观,用户观亦是关键。
本栏目下所有稿件均由第三方平台提供,所发布信息内容的准确性由原内容提供者独立承担完全责任。北方网刊登此文仅出于传递信息之目的,绝不代表赞同其观点或证实其描述。文章中如涉及侵权请及时与我方联系,我们会尽快处理。