AWS在稳定性、性能等各方面的指标能够说到做到,与预期一致,让团队可以专注于业务创新。
秦龙 北京先声教育科技有限公司CTO

北京先声教育科技有限公司(以下简称“先声教育”)是一家AI技术服务商,目前落地在K12教育领域,创始团队来自腾讯、美国卡耐基梅隆大学(CMU),并已获得来自联想之星、思必驰、浙大友创、创世伙伴资本(CCV)投资方累计数千万美金投资。先声教育专注为教育机构提供在线口语、听说考试、写作评测系统及定制化技术服务,通过AI技术与教学场景的深度融合,升级传统教育模式,促进教学相长,推动效率改善。所服务的客户包括百度、好未来、新东方、拓维信息、海云天、全通教育、趣配音等。

基于语音识别、自然语言处理等核心技术,先声教育自主研发智能口语测评、智能写作批改、自适应学习、智能对话及情感识别等技术解决方案。根据对市场和技术成熟度的分析判断,先声教育选择智能语音测评和智能写作批改作为AI技术与教育场景结合的切入点,专注于输出底层技术,以云计算的形式提供给合作伙伴,提高教育能效,使客户可以更好地为教学双方服务。

先声教育的核心挑战在于充分保障语音和写作测评核心业务稳定、高效运行;在此基础上,向IT后台简单、无感知的目标迈进,降低运维压力,释放资源。

首先是稳定性。作为底层的智能技术供应商,先声教育服务的稳定性不仅关系着自身业务和客户商誉,更是关系到整个在线教育产业链产品和服务创新的关键所在。底层平台毫秒级的延迟、后台监控忽高忽低的锯齿,反映到最终用户的前端界面,有可能就是糟糕的卡顿体验。

在伸缩性方面,据先声教育基础架构部负责人晋勋介绍,先声教育每天收到的测评请求量级已达几千万次,这些请求很可能是在某一时间段集中发生,比如晚上18:00-22:00。如何满足高并发的大流量场景,应对每天高差达几十倍的流量高峰,是一个巨大的挑战。

因此对先声教育来说,IT后台系统必须具备极强的稳定性和高可用性,同时兼顾可扩展性和灵活性,丰富的SDK和友好的开发测试环境同样非常重要。

先声教育曾使用其它云服务商的服务,过程中碰到过不少问题,包括磁盘I/O速率低、网络不稳定、CPU性能不匹配等,甚至遇到过比较尴尬的场景,买不到服务商承诺的计算实例,严重影响到核心业务的稳定运行。

Amazon Web Services (AWS) 功能丰富,产品快速迭代,企业级的支持服务非常到位,这些都成为先声教育选择AWS云服务的重要原因。

先声教育从2018年初开始测试由西云数据运营的AWS中国(宁夏)区域,并于1月15日完成智能语音测评集群的搭建、上线并正式提供给用户使用。同时,于2月在由光环新网运营的AWS中国(北京)区域部署API入口,进一步降低部分城市接入时延。

评估选择云服务时,先声教育设定了三个基本核心指标:相同机型成本对比、万次请求成本对比和整体运行故障率对比,希望在满足“整体运行故障率”维持在极低水平和可接受范围的前提下,尽可能降低“万次请求成本”。在评估AWS云服务的过程中,先声教育秉持“循序渐进”的原则,全面涉及功能测试、压力测试到最后真实用户的灰度测试。同时,充分考虑、综合衡量云服务商基础功能与自身需求的匹配度,大流量高并发场景下的抗压能力等因素。

如图1,是先声教育基于AWS云的系统架构图,所采用的AWS云服务包括Amazon Elastic Compute Cloud (Amazon EC2)Amazon Simple Storage Service (Amazon S3)Amazon GlacierAWS Auto ScalingElastic Load BalancingAmazon CloudWatchAmazon Elastic Block Store (Amazon EBS)等。

图1 先声教育基于AWS云的架构图

以AWS云为基础构建智能语音测评云服务,先声教育对AWS云的计算实例性能、磁盘I/O、平均延迟、网络连通性、服务和整个系统的稳定性等方面,都比较满意。

采用AWS云服务后,先声教育能够将更多的精力和时间用于业务创新和产品市场拓展,有效降低了公司的整体运维成本。在同等资源配置的情况下,有能力对外提供更高效的服务。基于AWS搭建多云环境、自动可扩展的服务集群后,先声教育可以放心大胆地向前拓展业务。

此外,AWS提供的Amazon EC2、Amazon EBS实例性能强劲,对比先声教育曾使用的其它云平台,磁盘I/O等待时间平均降低25%-33%;内网连通性极佳;服务整体稳定性得到了显著提升,从监控图表上几乎看不到忽高忽低的锯齿现象。

结合CloudWatch,先声教育可以进一步细化监控,实现主机内部的透明访问,精确管理云主机。同时,AWS云提供丰富且功能强大的SDK,简化运维开发,轻松实现更高级别定制化的自动扩容。晋勋表示,“云服务的差异在于细节。例如我们在做应用升级时,只需关闭现有机器,再开启一台机器,就可以部署新代码,类似‘一键换机’。这个过程对运维来说可能只需五分钟,积少成多,无论显性还是隐性,长期看一定会显著节省运维成本。”对于IT运维来说,没有消息就是好消息。采用AWS云后,以往告警消息(包含大量无效告警)频发的状况得到了明显改善,AWS监控报警信息非常少,一周甚至都没有一条。

先声教育的应用需要大量的音频交互,持续稳定的网络连接是关键。AWS云服务稳定性好,网络延迟低而且抖动小,这是先声教育非常看重的地方。同时,AWS云提供了很好的弹性,非常适合教育类应用的流量峰谷特征和场景,能有效降低后期的综合使用成本。

先声教育CTO秦龙总结道,“就智能语音测评应用场景而言,长连接是其核心特征,用户往往会不间断地连续传音频,同时要求系统给出的反馈评价足够快。如果后台不具备强大的性能和稳定性,一切服务和体验都无从谈起。截至2018年7月,先声教育服务近百家B端客户,每天有近百万学生使用先声教育提供的智能语音和写作测评服务,提高自己的学习能力和水平。没有AWS云提供的强大支撑,这一切难以想象。”

若要了解关于AWS如何帮助教育领域客户的详细信息,请访问教育行业信息页面