互联网AI教育为什么要开发容器管理平台?

优鸿人工智能教育容器平台简介

本文介绍优鸿人工智能教育的Docker容器集群管理平台(以下简称“容器平台”)。该平台始于2016年,是基于阿里云的基础架构和组件而开发的Docker容器集群管理平台。目前该平台为优鸿教育的运维、智能算法、AI研发、业务等十几个部门提供容器计算服务,承载线上业务数百个,日均线上请求超过上亿次,业务类型涵盖Web、数据库、缓存、消息队列等。

互联网AI教育为什么要开发容器管理平台?

为什么要开发容器管理平台

作为中国AI教育科技领军企业,优鸿人工智能教育业务发展极为迅速,每天线上发生海量的查询、和在线互动。在容器平台实施之前,优鸿人工智能教育的所有业务都是运行在阿里云私有云提供的虚拟机之上。随着业务的扩张,除了对线上业务提供极高的稳定性之外,私有云还需要有很高的弹性能力,能够在某个业务高峰时快速创建大量的虚拟机,在业务低峰期将资源回收,分配给其他的业务使用。优鸿人工智能教育大部分的线上业务都是面向老师和学生的,业务类型多样,弹性的时间、频度也不尽相同,这些都对弹性服务提出了很高的要求。在这一点上,虚拟机已经难以满足需求,主要体现以下两点。

第一,虚拟机弹性能力较弱。使用虚拟机部署业务,在弹性扩容时,需要经过申请虚拟机、创建和部署虚拟机、配置业务环境、启动业务实例这几个步骤。前面的几个步骤属于私有云平台,后面的步骤属于业务工程师。一次扩容需要多部门配合完成,扩容时间以小时计,过程难以实现自动化。如果可以实现自动化“一键快速扩容”,将极大地提高业务弹性效率,释放更多的人力,同时也消除了人工操作导致事故的隐患。

第二,IT成本高。由于虚拟机弹性能力较弱,业务部门为了应对流量高峰和突发流量,普遍采用预留大量机器和服务实例的做法。即先部署好大量的虚拟机或物理机,按照业务高峰时所需资源做预留,一般是非高峰时段资源需求的两倍。资源预留的办法带来非常高的IT成本,在非高峰时段,这些机器资源处于空闲状态,也是巨大的浪费。

由于上述原因,优鸿人工智能教育从2016年开始引入Docker,构建容器集群管理平台,为业务提供高性能的弹性伸缩能力。我们结合自身的业务需求,基于阿里云现有架构和组件,实践出一条自研Docker容器管理平台之路。

互联网AI教育为什么要开发容器管理平台?


分享到:


相關文章: