阿里云机器学习平台是基于阿里云的云计算平台,具有超大规模的数据处理能力和分布式的存储能力,同时整个模型支持超大规模的建模以及计算。
该智能平台主要分为三层:
- 第一层:Web UI界面
- 第二层:机器学习算法层
- 第三层:MAXCOMPUTE平台层
Web UI界面
阿里云机器学习平台的Web UI界面如下图所示:
主要区域
Web UI界面主要由如下区域组成:
- 主要功能区:展示了各组件名称。
- 画布区:使用者可以用鼠标将相应的组件拖拽到画布上,形成一个有向的工作流,完成从元数据到数据处理再到建模等一系列的数据挖掘工作。
- 属性区:该区域可以设置组件内参数的信息。
主要功能
Web UI界面主要功能如下:
- 搜索功能:当有很多数据、表、实验时,可以通过搜索功能快速查找所需的资料。
- 实验列表:通过单击实验名称,在画布上显示该实验的有向实验流图,可以继续之前没有完成的实验。
- 数据表:类似于文件管理器,可以查看所有的数据表。
- 算法和工具列表:包含了常用的机器学习算法组件等核心功能。
- 模型列表:通过该功能,使用者可以管理所有的模型。
算法平台
阿里云机器学习平台拥有完整的算法库,如下图所示:
通常情况下,一个数据智能应用的完整链路很长,从数据的ETL到预处理、特征工程、模型训练、评估和服务。以前经常不得不在多个工具中来回穿梭才能完成任务,而机器学习平台致力于打造一站式的开发环境,提供了从元数据到模型部署整套流程。通过基本组件,可以搭建各个垂直场景下的解决方案,节省了大量切换环境的损耗。一个典型的算法开发流程如下:
完善的数据挖掘组件
提供整套的数据挖掘组件,包括数据的预处理、特征抽取、模型训练、预测和评估。将数据导入平台后,可通过拖拉的方式,借助实验组件灵活地拼装自己的试验流程来解决自身的业务场景。
可视化建模
操作界面通过拖拉拼接实验,提供了可视化建模的功能,方便您的操作。从左边的组件框中拖拉组件到右边的实验区即可进行实验的搭建,如下图所示。
数据可视化
对于每个输出型组件,都可以通过右键单击组件来查看可视化输出模型。可视化输出有多种表示方法,包括折线图、点图和柱形图,如下图所示。
模型可视化
模型的可视化管理:在左侧的菜单中选择模型页签,打开实验模型文件夹,可查看所有实验的模型列表。右键单击模型,选择查看模型,即可查看对应的模型结果,如下图所示。
算法组件
阿里云机器学习平台包含数据预处理、特征工程、统计分析、机器学习、深度学习框架、预测与评估这一整套的机器学习算法组件,共100余种。同时包含了Tensorflow、Caffe、MXNet这三款主流的机器学习框架,底层提供M40型号的GPU卡进行训练。