Seahorse是开源的可视化框架,能够以快速简便的交互方式创建Spark应用,也就是可以通过拖拽操作在画布构建Spark应用流程。
Seahorse可以连接任何的Spark集群(YARN,Mesos,Spark Standalone),或者是本地的spark。当处理本地文件时,Seahorse封装了一些库,可以方便处理。Seahorse支持Spark ML算法,并允许使用Python或R自定义操作。
在在Seahorse中用Jupyter notebook导出数据时,它们共享同样的Spark Context。
当Spark应用构建完成并导出时,它将使用Batch Workflow Executor将其作为批量Spark应用运行。