Seahorse是开源的可视化框架,能够以快速简便的交互方式创建Spark应用,也就是可以通过拖拽操作在画布构建Spark应用流程。

Seahorse可以连接任何的Spark集群(YARN,Mesos,Spark Standalone),或者是本地的spark。当处理本地文件时,Seahorse封装了一些库,可以方便处理。Seahorse支持Spark ML算法,并允许使用Python或R自定义操作。

在在Seahorse中用Jupyter notebook导出数据时,它们共享同样的Spark Context。

当Spark应用构建完成并导出时,它将使用Batch Workflow Executor将其作为批量Spark应用运行。

results matching ""

    No results matching ""