准备
Apache PredictionIO需要满足最低条件:
- Apache Hadoop 2.6.5(可选,只有当使用YARN和HDFS时才是必选)
- Apache Spark 1.6.3 for Hadoop 2.6
- JDK 8
- PostgresSQL 9.1或MySQL 5.1或Apache HBase 0.98.5和Elasticsearch 1.7.6
- 单机环境需要2G内存
安装JDK8
下载jdk-8u151-linux-x64.tar.gz,解压到/opt/modules
tar -xzvf jdk-8u151-linux-x64.tar.gz
在/etc/profile.d/java.sh
配置JDK8,并激活配置
# java
export JAVA_HOME=/opt/modules/jdk1.8.0_151
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH
验证JDK8是否正确安装
java -version
安装PredictionIO 0.12.0
下apache-predictionio-0.12.0-incubating-bin.tar.gz,并解压到/opt/modules
tar zxvf apache-predictionio-0.12.0-incubating-bin.tar.gz
安装依赖
使用默认的依赖路径
mkdir PredictionIO-0.12.0-incubating/vendors
安装Spark
Apache Spark是PredictionIO的默认过程引擎,下载并解压spark到/opt/modules/PredictionIO-0.12.0-incubating/vendors
tar zxvfC spark-2.1.1-bin-hadoop2.6.tgz PredictionIO-0.12.0-incubating/vendors
predictionio使用的spark在PredictionIO-0.12.0-incubating/conf/pio-env.sh
配置,默认是
SPARK_HOME=$PIO_HOME/vendors/spark-2.1.1-bin-hadoop2.6