温馨提示:该页面为Windows软件,不支持手机用户安装使用
PiFlow 是一款简单易用、功能全面的互联网大数据流水线系统软件,它结合了复合型科学研究的大数据流水线系统软件的特点,拥有丰富的CPU组件,支持Shell、DSL、Web配置页面、线程同步、任务监控等功能!
简单易用
数据可视化
配置流水线
监控流水线
查询流水线
流水线日志控制点功能
扩展性强:支持自定义开发数据处理组件
使用性能:基于分布式计算模块Spark开发
功能齐全:提供100多个数据处理组件,包括Hadoop、Spark、MLlib、Hive、Solr、Redis、MemCache、ElasticSearch、JDBC、MongoDB、HTTP、FTP、XML、CSV、JSON等,并集成生物信息行业的优化算法
首先您需要下载PiFlow软件包 piflow-server-v0.9.tar.gz
,然后解压到您的服务器上。
tar -zxvf piflow-server-v0.9.tar.gz
接下来配置环境变量 config.properties
,并设置PiFlow Server的运行、停止、重启等脚本。
export PIFLOW_HOME=/yourPiflowPath/bin
export PATH=$PATH:$PIFLOW_HOME/bin
使用以下脚本启动PiFlow Server:
start.sh
使用以下脚本停止PiFlow Server:
stop.sh
使用以下脚本重启PiFlow Server:
restart.sh
使用以下脚本检查PiFlow Server状态:
status.sh
您需要配置以下参数:
# Spark and Yarn config
spark.master=yarn
spark.deploy.mode=cluster
# HDFS default file system
fs.defaultFS=hdfs://10.0.86.191:9000
# Yarn ResourceManager hostname
yarn.resourcemanager.hostname=10.0.86.191
# If you want to use Hive, set Hive metastore uris
hive.metastore.uris=thrift://10.0.88.71:9083
# Show data in log, set 0 if you do not want to show data in logs
data.show=10
# Server port
server.port=8002
# H2DB port
h2.port=50002
您可以使用以下命令运行流水线:
piflow flow start example/mockDataFlow.json
您可以使用以下命令停止流水线:
piflow flow stop appID
您可以使用以下命令获取流水线信息:
piflow flow info appID
您可以使用以下命令获取流水线日志:
piflow flow log appID
您可以使用以下命令运行流水线组:
piflow flowGroup start example/mockDataGroup.json
您可以使用以下命令停止流水线组:
piflow flowGroup stop groupId
您可以使用以下命令获取流水线组信息:
piflow flowGroup info groupId
安装快捷方式
修改或删除您的SD卡中的内容
拥有完全的网络访问权限
控制振动
查看网络连接
开机启动
防止手机休眠
在其他应用之上显示内容
录音
更改您的音频设置
拍摄照片和视频
连接WLAN网络和断开连接
查看WLAN连接
关闭其他应用
卸载快捷方式
让应用始终运行
修改系统设置
检索正在运行的应用
读取您的通讯录
与蓝牙设备配对
访问蓝牙设置
发送持久广播
写入/删除您的通讯录
使用指纹硬件
更改网络连接性
展开/收拢状态栏
查找设备上的帐号
写入/删除您的通讯录
读取同步设置
启用和停用同步
停用屏幕锁定
允许接收WLAN多播
添加或修改日历活动,并在所有者不知情的情况下向邀请对象发送电子邮件
读取日历活动和机密信息
关闭其他应用
请求安装文件包
连接WLAN网络和断开连接
拥有完全的网络访问权限
查看WLAN连接
查看网络连接
访问确切位置信息(以 GPS 和网络为依据)
访问大致位置信息(以网络为依据)
拍摄照片和视频
防止手机休眠
安装快捷方式
开机启动
发送持久广播
控制近距离通信
对正在运行的应用重新排序
读取您的SD卡中的内容