PiFlow(大数据流水线系统) v0.16下载

官方
  • 大小:308.66MB
  • 发布日期:2025年8月7日
  • 类别:系统其他
  • 更新:2025-03-9 20:34:22
  • 版本:v13.60.0
  • 评分:★★★★☆
  • 需要网络无广告

软件信息

  • 软件名称PiFlow(大数据流水线系统) v0.16下载
  • 支持语言简体中文
  • 授权方式免费软件
  • 更新日期2025年8月7日
  • 文件大小308.66MB
  • 下载文件名piflow-server-v0.9.zip

软件介绍

PiFlow(大数据流水线系统)软件

PiFlow是一个扩展性强,性能优越,简单易用的大数据流水线系统,提供了100+的数据处理组件,包括Hadoop 、Spark、MLlib、Hive、Solr、Redis、MemCache、ElasticSearch、JDBC、MongoDB、HTTP、FTP、XML、CSV、JSON等,欢迎下载使用!

PiFlow是一个扩展性强,性能优越,简单易用的大数据流水线系统,提供了100+的数据处理组件,包括Hadoop 、Spark、MLlib、Hive、Solr、Redis、MemCache、ElasticSearch、JDBC、MongoDB、HTTP、FTP、XML、CSV、JSON等,欢迎下载使用!

软件特色

可视化配置流水线

监控流水线

查看流水线日志

检查点功能

支持自定义开发数据处理组件

基于分布式计算引擎Spark开发

集成了微生物领域的相关算法

使用方法

解压piflow-server-v0.9.tar.gz:

tar -zxvf piflow-server-v0.9.tar.gz

编辑配置文件config.properties

运行、停止、重启PiFlow Server

start.sh、stop.sh、 restart.sh、 status.sh

测试 PiFlow Server

设置环境变量 PIFLOW_HOME

vim /etc/profile

export PIFLOW_HOME=/yourPiflowPath/bin

export PATH=PATH:PIFLOW_HOME/bin

运行如下命令

piflow flow start example/mockDataFlow.json

piflow flow stop appID

piflow flow info appID

piflow flow log appID

piflow flowGroup start example/mockDataGroup.json

piflow flowGroup stop groupId

piflow flowGroup info groupId

如何配置

config.properties

#spark and yarn config

spark.master=yarn

spark.deploy.mode=cluster

#hdfs default file system

fs.defaultFS=hdfs://10.0.86.191:9000

#yarn resourcemanager.hostname

yarn.resourcemanager.hostname=10.0.86.191

#if you want to use hive, set hive metastore uris

#hive.metastore.uris=thrift://10.0.88.71:9083

#show data in log, set 0 if you do not want to show data in logs

data.show=10

#server port

server.port=8002

#h2db port

h2.port=50002

以上就是非凡软件站小编今日为大家带来的PiFlow(大数据流水线系统),更多软件下载尽在非凡软件站

下载帮助:点击PiFlow(大数据流水线系统)软件立即下载,解压后安装,一直点下一步,直到安装完成,再打开使用。

软件截图

PiFlow(大数据流水线系统) v0.16

版权声明

PiFlow(大数据流水线系统)软件所展示的资源内容均来自于第三方用户上传分享,您所下载的资源内容仅供个人学习交流使用,严禁用于商业用途,软件的著作权归原作者所有,如果有侵犯您的权利,请来信告知,我们将及时撤销。

收起内容