基本操作步骤
1、新建一个工作流(workflow)
2、从节点库中选择需要的节点(拖拽或者双击)
3、配置各节点参数,并连接各个节点
4、执行,查看各步骤中间结果
5、如何连接各个节点图示
若需要,可导出不同格式的数据(csv,excel等)
1、新建一个工作流(workflow)
创建一个新的工作流,并命名。也可先创建一个工作流组(可简单理解为一个文件夹而已),之后在该组内再创建各个工作流,方便管理工作流。如创建一个my_first_workflow后,则会在右侧出现一个空的画布,即主要的工作流编辑区
2、从节点库中选择需要的节点(拖拽或者双击)
3、配置各节点参数,并连接各个节点
- 配置文件的路径
- 文件分隔符(软件会自动识别,若识别不正确,可手动修改)
- 是否包含表头,即是否有列名
若识别存在乱码,可在Advanced再设置文件编码格式,识别无误后点击OK即可
配置前后界面状态的变化
- 红色:未配置参数前有一个黄色感叹号,提示需要配置参数才能执行
- 黄色:配置完成后节点状态为黄色,即代表准备就绪,可以按F7执行(或右键点执行)
- 绿色:执行后的状态为绿色,即代表执行完毕
4、执行,查看各步骤中间结果
执行成功后可以查看各个数据,与浏览Excel数据一样,
还可以在2中查看不同数值类型的元数据
- 数值型数据的上下界
- 分类字符型的值
5、如何连接各个节点
按照鼠标左键连线,到下一个节点端口松开即可。连线后代表将一个节点的数据传送到下一个节点,可简单理解为数据管道,下一个节点再对上一个数据进行处理,而后可传递下一个节点。数据和参数的传递都是通过连线完成的
端口
各个节点的不同形状端口代表不同对象,先简单了解即可。
黑色三角:数据(最主要使用的,90%以上使用)
红色圆圈:参数
方块:模型,或数据库需要配置的SQL语句等(注意各有颜色不同)
图例说明
1)连线列过滤
2)执行后的结果