Kettle系列教程-第四章:资源库(数据库存储方式)

Author Avatar
山小杰 7月 18, 2018
  • 在其它设备中阅读本文章

本系列教程基于Kettle 8.1(pdi-ce-8.1.0.0-365)。大部分内容同样适用于Kettle 7.x版本。
章节目录:

本章说明

本篇内容为第四章:资源库(数据库存储方式)。
由于默认的转换、作业流程存储方式为单个文件存储,当有很多个转换、作业文件的时候,管理起来会很麻烦,所以这个时候就需要用到资源库了,用于统一管理转换、作业流程。资源库有两种存储方式:数据库存储文件存储,本章只讲解数据库存储方式。

创建资源库

首先需要创建一个字符集编码为UTF8的空白数据库(为什么指定编码为UTF8?因为不指定编码可能会出现中文乱码情况)。还是以MySQL为例,创建一个数据库名为kettle的空白数据库,并指定字符集编码:CREATE DATABASE kettle DEFAULT CHARSET=UTF8;
然后点击Spoon界面右上角的Connect按钮,在弹出的窗口中点击Other Repositories
img
然后选中Database Repository,点击Get Started
img
给资源库起个名字,再点击None
img
弹出的窗口中点击Create New Connection:
img
配置一下刚创建的kettle数据库的连接信息:
img
再配置一下连接参数:
img
测试通过后,即可保存。
img
然后选中刚创建的数据库连接mysql-repo,再点击Back
img
确认配置无误后,点击Finish
img
初始化数据库,稍等一会即可:
img
img
初始化完成,点击Connect Now,输入admin/admin,然后点击Connect即可连接到资源库。有兴趣的话可以去看下资源库的表结构:
img
此时Spoon界面右上角会变成这样:
img

保存转换、作业流程到资源库

这一部分Kettle 8.1与Kettle 7.x差别较大。
新建一个转换或者作业,Ctrl + S保存,如果已经连接了资源库,则默认保存到资源库中:
img
右上角可以新建目录:
img
选中保存位置,填写转换或者作业名称,点击Save即可保存到资源库。
img

从资源库打开转换、作业流程

  • 打开单个流程:
    Ctrl + O或者左上角 文件 -> 打开,选中要打开的流程,Open即可:
    img
  • 批量打开多个流程:
    Ctrl + E或者 菜单栏 -> 工具 -> 资源库 -> 探索资源库,同时选中多个流程,然后按回车键,即可批量打开多个流程:
    img

    管理资源库

    Ctrl + E或者 菜单栏 -> 工具 -> 资源库 -> 探索资源库,右键菜单可以对目录、流程进行删除或者重命名等操作:
    img

本章完!
下一章:变量/参数