Kettle系列教程-第三章:数据库连接配置
本系列教程基于Kettle 8.1(pdi-ce-8.1.0.0-365)。大部分内容同样适用于Kettle 7.x版本。
章节目录:
- 一、运行环境配置
- JDK
- JVM参数
- KETTLE_HOME
- 依赖包导入
- 二、转换与作业
- 转换流程
- 作业流程
- 三、数据库连接配置
- 创建数据库连接
- 共享数据库连接
- 数据库连接参数
- 四、资源库(数据库存储方式)
- 创建资源库
- 保存流程到资源库
- 从资源库打开流程
- 五、变量/参数
- 参数的配置与使用
- 变量的配置与使用
- 六、转换流程-输入组件
- Excel输入
- 表输入
- 七、转换流程-输出组件
- Excel输出
- 文本文件输出
- 表输出
- 八、转换流程-转换组件
- 九、脚本组件
- 转换-Java代码组件
- 作业-SQL组件
- 作业Shell组件
- 十、对接大数据平台
- 基础文件配置
- 上传文件到HDFS
- 连接Hive
- 十一、使用Windows计划任务定时执行Kettle作业
- 命令说明
- 编写批处理脚本执行Kettle作业
- 创建计划任务定时执行Kettle作业
- 十二、使用Java执行Kettle作业
- 搭建Kettle运行环境
- 代码示例(作业、转换、资源库)
本章说明
本篇内容为第三章:数据库连接配置。
使用Kettle的时候,肯定要与数据库打交道,常用的是jdbc连接方式。
创建数据库连接
新建一个作业或者转换,可以在主对象树
下面看到DB连接
选项,双击DB连接
或者右键菜单
点击新建
,打开创建数据库连接窗口。
选择数据库类型以及连接方式(默认JDBC),填写相应配置:
配置完成后点击测试
按钮测试一下数据库连接,如下图所示表示配置成功,然后就可以点击确认
保存数据库连接了,新建的数据库连接会显示在DB连接
分组下: ->
共享数据库连接
新建的数据库连接只能在当前转换或者作业中使用,好在Kettle提供了数据库连接共享功能,在数据库连接名称
上鼠标右键,点击共享
即可将该数据库连接共享给其他转换或者作业使用,共享成功后,数据库连接名称将加粗显示: ->
另外,数据库连接共享后还会在.kettle
目录下生成一个shared.xml
文件,文件中记录着被共享的数据库连接信息:
警告:如果数据库名为中文,则不能共享该连接,否则会报出异常,影响Spoon的正常使用: ->
如果手误已经发生这种情况,则可以使用记事本打开.kettle
目录下的shared.xml
文件,手动删除掉database标签值为中文的connection标签即可:
数据库连接参数
创建数据库连接的时候还可以配置一些连接参数,比如连接MySQL的时候可以添加连接编码:
这种方式可以解决由于编码不一致导致的中文乱码问题(上图的这个参数配置的前提是数据库字符集也是UTF8)。
本章完!
下一章:资源库(数据库存储方式)