Kettle系列教程-第三章:数据库连接配置

本系列教程基于Kettle 8.1(pdi-ce-8.1.0.0-365)。大部分内容同样适用于Kettle 7.x版本。章节目录: 一、     阅读全文
山小杰's avatar
山小杰 7月 18, 2018 共计832字,预计阅读时长:2分钟

Kettle系列教程-第二章:转换与作业

本系列教程基于Kettle 8.1(pdi-ce-8.1.0.0-365)。大部分内容同样适用于Kettle 7.x版本。章节目录: 一、     阅读全文
山小杰's avatar
山小杰 7月 18, 2018 共计1.3k字,预计阅读时长:4分钟

Kettle系列教程-第一章:运行环境配置

本系列教程基于Kettle 8.1(pdi-ce-8.1.0.0-365)。大部分内容同样适用于Kettle 7.x版本。章节目录: 一、     阅读全文
山小杰's avatar
山小杰 7月 18, 2018 共计1k字,预计阅读时长:3分钟

Gpg4win&Kettle文件加密、解密组件的使用

Kettle是一个很强大的开源的数据ETL工具,并且可以与大数据平台整合,直接将关系型数据库中的数据接入到Hadoop平台上。 在对数据文件进行操作的时候有些场景可能...     阅读全文
山小杰's avatar
山小杰 5月 06, 2018 共计1.7k字,预计阅读时长:5分钟

CDH5高可用集群离线部署

前几篇文章介绍了下原生Hadoop集群的部署过程,这篇文章就来介绍下CDH的部署过程,毕竟发行版Hadoop的部署、运维都很方便,稳定性也好,实际生产环境上用原生Hadoop的并不是很多。...     阅读全文
山小杰's avatar
山小杰 2月 08, 2018 共计1.8k字,预计阅读时长:7分钟

CentOS7下挂载新磁盘

虚拟机也好,物理机也罢,在CentOS的使用过程中都有可能会出现需要增加磁盘的情况,这篇文章就是介绍如何为新磁盘进行分区以及挂载操作。 所有操作都在root用户下进行。     阅读全文
山小杰's avatar
山小杰 2月 02, 2018 共计1.3k字,预计阅读时长:7分钟

CentOS7下使用FTP搭建局域网内Yum源

国内有很多Yum的镜像源,比如阿里、网易等等,速度很快,使用着很方便。但是,有些公司的生产环境是不能连接外网的,这样的环境下,不作一些措施的话,在CentOS上安装软件会很麻烦,依...     阅读全文
山小杰's avatar
山小杰 1月 24, 2018 共计725字,预计阅读时长:3分钟

Hadoop集群快捷启动/停止脚本

由于原生Hadoop集群没有统一的管理工具,当向集群中部署了越来越多的组件后,集群的管理就变得非常繁琐复杂,包括集群的启动与停止,需要执行好多条命令,所以我就写了个一键启动、停止集群的sh...     阅读全文
山小杰's avatar
山小杰 1月 24, 2018 共计969字,预计阅读时长:4分钟

2017,再见。你好,2018

2017,再见。你好,2018。 2017年,从头失败到脚的一年。从1600公里到0,再从0到正无穷,之间充满了太多的无奈。不管怎样,还是要感谢过去的一年里陪...     阅读全文
山小杰's avatar
山小杰 1月 01, 2018 共计320字,预计阅读时长:1分钟

Hadoop-3.0.0体验

前言距离Hadoop 3.0.0 GA版的发布已经过去好多...     阅读全文
山小杰's avatar
山小杰 12月 22, 2017 共计1.4k字,预计阅读时长:6分钟