Pentaho Data Integration:Kettle
一、简介
一个用java开发的软件,可以对数据进行一系列操作,例如数据整合、数据转换、数据迁移、数据导出报表等。
Kettle其实叫Pentaho Data Integration,Pentaho是公司名,Data Integration是数据整合。
Pentaho Data Integration分为商业版与开源版,在中国,一般人仍习惯把Pentaho Data Integration的开源版称为Kettle。
在Kettle中,数据的单位是行,数据流就是数据行从一个步骤到另一个步骤的移动。步骤之间通过跳(hop)来连接。
ETL(Extract-Transform-Load):即数据抽取、转换、装载的过程