【发布时间】:2012-10-22 03:38:13
【问题描述】:
我对 Pentaho 一无所知,我只想知道它是否能胜任我的工作,然后再投入大量时间来学习它。
Pentaho 可以用作 XML ETL 工具吗?能否实现任意变换?典型的转换是将 XML 元素“Company”及其子元素“Employee”折叠到同一个“Employee”表中,但这只是最简单的转换,还有无限的其他可能性。例如,将以下 XML 导入我们的数据库:
<Root>
<OrdersByCustomer>
<CustomerInfo>
<Customer>
<CustomerID>1234</CustomerID>
...
</Customer>
<Address>...</Address>
</CustomerInfo>
<Orders>
<Order>...</Order>
<Order>...</Order>
<Order>...</Order>
</Orders>
</ OrdersByCustomer>
</Root>
我需要获取 CustomerID 并将其与 XML 元素“Order”中的数据一起插入。
Pantaho 能做到如此无限且任意的变换吗?还是我必须削减自己的代码?
如果上述问题的答案是肯定的,那么,还有两个问题:
Pentaho 是对称的和双向的吗?我们不仅需要将 XML 导入数据库,还需要从数据库中的数据生成 XML。 Pentaho 能做到吗?
如果答案再次是肯定的,我知道 Pentaho 是一个框架,并且有关于它的书籍。是需要学习整个框架,还是直接安装,花半天时间只学习XML ETL部分,然后开始使用?
【问题讨论】: