欧美日本精品一区二区三区,欧美激情视频一区二区三区免费,色综合久久综合网

商业��需要站在全局角度考虑问题

gemini — Fri, 21 Mar 2008 04:16:00 GMT

首先看一下下面这个表�?�q�个表样是润乄��一个示例表�?接着介绍birt 是如何做�?/p>

�q�个表样��是报表中最常见的一�U�需求了�Q�把不同�_�度的数据聚合到同一�_�度�?

我们用automobile 表示汽�R�? 用houseproperty 表示房��? 用estate表示土地�?用others 表示其他�?他们都有customerid 来表�C�客户名�U?customers 表有customerid 和customername

1. 用视图来拼数�?/p>

对于 automobile 聚合使用一个autoview , sql 如下

select sum(automobile price* quantity) autototal, customerid from automobile group by customerid

对于 houseproperty 使用如下view

select sum( house price * quantity ) housetotal, customerid from houseproperty group by customerid

对于土地和其他也是差不多�c�d��的sql

得到了上面这四个视图之后, ��把customers 表根据customerid 和其他四个视图join ��h��.

select customername , autototal , housetotal , estatetotal , othertotal

from customers c , automobile a , houseproperty h , estate e , others o

where 四个视图和customers的连接条�?/p>

�׃��q�个表样�q�不涉及��C�� 汽�R�Q�房产，土地�Q?其他表中的�Q何一个客户�ؓ�? 所以暂时也不考虑左右�q�接的问�?

2. 使用Birt 的Joined Data Set

Birt 提供的Joined Data Set 跟数据库里面的视图是差不多的概念�Q��不过一个是在数据库内部join 数据�Q�一个是使用Java 循环的方式join 数据.

跟上面创��图一��P��创徏四个DataSet , 输出两个字段: customerid �?total.

然后创徏一个Joint Data Set , 把customers 表和 autototal DataSet 按照customerid join��h��.�q�时得到四个字段 customers.customername , customers.customerid , auto DataSet.customerid �Q�auto DataSet.autotal . 最后我们把�q�个Joint DataSet 命名为jdataSet1 (代表的是autoDataSet �?customers 产生的Joint DataSet ).

然后�l�箋创徏另一个Joint Data Set 把customers 的customerid 和前一步创建的jDataSet1 按照customerid join ��h��得到一个第二个Joint DataSet1 ,我们命名为jDataSet2 .

以此�c�L��Q�最后我们输�?个字�D? customers.name , auto.total , house.total , estate.total , others.total , 实际输出可能在customers.customerid 上重复了4��?

上面两种方式报表的做法主要有两点差别:

1. 性能

如果本��n数据库单独执行一个视囄��sql �l�果比较��，而本�w�的automobile 表数据量比较大（也就是说一个customer寚w��常多的automobile 记录) , 那么使用数据库视囑ְ�会比较慢. 因�ؓ数据库在��试得到4个视囄��l�果�q�行了一些不必要的按照automobiel表的customerid和customers的customerid�q? 行的比较操作( 如果有烦引肯定是对烦引进行了多次不必要的�? ,�q�时候��用Java的这�U��@环方式会比较快一�?. 如果本��n�l�构集比较大�Q�那么还是用数据库本�w�的排序和join 比较�? �q�个道理比较�c�M��于数据库中如果结构集大于5% ��׃��要走索引,直接�q�行全表扫描.只不�q�这是一个java 版的.

2. 左右�q�接的问�?/p>

如果�q�个表的数据不是以customers里面的数据�ؓ主，而是以四个视囑օ�中的一个�ؓ�?�q�时候要情况可能会比较复杂一�?�׃��我不太清楚birt 里面joint data set 计算的方式是怎样的，所以也不太好评�?不过如果不��用joint data set , ��是使用一般的�~�程的方�?那么按照下面�q�个思�\会比较好:

a , b , c , d ,e 为customers , automobiles view (后面��写avlist 表示�q�个�?, housetotal view , 里面的指�? 四个view 都已�l�排好了�?group by 是默认排序的. outlist 表示最后需要的输出 , row表示最后输出的一条数�?/p>

for ( 按照��L��据��@�? {

row.customerid = customers.customerid;

if( customers.customerid == avlist[b].customerid) {

outlist[x].autotaol = avlist[b].autotal ;

b++

}

四个view 同一个判断方�? 但是每个view 的指针指的是不一��L��.

最�? outlistSet . add (outlist[x])

}

如果数据源本�w�的数据量也很大�Q�需要输出的数据也很多，则上面两�U�方式都会有性能问题�Q�这时可以考虑商业��里面的万金��a方式: ETL

3. ETL

从上面这个表��L��来，可能会有两个隐含条�g.一个是聚合的数据粒度在旉��上是月，另一个在销售地点粒度上是：支行086001-301 , 所以用ETL一开始就聚合数据可能会更好的解决性能问题.另外一个是如果用户惌��排序和过滤数据的话用一个单独的ETL聚合表也比拼数据的方式好的多.

�q�篇文章的目的�ƈ不只是想解释一个做表的问题�Q�而是说明商业��的一些问题不光需要站在一个独立的角度思考，有些问题本��n可能随着环境的一些变化�? 采取对应的措施，比如上面��Z��解决排序�Q�过滤，左右�q�接�Q�性能问题都需要从不同的角度来考虑问题.有时候可能一个做表的问题不光只是要限定在sql 或某个报表��Y件的本��n�Q�有时候某个ETL问题可能不关只是ETL��p��解决�?随着情况的复杂可能需要从整个商业��的全局来进行考虑�Q�商业智能越来越們֐� 与多个解��x��法的融合.

本文原文�?http://www.gemini5201314.net

如果你对ETL中性能优化问题有兴��的话，也可以查看另一��关于在ETL中性能优化要站在全局的角度，而不是只在数据库角度的文�?

gemini 2008-03-21 12:16 发表评论

重新学习Birt �?.....

gemini — Tue, 19 Jun 2007 15:07:00 GMT

重新学习Birt �?.....

又重新回到birt的学习中�Q�以前用的时候本�w�功能也不算太好�Q�再加上自己是个比较��躁的�h�Q�什么都想了解一点，所以学�? 也不是很好，最�q�计划又重新�pȝ��的学习一下Birt �Q�网上搜了一下，除了eclipse 官方的资料外�Q�几乎没有什么有用的资料�Q�要么就是太旧了�Q�要么根本就是没有用�Q�你抄我的，我抄他的�Q�最后大安��抄成了一��L��了，
��了�Q�还是自己动手，丰衣��食吧，军_��q�是好文章自己写, 先写下自��q��计划�?, 把roadmap 攑և�来，也算�l�自�׃��U�鞭�{�吧.

�W�一��?: 把birt �?ecilpse 跑出�?最��单的Java �E�序. (eclipse 官方的例�?
把birt 攑ֈ� tomcat 跑�v�? (eclipse 官方的例�?

�W�二��?: 利用eclipse 的可视化报表设计器设计模�?主要介绍,参数�Q�sorting , grouping , mapping , filtering , hightlighting ,
(eclipse 官方flash演示的文字版)

�W�三��?: 利用birt 的desing api �?report api 来做java �~�程�Q�主要还是集成到servlet 环境.

�W�四��?: �?birt 和pentaho 集成��h�� . (其实pentaho 官方有一份这个文�?不过我的例子�E�微会介�l�的更加实用一�?

大约旉��是一个月吧，如果��期了，我就请大家吃饭，呵呵�Q�只要你能够扄��到我 ,
要真��C��那个时候，我只能说:
地球是很危险的，我还是回火星��d��.

有很多朋友都说birt 让他们很失望�Q�其实birt 有一�Ҏ��能问题外，基本�q�算可以�Q�如果你非要说有�q�些�Q�那些不爽，我只能说一句话:
�q�记得大话西渔R��面，周星驰率领一��土匪围�ȝ��晶晶她们, 她们在周星驰重要部位点了两次火，然后吴孟达说�Q�都焦了�Q�割了算了吧.
记得周星驰说什么吗�Q?br> 不记得就再去重温一遍经典吧?

gemini 2007-06-19 23:07 发表评论

gemini — Sun, 17 Jun 2007 08:33:00 GMT

                        eclipse enropa 卛_��发布 birt 的新功能一�?br>最新的eclipse enropa 卛_��?�?9号发布了.官方说会�?1个项目同时发�?其中我只兛_��三个��目.一个是WTP , 一个是TPTP 最后一个是BIRT .
我看了一下BIRT 所增加的新功能�Q�从2.2M4 开�?br>http://www.eclipse.org/birt/phoenix/project/notable2.2M4.php
http://www.eclipse.org/birt/phoenix/project/notable2.2M5.php
http://www.eclipse.org/birt/phoenix/project/notable2.2M6.php
http://www.eclipse.org/birt/phoenix/project/notable2.2RC0.php

2.2 M4
1 . 和WTP集成的BIRT Tag .
2 . Word Emitter                 支持WORD �?emitter . (emitter ��译是发��，我想应该是可以预览和打印的输出格式吧)
3 . XML Source Editor            支持xml 格式的编辑器
4 . Property Editor Changes
5 . Highlight Style              对于特定条�g的Item �q�行高亮昄��.

2.2 M5
1 . BIRT Chart Improvements
2 . Viewer Improvements
3 . Emitters                   增强了PDF 的emitters
4 . Advanced Properties        现在可以昄��所有的属性了.

2.2 M6
1 . BIRT Chart Improvements    新增加了一�U�chart tag library 和chart view servlet
2 . XLS Emitter Prototype      新增加了一�U�XLS 输出的格�?br>3 . Linking Cascading Style Sheets      情理之中的事�?br>4 . BIRT Viewer Changes
5 . Report Examples View        新提供了一些example,提供�l�初学者和想了解birt新功能的爱好�?
6 . Dynamic Connection Profiles 动态的数据源链�?br>7 . Report Parameter Changes    增加了一�U�组合框的parameter view.�c�M��与选省份和城市的那�U�双选框.

2.2 RC0
1 . Web Service ODA             新增加的Web Service 的数据源.可以支持像ebay , amazon的那�U�Web Service 的数据了.
2 . Charting Improvements       新增加��用script 来处理chart的事�?好像是用的javascript.
3 . PPT Emitter                 新增加对Power Point 的emitter.
4 . Dynamic Crosstab Support
    �q�是最让我�Ȁ动的功能.完全��是OLAP的功能的一部分.Palo的demo中，是通过一个Excel 的Plug-in,是excel 支持olap的，不过它不能跨�q�_��Q�甚臌��excel 都跨不出去，
    而birt提供的这个功能更加的强大.而且很容易就能够实现�Q�定制化也比较强(��是说它提供API �Q�让你自��q��E�实现这些功�?.

一下子看到BIRT太多的功能了�Q�希望能够正式发布的时候birt能够比较�E�_��?

没有扑ֈ�WTP2.0 �?TPTP 4.3 的新功能列表.
其中我只兛_��在TPTP 4.2.2 Callisto 中的TPTP�l�常性的Block 的Issue 解决了没�?
同样希望TPTP也能够稳定吧。功能倒是其次. java 中profiler 工具倒是不少�Q�可是大多好的都是商业的�Q�难得有一个这么好的开源的版本�Q�要是bug问题不解军_��不好�?

听说eclipse 的SOA 建模工具�W�一�ơ发�?我倒是不关心，目前�q�是把精力focus birt上了�Q�觉得eclipse 本��n可能已经没有太多新功能发展了�Q�主要就是把plugin 做好�Q?br>然后惛_��法能够解决plugin 之间版本的兼�Ҏ��问题就够了. 最�q�也试用了一下NetBean ,没有深入用，�q�是有点失望的，希望NetBean 的坚定拥护者不要扁�? 字体丑，界面�?br>也就��了�Q�但是跑出来吓�h��是你的不对了嘛! 丑也��q��了，速度也稍微慢一点（我说的是�E�微�Q?本来想看一下它的Porfiler 功能怎么��L��Q�后来还是算了，毕竟自己没打��?br>�?��q��是自己没有深入用�q�，不懂吧，��p��了话�Q�希望不要引起Netbean 支持者的��h��.

最�q�在collab下蝲svn 的时候无意中看到了它的svn enterprise 版的.其中有一个是支持eclipse �?Mylyn 插�g的（21个项目其中一�?,做项目管理的.不知道eclipse �?br>Mylyn 是不是有打算�q�入��目��理领域 . 它居然还�?.0�?不知道有哪位用过.

最�q��用firefox的时�?�Q�有时候打开一个网��莫名其妙的��firefox 挂掉了，也不是真的挂了，��是有时候等�?分钟它又好了�Q�有时候firefox整个不见了，但是�q�程里面
它还在，你点开一个新的firefox 然后两个人就手拉手的都跑出来�? 不知道是不是大家也有遇到�q�相同情�늚�. 装了Opera , firefox 挂掉的时候就用Opera , 里面有一�?br>打电话的功能我觉得倒是非常的有意思，创意呀! 不希望firefox 独大 �Q?也不希望eclipse 独大 �Q�更不希望Microsoft 独大 , 同样不希�?Intel 独大(AMD hold on) .
有竞争才能推动发展嘛.

最�q�在msn 上认识了许多朋友. 有一位跟我聊起了JBoss , 我对JBoss 的认识还停留在JBoss 服务器上.后来听他说才知道JBoss 已经发展了一套完整的J2EE 框架了，包括很多
斚w��,才恍然大�?原来现在中间件这么重�? Red Hat 跟exadel �l�盟要推新的SOA 工具�Q�好像SOA是很火的�Q�不�q�还是认为如果公�怸�是做SOA 的，学SOA 没有什么用.
SOA 要在中国成熟�q�要很多�q�的.那时候都不知道是个什么样子了.不过��来一个公叔R��对��用多�U�操作系�l�，多种数据库，多种软�g�q�_��Q�多�U�编�E�语�a��Q��M��需要一个框�?br>来解册��些问题的�Q�就��SOA 成功了也好，SOA ��p�|了也好，需求��L��会有�?�q�是�{�SOA 成熟了再观望一下吧, �q�告看看�q�可以，要真掏钱出来�q�是要�}慎的�?br>�U�属个�h认识�Q�说的不对还请高手指�?

写的比较�?��当是看八卦�?

最�q�学习Birt �Q�主要是它的新功�?然后�q�是准备学会如何在pentaho里面集成 birt �?希望能够和birt 爱好者，��其是高手一起交��?

gemini 2007-06-17 16:33 发表评论

商业��研究(十七) Mondrian 如何使用 materialized view

gemini — Sun, 10 Jun 2007 11:02:00 GMT

摘要: 阅读全文

gemini 2007-06-10 19:02 发表评论

商业��研究(十六)materialized view+dimension提高mondrian性能(�?

gemini — Sun, 10 Jun 2007 10:58:00 GMT

摘要: 阅读全文

gemini 2007-06-10 18:58 发表评论

商业��研究(十五) materialized view+dimension提高mondrian性能

gemini — Sun, 10 Jun 2007 10:57:00 GMT

摘要: 阅读全文

gemini 2007-06-10 18:57 发表评论

商业��研究(十四) mondrian + oracle 部��vfoodmart demo

gemini — Sun, 10 Jun 2007 10:56:00 GMT

摘要: 阅读全文

gemini 2007-06-10 18:56 发表评论

gemini — Sat, 09 Jun 2007 13:54:00 GMT

摘要: 阅读全文

gemini 2007-06-09 21:54 发表评论

在tomcat上部�|�pentaho 1.5.3

gemini — Sat, 02 Jun 2007 10:07:00 GMT

最�q�一直在做mondrian的foodmart的实验，有位朋友的公司要部��v一个pentaho的demo来做演示�Q�我跟他说直接运行demo��可�? 了，但是他们公司非要自己从头配一个，所以我��p��己做了一下实验基于最新的1.5.3的，其实步骤都差不多�Q�其他版本也应该可以�Q�希望能�l�喜��? pentaho的朋友一点帮助�?br>
1 . 首先需要下载pentaho-j2ee-deployment- , pentaho-data- �?pentaho-solution- 三个包，分别解压��C��个不同的地方
2 . 从命令行�q�入pentaho-j2ee-deployment 目录�Q�运行ant -p 会列出所有的ant ��d��Q�执行war-pentaho-tomcat-hypersonic��d��,成功之后会生�?个war包，pentaho-portal- layout.war , pentaho-style.war �?sw-style.war �Q?sw-style.war 是steel-wheel-style �Q�是可选项�Q�可能是pentaho的一个例子或者是pentaho的一�U�style风格),�q�有多出一个tomcat目录下的hsqldb目录下有一�? pentaho.war �Q�如果你执行的是war-pentaho-mysql��是在tomcat目录下有个mysql5目录�Q�里面一��h��pentaho.war.我选用的是 hsqldb .
3 . 在你的tomcat的安装目录下扑ֈ�conf / server.xml 文�g�Q�在其中的host 元素下加上如下这一�D�，�q�一�D�|��从pentaho的文档里面抄来的�Q�manual-deployment-pentaho- ,其中它列出来的有些多余，�q�个文档应该使用confluence 用pdf 方式导出的，抄的时候注意检查一下xml 元素排版上的问题.它列出的resource 元素太多了，你查看pentaho-data- 包里面，应该只有四个数据库hibernate,sampledata,shark,quartz ,把不用的resource元素都删掉，�Q�应该是最上面的四个）.如果你的tomcat启动不了了，��查一下你��d��的部分是不是有错�?br>

1
2 <Context path="/pentaho" docbase="webapps/pentaho/">
3     <Resource name="jdbc/SampleData" auth="Container"
4         type="javax.sql.DataSource" maxActive="20" maxIdle="5" maxWait="10000"
5         username="pentaho_user" password="password"
6         factory="org.apache.commons.dbcp.BasicDataSourceFactory"
7         driverClassName="org.hsqldb.jdbcDriver"
8         url="jdbc:hsqldb:hsql://localhost/sampledata" />
9     <Resource name="jdbc/Hibernate" auth="Container"
10         type="javax.sql.DataSource"
11         factory="org.apache.commons.dbcp.BasicDataSourceFactory"
12         maxActive="20" maxIdle="5" maxWait="10000" username="hibuser"
13         password="password" driverClassName="org.hsqldb.jdbcDriver"
14         url="jdbc:hsqldb:hsql://localhost/hibernate" />
15     <Resource name="jdbc/Quartz" auth="Container"
16         type="javax.sql.DataSource"
17         factory="org.apache.commons.dbcp.BasicDataSourceFactory"
18         maxActive="20" maxIdle="5" maxWait="10000" username="pentaho_user"
19         password="password" driverClassName="org.hsqldb.jdbcDriver"
20         url="jdbc:hsqldb:hsql://localhost/quartz" />
21     <Resource name="jdbc/Shark" auth="Container"
22         type="javax.sql.DataSource"
23         factory="org.apache.commons.dbcp.BasicDataSourceFactory"
24         maxActive="20" maxIdle="5" maxWait="10000" username="sa" password=""
25         driverClassName="org.hsqldb.jdbcDriver"
26         url="jdbc:hsqldb:hsql://localhost/shark" />
27 Context>
28

4 . 把pentaho.war copy到tomcat 的webapps目录下，它会自动解压的，然后关闭tomcat , 扑ֈ�pentaho/WEB-INF/web.xml 文�g�Q�找到solution-path元素�Q�指向你解压后的pentaho-solution- 目录�Q�注意java里面是用正斜�?/ ,如果你从windows的地址栏copy的话注意把反斜杠改一�?
5 . 修改pentaho/WEB-INF/classes 目录下的log4j.xml文�g�Q�把里面的value�Ҏ��INFO,或者更高，�q�一步是可选项�Q�主要是启动的时候出现很多不必要的debug 信息.如果你启动的时候出错了�Q�再改回来�?一般都是solution-path没有扑֯��Q�我�?-zip解压的时候老是解压��C��个新的目录，所以后来指 �?solution-path 的时候，目录地址高了一�U?)
6 . 启动pentaho-data- 目录里面的hsqldb数据�?
7 . �q�个时候启动tomcat ,应该是不报�Q何错误的.你把��览器指向http://localhost:8080/pentaho �Q�会看到pentaho的界面的�Q�只不过是没有什么颜色的那种.
8 . 把编译後的三个war文�gcopy到tomcat 的webapps目录下，�{�它们自动解压之后，再进�ȝ��Q�发现有了样式了。安装就完成�?

贴几张图:
pentaho成功启动后应该有 Pentaho BI �q�_��服务器就�l?�q�句�?

安装了style �?portal 包之后的��d��界面

在pentaho-data- 目录的lib 目录下执行java -cp hsqldb.jar org.hsqldb.util.DatabaseManager 出现的hsqldb 的manager ��d��画面
用户名和密码都在相应目录的数据库文�g里面�Q�hsqldb的数据库文�g是可以用
文本�~�辑器打开的，搜烦password��可以找到用户名和密码了

sampledata 里面的数�?br>

我在安装的时候也��到了诸多的问题�Q?br> 1 . 一开始编译的时候��用的ant war-pentaho-tomcat ��d��Q�它直接报错�Q�说找不到rdbms目录�Q�后来猜惌��个�Q务应该是留给其他数据库编译的时候扩展的.直接��换了war-pentaho-tomcat- hypersonic ��d��重新�~�译了一��?br> 2 . 后来从文档里copy出数据源的那句话出错了，��D��tomcat启动不了�Q�因��Z��pdf文�gcopy的那�D�话排版有问题，后来把它�_�脓到eclipse (装了WTP插�g的）里面�Q�一格式化就看出来了�Q�context 元素和后面的属性path中间的空格没了，�q�有多出来了几个resource元素.
3 . 指定solution-path的时候目录高了一�U?
4 . 启动tomcat的时候出��C��很多不必要的debug信息�Q�修改log4j文�g��可以了�Q�它在tomcat/bin 目录下还会生成几个log文�g�Q�像是server.log 和ReportEngine_.log 文�g�?br>

写这��文章的目的更多的是希望喜欢pentaho的朋友在用pentaho做实验的时候能够学会思考，出现了问题先在网上找资料�Q�而不是无论遇��C��么问题都求别人来回答你，知识是长期积累的�q�程�Q�新技术��L��不断的出玎ͼ�比如最�q�火的不得了的JavaFX,
也许��来pentaho可能会用JavaFX 来做OLAP �?DashBoard 也不一定的。关键还是要掌握学习的方法，学会思考问�?. 我安装的时候也遇到了很多问题，但是只要你细�l�的分析问题的原因，��L��可以扑և�解决的办法的.

gemini 2007-06-02 18:07 发表评论

商业��q�_��研究 (�? ETL 选型

gemini — Tue, 22 May 2007 13:41:00 GMT

商业��q�_��研究 (�? ETL 选型
ETL (Extract-Transform-Load的羃写，��x��据抽取、�{换、装载的�q�程)作�ؓBI/DW�Q�Business Intelligence�Q�的核心和灵��，能够按照�l�一的规则集成�ƈ提高数据的�h��|��是负责完成数据从数据源向目标数据仓库转化的过�E�，是实施数据仓库的重要步骤。如果说数据仓库的模型设计是一座大厦的设计蓝图�Q�数据是砖瓦的话�Q�那么ETL��是��大厦的过�E�。在整个��目中最��N��分是用户需求分析和模型�? 计，而ETL规则设计和实施则是工作量最大的�Q�约占整个项目的60%�?0%�Q�这是国内外从众多实践中得到的普遍共识�?br>
ETL工具从厂商来分�ؓ两种,一�U�是数据库厂商自带的ETL工具,Oracle warehouse builder ��是�q�种,另外一�U�是�W�三方工��h��供商.开源世界也有一大票的ETL工具,功能各异,强弱不一,你可以从一下地址扑ֈ�开源ETL工具的列�? http://www.manageability.org/blog/stuff/open-source-etl/view , 提醒一�?选用工具的时候要慎重,真的,千万要慎�?不管你是选用商业的ETL工具(一般比较贵),�q�是开源的工具,都要在你充分了解产品的特性才去�? �?千万不要听某某�h说什么这个工具好,��p��C��那个工具,一定要自己了解产品.

开源的ETL工具的列�?(排名是�ؕ排的)
kettle http://kettle.pentaho.org/ ,pentaho官方的ETL工具,是一个metadata-driven 的ETL工具,不需要自己写code .
talend http://www.talend.com/    talend是talend自己公司的��?宣传的是全功能的Data Integration 解决�Ҏ��,��Z��eclipse �q�_��,包括很多的模块来实现商业��程建模,数据��程建模,最后输出的是perl �?Java code
jasperETL http://www.jaspersoft.com/   JasperETL是基于talend的��^�?不太清楚有什么区�?jaspersoft开发的ETL产品.
Octopus   http://www.enhydra.org/tech/octopus/index.html    octopuc是enhydra 的一个ETL工具,enhydra是一个��品跨度非常大的开源站�?它有个开源的Workflow ,Shark ,pentaho��是使用的这个Workflow ,�q�个�l�织从workflow 到application server , 从ETL工具到application framework ,�q�有一些其他的中间�?octopus非常的原�?支持��M��的JDBC数据�?用XML语言来定义的.也支持JDBC-DOBC ,和excel �? access ,csv-files, XML files ,用Ant �?JUnit 来创��和测�?
CloverETL http://cloveretl.berlios.de/   CloverETL是提供给你一�l�API,用XML来定义ETL�q�程,同样支持JDBC数据�? CloverETL是开源的,但是它是没有囑�Ş界面�?它提供一个有囑�Ş界面的CloverGUI 来进行ETL的图形化开发过�E?但是不是开源的,需要购买商业许可证.
KETL   http://www.ketl.org/    听说是几个前IBM员工做出来的ETL产品,
另外�q�有很多.不一一写介�l�了,只列个表�?
Joost        http://joost.sourceforge.net/    最�q�有个web2.0 �|�站也叫Joost,名字相同而已.
Xineo        http://software.xineo.net/xil.jspx
BabelDoc        http://sourceforge.net/projects/babeldoc
CB2XML        http://sourceforge.net/projects/cb2xml
mec-eagle        http://sourceforge.net/projects/mec-eagle/
Transmorpher        http://transmorpher.inrialpes.fr/
XPipe        http://xpipe.sourceforge.net/Articles/Miscellaneous/fog0000000018.html
DataSift        http://www.datasift.org/
Xephyrus Flume        http://www.xephyrus.com/flume/flume-intro.Prlx
Smallx        https://smallx.dev.java.net/
Nux        http://dsd.lbl.gov/nux/index.html
Netflux        http://www.netflux.org/
OpenDigger       https://opendigger.dev.java.net/
ServingXML        http://servingxml.sourceforge.net/
Scriptella        http://scriptella.javaforge.com/
ETL Integrator        http://www.glassfishwiki.org/jbiwiki/Wiki.jsp?page=ETLSE
Jitterbit        http://www.jitterbit.com/
Apatar        http://www.apatar.com/
Spring Batch       http://static.springframework.org/spring-batch/

大多数站炚w��是在sf.net上的.其中最后一个是Spring�?大名鼎鼎的Spring 也往ETL插一�?实在�?.........
�Ҏ��talend官方介绍的数�?ETL工具的市��Z��额在2006好像是有160多亿��元.�׃��BI��目的成�?ETL的这一市场份额�q�会扩大,�q�也不难理解,��Z��么这么多的公叔R��在做ETL工具�?开源世界也免不了想要分一杯羹.再次废话一�?开源的东西你可以免费得到和使用,但是当你惛_��用到企业�U�开发的时�?省钱可不是唯一应该考虑的因�?�q�是那句�?慎重呀慎重.

下一��介�l�BI的基本概�?

gemini 2007-05-22 21:41 发表评论

欧美日本精品一区二区三区,欧美激情视频一区二区三区免费,色综合久久综合网

商业�����需要站在全局角度考虑问题

重新学习Birt �?.....

商业�����研究(十七) Mondrian 如何使用 materialized view

商业�����研究(十六)materialized view+dimension提高mondrian性能(�?

商业�����研究(十五) materialized view+dimension提高mondrian性能

商业�����研究(十四) mondrian + oracle 部��vfoodmart demo

在tomcat上部�|�pentaho 1.5.3

商业������q�_��研究 (�? ETL 选型

商业��需要站在全局角度考虑问题

商业��研究(十七) Mondrian 如何使用 materialized view

商业��研究(十六)materialized view+dimension提高mondrian性能(�?

商业��研究(十五) materialized view+dimension提高mondrian性能

商业��研究(十四) mondrian + oracle 部��vfoodmart demo

商业��q�_��研究 (�? ETL 选型