集算器助力 ireport

在使用 Jasper 报表工具制作报表时,常常会遇到数据来自多个数据源的情况,通常的做法是使用主子报表或者使用javabean作为数据源。使用主子报表通常会增加报表设计的复杂度,而使用javabean做数据源,则需要一个javabean类来支持,并且为了在设计报表时能够看到数据,还要为ireport提供一个静态方法,该方法用于返回上面定义javabean的一个结果集。

显然,上面这两种办法都不太方便,本文将提供一种更加简便的方法,那就是通过集算器来解决ireport中的多数据源问题,并进一步提高ireport的性能。我们将JasperReport5.6.0 开发环境为例进行介绍。

ireport 中如何使用多数据源

报表项目中,常常会出现报表源数据来自不同数据库的情况,例如同一应用系统的数据库负载太大,不得已分成多个数据库,就像是最常见的销售系统数据分成当前库和历史库,一部分数据存于数据库一部分数据存于文件等。

多数据源的数据库类型方面,报表工具可能连接同样类型的数据库,比如都是mysql或者 oracle;也可能是不同的类型txtcsv或者Excel等。

我们的例子中,报表数据一部分来自mysql数据库,一部分来自文本文件。

其中,mysql数据库的employee表存储EID1-100000的数据,内容如下:

undefined

data.txt文件中存储EID100001-101000的数据,内容如下:

undefined

 

我们的任务是ireport中制作一张报表查看employee表和emp.txt文件合并后的所有数据。这一需求通过集算器协助 ireport可以轻松实现。集算器使用我们称之为结构化处理语言Structured Process Language简称SPL),具体的SPL代码如下:


A

1

=connect("mysql")

2

=A1.query@x("select * from employee")

3

=file("F:\\files\\emp.txt").import@t()

4

=[A2,A3].conj()

5

return A4

 

A1创建数据源连接,连接mysql数据源。

A2mysql数据源中查询employee表中的数据,并返回查询结果。

undefined

A3读取文件emp.txt的内容

undefined

A4合并A2A3数据。

undefined

A4A4合并后的结果返回给报表。

 

为了在报表中呈现计算结果,我们需要将以上 SPL 代码存为文件 employee.dfx,然后就可以利用集算器对外提供 JDBC 接口调用这个脚本了

在报表工具中通过建立 JDBC 数据源引入集算器脚本的方法和调用存储过程一样,在 Jasper 的 SQL 设计器中可以用call employee()来调用。具体步骤在《JasperReport 调用 SPL 脚本》一文中有详细的描述。

然后,我们可以ireport 中设计一个最简单的报表employee.jrxml,模板如下:

undefined

预览后可以直接看到报表结果

 

undefined

显然,这个过程相比传统的主子报表或者javabean方法要简单不少,更重要的是,计算逻辑非常清晰,集成方式也几乎没有任何学习成本

性能优化

在解决了基本的功能需求后,我们还可以进一步将焦点关注到性能方面。报表项目中,常常需要将多个表连接查询,在这些被连接的表中,可能会包含海量的数据。例如:将雇员表和订单表通过共有字段员工编号连接起来,以便查看某些订单的销售人员的信息。显然,订单表会随着时间的推移不断增长,最终带来严重的系统负担。

下面例子中的报表数据一部分来自mysql数据库的employee表,一部分来自mysql数据库的sales表。

其中,employee表存储EID1-3000000雇员数据,内容如下:

undefined

而订单数据sales存储76万条数据,而且持续增加。其中的数据内容样例如下:

 

undefined

为了实现连接查询,我们ireport 中设计一个最简单的报表mysql_join.jrxml,模板如下:

undefined

首先我们看一下传统做法的表现。我们需要查询早于2015-04-01EID小于1000001的雇员产生的销售数据,SQL 语句如下:

select sales.OID,sales.Date,sales.EID,sales.Amount,employee.Name from sales join employee on sales.EID=employee.EID where sales.Date<'2015-04-01'and employee.EID<1000001

点击预览,在我们的测试环境下,101s后展现计算结果:

undefined

接下来,我们看看用集算器jdbc运行效果。将上边的报表另存为esproc_join.jrxml

然后编写如下的SPL代码:


A

1

=connect("mysql")

2

=A1.cursor("select * from sales where   Date<'2015-04-01'")

3

=A1.query("select EID,Name from employee   where  EID<1000001").keys(EID)

4

=A2.join@i(EID,A3:EID,Name)

5

return A4.fetch()

 

A1创建数据源连接,连接mysql数据源。

A2查询sales表中Date早于2015-04-01的数据,将结果返回成游标。

A3查询employee表中EID小于1000001EID列和Name列的数据

undefined

A4游标A2与序表A3外键式连接。

A5将游标的结果返回给报表。

 

接下来和前一个例子一样,将以上 SPL 代码存为文件esproc_join.dfx,并在数据源中定义SQL

call esproc_join()

现在我们点击预览,在同样的测试环境下14s就得到了完全相同的计算结果。

可见使用集算器在简化了ireport访问多数据源的同时可以大大提高ireport的性能。本文中例子是集算器中一些简单的应用事实上,基于集算器的灵活性,使用集算器提高性能的办法有很多,包括并行取数、可控缓存、控制SQL执行路径、减少隐藏格引入数据计算层等等。更多更高级的使用快来乾学院看看吧!