"除了数据库，报表工具本身通常也可以连接一些非关系数据库的数据源，包括 NoSQL、文件（CSV/Excel/JSON）、Hadoop、RESTful 等。但这类数据源的计算能力较弱，往往需要将 .."

lisongbo
乾学院 29 号会员
1 回帖 • 993 浏览 • 4 年前

报表工具如何使用 NoSQL/Restful/ 文件等非数据库数据源？

推广

除了数据库，报表工具本身通常也可以连接一些非关系数据库的数据源，包括 NoSQL、文件（CSV/Excel/JSON）、Hadoop、RESTful 等。但这类数据源的计算能力较弱，往往需要将数据取出在外部计算，而报表工具的计算能力也有限，这就导致报表开发困难。这时就要二次开发硬编码完成报表数据准备，十分繁琐。

使用集算器 SPL 配合报表工具，可以彻底通用地解决这个问题。集算器是专业的开源数据处理引擎，内置了很多结构化数据计算函数具备很强的计算能力。同时集算器支持多种数据源连接，包括大量的非关系数据库，可以轻松搞定搞定报表工具使用这类数据源。目前集算器支持的部分数据源如下：

TXT/CSV、Excel、Json、XML、阿里云、Cassandra、MDX、ElasticSearch、Ftp、Hbase、HDFS、Hive、Influxdb、Kafka、MongoDB、Redis、Salesforce、SAP/BW、Spark、Webcrawl、HTTP/Webservice/Restful

还在不断增加中。

集算器提供了专门的形式化语法 SPL，比如用 SPL 连接 MongoDB 并计算的脚本如下：

	A
1	=mongo_open("mongodb://127.0.0.1:27017/mongo")
2	=mongo_shell(A1,"test1.find()")
3	=A2.new(Orders.OrderID,Orders.Client,Name,Gender,Dept).fetch()
4	=mongo_close(A1)
5	return A3

前面说过，非关系数据库和报表工具的计算能力较弱，SPL 正好还可以补上这个缺点，将数据源中无法实施的计算放到 SPL 中处理，借助 SPL 的敏捷语法、丰富的计算类库、多样性数据源支持、跨库运算、多数据源混合计算、并行计算、高性能存储等特性快速、高效完成数据运算，为报表工具返回计算结果，报表工具直接进行数据呈现即可。

集算器可以作为嵌入式 JDBC 与报表工具集成使用，报表工具通过 JDBC 方式访问 SPL 计算结果，就像访问数据库一样。

imagepng

总结一下，集算器不仅提供了多种非关系数据库支持，还具备较强的计算能力可以完成复杂数据处理任务，并且敏捷的 SPL 语法实施这些计算也很简单。还能作为嵌入式计算引擎与报表工具集成使用，通过 JDBC 就可以访问 SPL 计算结果，简单方便。