润乾报表对接 Hive 数据库

Hive 数据仓库常用的连接方式有两种:

  1. 标准的 jdbc 连接方式,与常见关系型数据库配置方式相同;

  2. Hive CLI 连接,支持 Hive QL,速度快、操作便捷。

针对 hive 的 jdbc 连接,具体如下:

1、下载 Hive 的 jdbc 驱动 jar,放至润乾报表设计器安装路径的 common/jdbc 文件夹下

2、启动设计器,菜单栏 工具–数据源, 新增数据库连接配置,选择 jdbc 方式

1png

其中,配置参数:

数据源名: 自定义即可

数据库类型:Other

驱动:org.apache.hive.jdbc.HiveDriver

url:jdbc:hive2://172.16.10.30:10000/gxxf

注:其中 ip、端口、数据库按照实际情况填写即可

用户名 / 密码:按实际情况设置即可

3、“确定”保存,测试连接即可。

注:不论普通报表还是填报均支持。

除此之外,润乾报表也提供了 Hive CLI 接口方式连接,具体如下:

1. 下载外部库功能依赖的 jar 文件

外部库功能 ](http://c.raqsoft.com.cn/article/1532597958129)

存储至服务器任何目录下(建议存储在报表应用下,避免误删)

2. 启动设计器,菜单栏 工具 — 选项 – 集算器选项,指定 外部库目录 ,然后选出对应的数据库 HiveCli, 之后确定保存目前的配置。

2png

3. 重点!!!

重启 IDE(即报表工具) 重新加载外部库生效。

4. 启动设计器,菜单栏 报表 — 数据集 – 选择脚本数据集(或者集算器),使用外部库函数 hive_client()、 hive_query()、hive_cursor() 等进行连接取数。

3png

这是两个不同的接口方式,访问数据库,使用方式不同。

JDBC 连接 配置步骤简洁,但经常会引起取数性能问题。

而 Hive CLI 连接,支持 Hive QL,速度快、操作便捷。

注:HiveCli 要求 java 环境为 jre1.7 及以上版本。

上面介绍了设计报表阶段,设计器怎么连接 Hive 数据仓库,下面介绍一下服务器端,也就是我们的项目应用中,应该做些什么配置。

针对 hive 的 jdbc 连接,具体如下:

Web 容器以 tomcat 为例:

1. 下载 hive 的 jdbc 驱动 jar,放至 tomcat/lib 目录下

2. 在./demo/WEB-INF/raqsoftConfig.xml 文件的 …里面加上一下代码:

注:要跟设计器中定义的数据源名称保持一致

其中,ip、端口、数据库按照实际情况填写即可;更过参数说明可参考http://d.raqsoft.com.cn:6999/report/preference/xgwjdpz185.html#__465

3. 完成应用部署的其他操作,即可正常访问。(非本文重点,如果不清楚可以登录乾学院获取)

Hive CLI 接口方式连接,具体如下:

1. 加载需要用到的 jar 包 (同润乾报表连接 Hive CLI 所需 jar 一样)

2. 在./demo/WEB-INF/raqsoftConfig.xml 文件的 … 里面加上以下代码:

外部库文件夹路径

外部库文件夹名称

3. 访问调用该数据库的报表文件。

注:详情可以参考 外部库指南 – 第三方应用程序中连接外部库。