计算&AI •
990 引用 •
1070 回帖 •
471 关注
博客
关注
-
把 Excel 文件导入关系数据库是数据分析业务中经常要做的事情,但许多 Excel 文件的格式并不规整,需要事先将其中的数据结构化后再用 SQL 语句写入数据库。JAVA程序猿经常选择使用P ..
-
【摘要】 集算器产品中提供了 HTTP 服务,用户可以通过 url 的方式读取 SPL 的结果集 ${article} 实现思路如下: [图片] 部署服务 部署服务器操作可分为两步,首先是配置 ..
-
【摘要】 应用开发中,我们会涉及多种不同类型的数据库,虽然 SQL 语法大体是相似的,但是不同数 ..
-
集算器提供了 ODBC 接口,C# 可以通过集算器 ODBC 调用 SPL。结构图如下: [图片] ODBC 服务 安装集算器 ODBC 驱动 使用集算器 ODBC,首先客户端需要安装 ODB ..
-
集算器产品在润乾官网中的安装包下载地址为:http://www.raqsoft.com.cn/download/download-jsq 其中,通过点击[图片] 下载的后缀为 tar.gz 的 ..
-
1544410181816 【摘要】 集算器提供了 JDBC 驱动,可以很方便的与其他报表工具进行集成,其中就包括 BIRT 报表。本文章中以 BIRT4.18.0 开发环境为例,介绍 BIR ..
-
1544066331124 【摘要】 集算器提供了 JDBC 驱动,很容易嵌入到 Java 程序调用,方法和在 Java 中执行 SQL 和存储过程类似。 去乾学院看个究竟:${article ..
-
学生成绩表 score 的示例数据如下: [图片] 《下载测试数据》 1、统计各科前 3 名 统计结果要如下展示,每个名次一行,每个学科一列,并列名次的多人用逗号连结: [图片] 计算结果的格 ..
-
简化后的进货表 purchases、销售表 sales 的部分数据如下: sales: [图片] purchases: [图片] 《下载测试数据》 1、统计各产品多少周发生过断货 这里只统计断 ..
-
简化后的账户表 user、访问表 view 的部分数据如下: user: [图片] view: [图片] 《下载测试数据》 1、统计每个账号访问各个产品的分钟数 按账户 id、产品分组汇总出分 ..
-
简化后的用户行为表 actions 的部分数据如下,记录各个用户 9 种事件的发生时间: [图片] 《下载测试数据》 1、查找按顺序触发过 e2、e3、e7 事件的用户 顺序事件不要求连续。 ..
-
本篇接续《数据分析编程从 SQL 到 SPL:用户事件统计》, 延用用户行为表 actions,记录各个用户 9 种事件的发生时间: [图片] 【下载测试数据】 3、连续 4 天活跃度排名前 ..
-
简化后的用户行为表 actions 的部分数据如下,记录各个用户 9 种事件的发生时间: [图片] 【下载测试数据】 1、计算每个用户会话次数 一个用户超过 2 天无操作或 e8 事件后 2 ..
-
下载测试文本 结构化文本计算需求 结构化文本文件是常见的数据存储方式,比如这个score.txt,记录了所有班级学生的成绩,第一行是列名,之后每一行是一个学生的数据,行内用制表符分隔。 [图片 ..
-
SPL针对多种云对象存储(亚马逊S3、阿里云OSS、谷歌GCS、微软Azure)各实现了一套命令,能像读写本地数据文件一样方便的读写云上的数据,这样就容易把SPL灵活的计算能力应用到云数据。下 ..
-
TPC 官网提供了 C 语言生成程序,下载编译后执行,就可以生成 TPCH 数据了。 但是, 很多人对 C 语言及其环境不熟悉,就卡在这一步了。 这里按照官方规则,写了一段 SP ..
-
一、元数据权限( 控制表和字段) WEB系统经常是多用户的,要控制不同用户看到不同范围的元数据信息,有两种实现方式,一是给每种用户创建独立的元数据,部署成多个DQL服务,然后根据当前用户用JD ..
-
一、 部署DQL 服务 DQL服务器的启动程序是{安装目录}/esProc/bin/startDQLSERVER.bat(linux下是……startDQLSERVER.sh),运行它之前,先 ..
-
一、 准备数据 我们选用1G规模的TPCH数据来实践DQL查询,TPCH生成如下8个表的数据文件(*.tbl): [图片] 文件内容是文本格式,第一行是字段名,之后是数据行,行内数据以|分隔, ..
-
SPL提供了两种方式连接数据库:JDBC/ODBC直连方式;JNDI连接池方式。 在Mysql中有一个MyCompany库,库里有employees表,下面尝试各种方式连接它。 [图片] 直连 ..
-
1、 测试任务 本任务原型为某大型电器企业ERP系统中的产品库龄统计。 原始数据是如下的一对主子表: 库存表(store): 字段名 数据类型 字段含义 store 字符串 仓库ID prod ..
-
Elasticsearch 是一个分布式搜索服务器,它提供了Restful API更新数据、搜索数据。提交的数据、搜索结果都是JSON格式,计算引擎语言SPL有json()函数解析JSON字符 ..
-
InfluxDB是时序数据库,数据存储在它的bucket中,多个bucket又组成一个organization。每条数据由measurement、多个维度、多个字段值、时间戳构成: airSe ..
-
Kafka是一种分布式的信息流平台,它的客户端分为生产者、消费者两种,生产者提交数据,消费者读取数据。Kafka中传递的事件消息没有固定格式,消费者、生产者自由约定一些个性化格式,比如是JSO ..
-
Cassandra是一种分布式的NoSQL数据库。JAVA中可以使用DataStax执行Cassandra的CQL,CQL语言能简单地维护、读写数据,但不支持关联、分组聚合等操作,计算能力比关 ..