计算&AI •
1002 引用 •
1079 回帖 •
472 关注
博客
关注
-
在SPL中,从数据源将数据读成游标以后,就可以进行所有SQL式的运算,如过滤、汇总、跨列计算、排序、分组汇总、Top-N、分组Top-N、去重、分组去重、关联查询等。游标上的运算分为延迟计算和 ..
-
算法背景 很多仪表设备都能定时产生一些数据,称之为时间序列。 下图是一张时间序列的走势图,横轴是时间(dd hh:mm),纵轴是数值。 [图片] 数据的波动很大,看局部会有点杂乱无章的感觉,但 ..
-
组表是SPL重要的文件存储格式。组表文件不支持在读取时同时写入,为保证高性能,组表还常常要求数据有序存储。数据不是一成不变的,还需要持续追加或更新,新产生数据的次序通常和组表要求的次序也不同。 ..
-
一、 测试任务 多维分析中常见的事实表和多个及多层维表的关联后按维度的汇总统计,以及宽表按维度的统计。 基于TPCH 100G数据集,设计大事实表和多个维表关联的运算: 1. 一个事实表和一个 ..
-
【摘要】 集算器 ETL 工具可以从多种数据源中抽取数据,进行过滤计算排序及关联运算等,再将结果 ..
-
一、 查询要求 Q18语句查询找到曾下过大数量订单的前 100 位顾客,大数量订单定义为总数量超过某一特定数量的订单。查询结果列出顾客的姓名、 ..
-
1 应用场景 和【实时追加例程】的应用场景类似,所不同的是需要对数据进行更新。本例程适用于具有如下特征的数据表的更新: 对数据更新的实时性要求很高、数据更新周期很短、任意时刻均有可能更新;单次 ..
-
[图片] [图片] [图片] [图片] 报表与计算层 [图片] 报表 [图片] 传统与创新 [图片] [图片] 困难计算 [图片] 特殊格式 [图片] 多样性数据源 [图片] 非数据库上的SQ ..
-
1. 计算每年同月份增长比 esproc A 1 =now() 2 =file('C:\\Users\\Sean\\Desktop\\kaggle_data\\music_pro ..
-
DCM 是什么 现代应用无时无刻不在与数据打交道,数据计算无处不在,报表统计、数据分析、业务处理不一而足。当前数据处理的主要手段仍然是以关系数据库为代表的相关技术,虽然使用高级语言(如 Jav ..
-
一、 问题描述 键值查询是很常见的查询场景,在数据表上建有索引后,即使表中数据记录数巨大(几亿甚至几十亿行),用键值查询出单条记录也会很快,因为建立索引后的复杂度只有 ..
-
XML 的多层结构计算起来难度较大,XPath 的计算能力严重不足,只能在计算需求较弱的互联网应用早期发挥作用,如今的计算需求日益复杂多变,需要 SPL 这种能力更强的 XML 计算语言。点击 ..
-
一、 SQL 及分析 查询SQL语句如下: select * from ( select c_name, c_custkey, o_orderkey, o_orderdate, o_total ..
-
【摘要】 集算器作为敏捷数据计算引擎,可以在报表数据源、JAVA 计算层、离线自由计算 3 个方面提供高效的计算输出,帮助用户解决由于开发效率低,描述业务难等这些问题: 1、为报表准备数据的 ..
-
在大数据表关联场景中,如果各个表按照主键或部分主键关联,我们可以采用 SPL 附表机制来做性能优化。 附表机制是将上述要关联的表绑在一起存储。以客户表 customer 和联系方式表 cont ..
-
头肩顶 1. 形态整体上有 3 次撞顶的过程,出现 3 座顶峰,其中第一座和第三座的顶部位置较为接近,第二座顶峰的高点比其他两座更高。 2. 形态包括第一次撞顶的“左肩”、第二次撞顶的“头部” ..
-
一、 查询要求 Q10语句是查询每个国家在某时刻起的三个月内货运存在问题的客户和造成的损失。 Q10语句的特点是:带有分组、排序、聚集操作并存 ..
-
文字处理在任何一门程序语言中都是必不可少的,SPL提供了十分丰富的文字处理函数,分为字符处理、简单串处理、与序列相关、复杂分析等几大类,囊括字符串子串、判断、转换、字符编码、数据类型解析、查找 ..
-
【摘要】全国产数据库面临软硬件强依赖国外技术的尴尬,硬件缺芯(90% 以上的高端芯片依赖进口),软件缺新(依赖国外的理论、模型,甚至代码)。如何让基于国产硬件运行的国产数据库性能达到甚至超越国 ..
-
WebService/Restful 的数据格式采用了 JSON 或 XML 这类通用、多层的结构化文本,但多层格式要比传统的二维格式复杂,取数后再处理的难度也大,本文比较五类 WebServ ..
-
多年前开发了一套报表,当时的多数据集(涉及一报表从多库关联取数) 在报表内计算是通过 select 函数加条件的方式实现 关联取数。 如 [图片]多数据集(两个数据源) 报表内关联取数 [图片 ..
-
MongoDB 内置的查询表达式有时不够方便,这种情况下就要用到第三方函数库完成计算,本文深度比较四类 MongoDB 上的计算库,包括 MongoDB Connectioin\Calcite ..
-
SPL 提供了丰富的针对文件系统的函数,能方便地处理目录以及文件。 1 目录 SPL 用 directory 函数列出文件目录或者文件,并以序列形式返回。 ..
-
1. 采样( 随机的将数据分成30% 和70%) esProc A 1 =now() 2 =file('C:\\Users\\Sean\\Desktop\\esProc_vs_p ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 主键连接是非常常见的情况,如订单和订单明细。但数据库并不区分关联的字段是什么,一 ..