计算&AI •
994 引用 •
1074 回帖 •
474 关注
博客
关注
-
问题描述 发电设备中会放置传感器(DCS)来采集数据以监控设备运转的状况,某集团设计的电力监控统计系统,需要按固定频率实时采集多个传感器(以下称为测点)上测量的数据后保存,然后提供按任意时间区 ..
-
组表是SPL重要的文件存储格式。组表文件不支持在读取时同时写入,为保证高性能,组表还常常要求数据有序存储。数据不是一成不变的,还需要持续追加或更新,新产生数据的次序通常和组表要求的次序也不同。 ..
-
多年前开发了一套报表,当时的多数据集(涉及一报表从多库关联取数) 在报表内计算是通过 select 函数加条件的方式实现 关联取数。 如 [图片]多数据集(两个数据源) 报表内关联取数 [图片 ..
-
一、 问题描述 键值查询是很常见的查询场景,在数据表上建有索引后,即使表中数据记录数巨大(几亿甚至几十亿行),用键值查询出单条记录也会很快,因为建立索引后的复杂度只有 ..
-
【摘要】全国产数据库面临软硬件强依赖国外技术的尴尬,硬件缺芯(90% 以上的高端芯片依赖进口),软件缺新(依赖国外的理论、模型,甚至代码)。如何让基于国产硬件运行的国产数据库性能达到甚至超越国 ..
-
一、 测试任务 多维分析中常见的事实表和多个及多层维表的关联后按维度的汇总统计,以及宽表按维度的统计。 基于TPCH 100G数据集,设计大事实表和多个维表关联的运算: 1. 一个事实表和一个 ..
-
【摘要】 对于有序集合来说,有时候数据集的次序在分组时是有意义的。我们有时需要把具有相同字段值或者同时满足某些条件的相邻记录分到同一组。比如 2 ..
-
XML 的多层结构计算起来难度较大,XPath 的计算能力严重不足,只能在计算需求较弱的互联网应用早期发挥作用,如今的计算需求日益复杂多变,需要 SPL 这种能力更强的 XML 计算语言。点击 ..
-
算法背景 很多仪表设备都能定时产生一些数据,称之为时间序列。 下图是一张时间序列的走势图,横轴是时间(dd hh:mm),纵轴是数值。 [图片] 数据的波动很大,看局部会有点杂乱无章的感觉,但 ..
-
1 应用场景 和【实时追加例程】的应用场景类似,所不同的是需要对数据进行更新。本例程适用于具有如下特征的数据表的更新: 对数据更新的实时性要求很高、数据更新周期很短、任意时刻均有可能更新;单次 ..
-
集合运算是指集合间的和、交、并、差、异或、包含等基本运算。结构化数据经常是以集合形式出现的,为了方便地计算这类数据,SPL 提供了丰富的集合运算方法和函数。 ..
-
一、 查询要求 Q10语句是查询每个国家在某时刻起的三个月内货运存在问题的客户和造成的损失。 Q10语句的特点是:带有分组、排序、聚集操作并存 ..
-
我们知道一个完整的数据挖掘项目通常包含以下流程(1)业务理解、(2)数据理解、(3)数据准备、(4)数据预处理和建模、(5)模型评估、(6)模型部署应用。而要完成一个数据挖掘任务,必须要具备两 ..
-
MongoDB 内置的查询表达式有时不够方便,这种情况下就要用到第三方函数库完成计算,本文深度比较四类 MongoDB 上的计算库,包括 MongoDB Connectioin\Calcite ..
-
1. 采样( 随机的将数据分成30% 和70%) esProc A 1 =now() 2 =file('C:\\Users\\Sean\\Desktop\\esProc_vs_p ..
-
一、 查询要求 Q19语句查询得到对一些空运或人工运输零件三个不同种类的所有订单的总折扣收入。零件的选择考虑特定品牌、包装和尺寸范围。 Q19 ..
-
部分预汇总 多维分析后台的运算本质是分组汇总,可以直接对数据执行这个计算。但是,当数据量非常大的时候,很难做到即时响应。 预汇总是个容易想到的办法,即事先把各种汇总结果计算好,保存为中间结果( ..
-
文字处理在任何一门程序语言中都是必不可少的,SPL提供了十分丰富的文字处理函数,分为字符处理、简单串处理、与序列相关、复杂分析等几大类,囊括字符串子串、判断、转换、字符编码、数据类型解析、查找 ..
-
WebService/Restful 的数据格式采用了 JSON 或 XML 这类通用、多层的结构化文本,但多层格式要比传统的二维格式复杂,取数后再处理的难度也大,本文比较五类 WebServ ..
-
在大数据表关联场景中,如果各个表按照主键或部分主键关联,我们可以采用 SPL 附表机制来做性能优化。 附表机制是将上述要关联的表绑在一起存储。以客户表 customer 和联系方式表 cont ..
-
Elasticsearch 是一个分布式搜索服务器,它提供了Restful API更新数据、搜索数据。提交的数据、搜索结果都是JSON格式,计算引擎语言SPL有json()函数解析JSON字符 ..
-
SPL 提供了丰富的针对文件系统的函数,能方便地处理目录以及文件。 1 目录 SPL 用 directory 函数列出文件目录或者文件,并以序列形式返回。 ..
-
内存列式计算 什么是列式存储 内存中的序表,一般是采用行式存储。例如员工表包含字段 id、name、birthday,在内存中大致是这样存储的: [图片] 每行(也就是每条记录)存成一个 Ob ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 主键连接是非常常见的情况,如订单和订单明细。但数据库并不区分关联的字段是什么,一 ..
-
遍历复用的原理 对外存数据表做遍历计算时,大部分时间都用来从硬盘上读取数据了。所以我们会希望一次读取能做尽量多的事情,也就是尽量做到能复用遍历过程中读出来的数据。 比如我们对订单 ..