计算&AI •
991 引用 •
1070 回帖 •
471 关注
博客
关注
-
【摘要】 从数据表中选出数据时,有时候需要判断成员在某些条件下是否存在,这些条件可能是从其他的数据表中查询的。例如分数是成绩表的字段,怎样从学生 ..
-
一、 查询要求 Q9语句是查询每个国家每一年所有被定购的零件在一年中的总利润。 Q9语句的特点是:带有分组、排序、聚集、子查询操作并存的查询操 ..
-
报表的数据来源非常丰富,理论上任何数据源都可能同时作为报表的数据源来源,RDB、NoSQL、CSV、Excel、Json、Hadoop 不一而足,这就产生了报表开发中的多源问题。如何解决多源带 ..
-
一、 查询要求 Q14语句查询获得某一个月的收入中有多大的百分比是来自促销零件。用以监视促销带来的市场反应。 Q14语句的特点是:带有聚集、连 ..
-
我们来看一个例子,下图是一组球员的年收入数据,单位万美元,他们的平均收入是多少? [图片] 很容易,我们能够计算出他们的平均年收入是 597 万美元,这么看球员似乎是一个非常高薪的职业,但是仔 ..
-
日常工作中,经常需要把多个 Excel 文件的数据合并到一起,便于做各种统计分析。 1 纵向合并 - 列名列数相同 最简单常见的 ..
-
在SPL中,从数据源将数据读成序表以后,就可以进行所有SQL式的运算,如过滤、汇总、跨列计算、排序、分组汇总、分组过滤、Top-N、分组Top-N、去重、分组去重、关联查询等。本文以文件数据源 ..
-
上一篇《[链接]》(简称“内存篇”)介绍了 SPL 对关联计算的分类,以及内存关联计算的编程方法。 当一个或者多个关联表数据量很大需要外存时,就不能使用内存连接算法了,SPL 专门提供了外存连 ..
-
有些报表的运算比较复杂,从原始数据到呈现需要经过多步加工,如何更简单高效地实现复杂多步骤的运算直接影响到报表开发效率和性能。本文将比较几种常见的报表多步骤数据准备的方法。 复杂 SQL/ 存储 ..
-
【摘要】 用实例、分步骤,详细讲解多维分析(OLAP)的实现。点击了解 ${article} 实践目标 本期目标是在上期基础上,将客户宽表全部数据与分支机构等多个维表关联,并通过维表字段进行切 ..
-
一、 查询要求 Q12 语句查询某一年在指定的两种货运模式下,早于交货日期发货而消费者迟于交货日期收到货物的订单中,按货运模式分组统计订单优先 ..
-
报表业务的稳定性差,报表数据来源(数据准备)经常需要修改,修改后的报表能否做到不停机热切换(HotSwap)对报表应用来说十分重要。本文将探讨几种报表数据源的热切换技术并加以对比。 SQL 基 ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 数据表 T 的字段 x 按照集合 X={X1=Xn。分段之后,按照段号分组汇总。 ..
-
一、 查询要求 Q5 语句查询出在某一年某一地区各个国家的收入,这些收入是通过那些定购零件的顾客和供应零件的供应者都在那个国家的交易获得的。这 ..
-
Java虚拟机参数的配置有时候会对SPL的性能产生很大影响,本文从排序函数sortx的使用出发,探索如何通过优化JVM参数配置来提升性能。对分析过程不感兴趣的同学可以直接阅读结论章节。 1 内 ..
-
一、 测试任务 TPCH 100G。 TPCH是国际标准,具体内容不再过多解释。 需要说明的是,TPCH 虽然有 22 个题,但仍然不能全面反映出被测系统对实际业务的响应性能。主要原因如下两点 ..
-
大数据表关联时,有时会先对关联表做条件过滤。对于关联字段是主键或者部分主键的情况,SPL 在有序归并关联算法(参考这里)的基础上提供关联定位算法,来提升过滤后关联的计算性能。 先来看关联表按照 ..
-
一、 查询要求 Q11 语句通过扫描某给定国供应商的库存,找到在所有零件总价值中占重要百分比的各个零件,查询结果显示零件编号和价值,并按价值降 ..
-
SPL 中的关联计算和 SQL 有很大不同,SQL 把连接定义为笛卡尔积后再过滤。SPL 也提供了这种运算,但在绝大多数场景下都有更好的替代方法,因而并不推荐使用。 应用 SPL 编程实现关联 ..
-
一、 测试任务 基于位置计算两个实体之间的距离,进而决定是否建立关联关系。这是典型的非等值关联运算,此时不能再使用 HASH 方法来优化。 任务原型来自国家天文台的星体聚类运算,经过简化后描述 ..
-
简介: SPL 作为一门语言,循环、动态、子程序、并行这些都是完备的,允许程序简单快速的实现算法。 [图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图 ..
-
MongoDB是非关系数据库,以类似JSON的BSON格式存储数据,它提供了一整套命令操作数据,轻量计算引擎语言SPL支持嵌套的数据结构,很容易加载JSON数据,可以用SPL扩展MongoDB ..
-
有些 JAVA 项目不方便用数据库完成计算任务,需要交由 JAVA 计算层完成,本文深度对比了四类 JAVA 计算层工具(类库),包括 scala\ 集算器 SPL\ SQLite\ CSVJ ..
-
异构库的数据比对是指分别在不同类型数据库中的两张逻辑结构相同的数据表,进行数据比较,找出差异。 问题描述 数据对比的难点在于异构数据库间的数据类型和数据库本身在处理数据上存在的差异,这会导致同 ..
-
海龟策略:在股价超过过去N个交易日的股价最高点时买入,在股价低于过去N个交易日的股价最低点时卖出(N通常设为20)。上述的若干个最高点和最低点会组成一个通道,称为“唐奇安通道(Donchian ..