计算&AI •
796 引用 •
800 回帖 •
419 关注
博客
关注
-
一、 查询要求 Q6语句查询得到某一年中通过变换折扣带来的增量收入。这是典型的'what-if'判断,用来寻找增加收入的途径。预测收入变化查询 ..
-
一、 查询要求 Q5 语句查询出在某一年某一地区各个国家的收入,这些收入是通过那些定购零件的顾客和供应零件的供应者都在那个国家的交易获得的。这 ..
-
一、 查询要求 Q4 语句查询计算给定的某一年的某一季度的按优先权分组的各组订单数量,在每个订单中至少有一行由顾客在它的提交日期之后收到。查询 ..
-
一、 查询要求 Q3语句查询得到收入在前10位的尚未运送的订单。在指定的日期之前还没有运送的订单中具有最大收入的订单的运送优先级(订单按照收入 ..
-
一、 查询要求 Q2 语句查询在给定的区域内,对于某一类型和大小的零件,哪个供应者能以最低的价格供应它。如果那一区域的供应者以同样最低的价格供 ..
-
一、 查询要求 Q1 语句提供了截止到给定运送日期前所有订单的价格摘要报告,查询列出了扩展价格、打折后的价格、打折且税后的价格、平均数量、平均 ..
-
新版本:[链接] 一、 目标 TPCH是由TPC(Transaction Processing Performance Council)事务处 ..
-
TopN是常见的运算,用SQL写出来是这样(以Oracle为例): select * from (select * f ..
-
我们知道,大数据运算性能的瓶颈常常是在外存(也就是硬盘)IO上,因为外存访问性能要比内存低一两个数量级。因此,做性能优化时,减少硬盘的访问量有时要比减少CPU计算量更为重要。同一个任务,如果能 ..
-
【摘要】 键值查询是很常见的查询场景,在数据表上建有索引后,即使表中数据记录数巨大(几亿甚至几十亿行),用键值查询出单条记录也会很快,因为建立索引后的复杂度只有 logN 次,10 亿行数据也 ..
-
【摘要】 通过 JDBC 从数据库取数往往性能较低,通过并行方式可以加快取数效率。但并行程序比较难写,要考虑的因素很多。这里我们介绍一种非常简单地并行取数方式,简单几行脚本即可实现并行取数,提 ..
-
【摘要】 石油化工行业,经常要构造特殊中间表,以物料、时间、指标名等为参数,查询出对应层级的指标值!由于前端报表模块已经定型,用户不希望再改变,所以只能按照数据库的思路造出这种中间数据集以适用 ..
-
集算器 SPL 语言支持处理多样性数据源,通过 SPL 对 MongoDB 集合与 MySql 表进行 join 关联 ..
-
**【摘要】** 集算器 SPL 语言支持多样性数据源,通过 SPL 对 MongoDB 多个集合进行 join 关联, ..
-
**【摘要】** 将 Mongodb 数据结构转换成结构化的数据需求,我们可利用集算器 SPL 语言来进行辅助实现。若 ..
-
**【摘要】** 编写数位比较这类集合式运算,用 Mongodb 脚本或 Java 等高级语言来实现都比较麻烦,但可以利 ..
-
**【摘要】** 交叉汇总作为数据统计的一种分类统计计算,用 MongoDB 实现比较困难,但可以利用集算器 SPL 语 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
【摘要】 随着某产权交易所的业务发展,内部产生了大量的交易数据(如:交易的标的、价格、目前交易的阶段等),这对于参与交易的相关单位非常具有参考价值!同样地,其它地区的交易所也含有很多类似的重要 ..
-
【摘要】 随着数据量增大,数据库性能明显降低,这时会考虑分库方案(把原来一个库中的数据按一定规则分摊到多个库中)。从而分摊单库压力,来缓解当下的性能问题。可谓分库一时爽,一直分库一直爽。 但是 ..
-
1 概要 数据整理是为业务人员进一步分析数据或进入 BI 系统前最重要的环节。随着数据时代的到来,数据来源越来越多样 (文件、大数据平台、数据库…),为数据整理带来了很多挑战。在企业里数据通常 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
【摘要】 集算器作为敏捷数据计算引擎,可以在报表数据源、JAVA 计算层、离线自由计算 3 个方面提供高效的计算输出,帮助用户解决由于开发效率低,描述业务难等这些问题: 1、为报表准备数据的 ..
-
【摘要】 业务发展过程中,新报表不断、老报表要改,报表开发没完没了;为报表准备数据的 SQL 长达数 K,写起来难,维护更难;数据量大,报表呈现太慢,搞不好还溢出,用户抱怨;应用与报表高耦合, ..
-
【摘要】 总是有大批 TXT/CSV/XLS 要处理,而现有的一些技术又存在很多不足:JAVA 代码繁琐对人员要求高;SQL 计算封闭,无法计算库外数据;Python 外围开源包安装配置麻烦, ..