计算&AI •
796 引用 •
800 回帖 •
419 关注
博客
关注
-
我们来看一个例子,下图是一组球员的年收入数据,单位万美元,他们的平均收入是多少? [图片] 很容易,我们能够计算出他们的平均年收入是 597 万美元,这么看球员似乎是一个非常高薪的职业,但是仔 ..
-
【摘要】 多维分析(OLAP)中常见的枚举维度切片(过滤条件 in)和二值维度(是否型过滤条件)如何优化?点击了解 ${article} 问题描述 多维分析(OLAP)系统的汇总和切片,实际上 ..
-
一、 查询要求 Q9语句是查询每个国家每一年所有被定购的零件在一年中的总利润。 Q9语句的特点是:带有分组、排序、聚集、子查询操作并存的查询操 ..
-
一、 查询要求 Q5 语句查询出在某一年某一地区各个国家的收入,这些收入是通过那些定购零件的顾客和供应零件的供应者都在那个国家的交易获得的。这 ..
-
完整数据有时会存储在多个数据库中,这种情况就要进行跨库的混合运算,本文深度对比了四类跨库手段,包括 DBLink\ 集算器 SPL\ Scala\Calcite,重点考察这些工具的跨库代码写法 ..
-
全文下载 [图片] [图片] [图片] [图片] http://c.raqsoft.com.cn/article/1586000621526 http://c.raqsoft.com.cn/a ..
-
SPL 不仅可以做数据准备和计算,还可以调用润乾报表的外部库来生成有格式要求的报表,比如导出 Excel、pdf、Word、Html 等格式,并且 SPL 脚本可以集成到 JAVA 程序中调用 ..
-
一、 查询要求 Q12 语句查询某一年在指定的两种货运模式下,早于交货日期发货而消费者迟于交货日期收到货物的订单中,按货运模式分组统计订单优先 ..
-
一、 查询要求 Q20 语句查询确定在某一年内,能对某给定国某一零件商品提供更有竞争力价格的供货商。所谓更有竞争力的供货商,是指那些零件有过剩 ..
-
一、 查询要求 Q8语句是查询在过去的两年中一个给定零件类型在某国某地区市场份额的变化情况。 Q8语句的特点是:带有分组、排序、聚集、子查询操 ..
-
伴随信息时代的发展,新技术、新框架、新语言层出不穷,解决问题的技术视角其实从来没有改变。所有应用都需要和存储系统相关联,无论存储是 SQL 还是 NOSQL 的。业务系统和数据库遵循不同的开发 ..
-
本次实践的目标是从大量的高维(比如 512 维)二值向量中找到与目标向量最相似的成员。二值向量即各维度取值均为 0 或 1 的向量,“相似”指在高维空间中距离近,而距离有很多种,如欧式距离,马 ..
-
1. 应用场景 本例程适用于具有如下特征的数据表的追加: 对数据追加的实时性要求很高、数据追加周期很短、任意时刻均有可能追加;数据只有追加无删除修改的需求;单次追加的数据量比较小,可以全内存存 ..
-
1. 采样( 随机的将数据分成30% 和70%) esproc A 1 =now() 2 =file('C:\\Users\\Sean\\Desktop\\esproc_vs_p ..
-
目标 集算器能直接针对数据文件写SQL查询,也能写SPL脚本支持复杂计算,为了容易给外部程序提供计算结果,提供了嵌入式JDBC驱动。本篇介绍Kettle中通用JDBC集成SPL的方法,及不同的 ..
-
数据挖掘模型建好后,我们通常会关注建模时的准确率查全率等指标,但是常常会忽略模型另一个重要指标:模型的衰减程度,也就是模型在实际应用中预测能力的变化(一般都会越用越差)。 为什么会发生模型衰减 ..
-
T+0 查询是指实时数据查询,数据统计时可以查询到最新产生的数据。对应的还有 T+1、T+7 等,对应表示只能查询 1 天或 7 天以前的数据,显然这种 T+N 查询的数据是非实时的。本文将要 ..
-
1. 过滤 从数据表中筛选出满足条件的记录。 示例:从学生成绩表Students_scores.txt中筛选出10班的学生成绩,文件中第一行是列名,第二 ..
-
1 概要 数据整理是为业务人员进一步分析数据或进入 BI 系统前最重要的环节。随着数据时代的到来,数据来源越来越多样 (文件、大数据平台、数据库…),为数据整理带来了很多挑战。在企业里数据通常 ..
-
【摘要】 总是有大批 TXT/CSV/XLS 要处理,而现有的一些技术又存在很多不足:JAVA 代码繁琐对人员要求高;SQL 计算封闭,无法计算库外数据;Python 外围开源包安装配置麻烦, ..
-
全文下载javapdf [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] 资源 •常用计算的 SPL 代码 http:// ..
-
Java虚拟机参数的配置有时候会对SPL的性能产生很大影响,本文从排序函数sortx的使用出发,探索如何通过优化JVM参数配置来提升性能。对分析过程不感兴趣的同学可以直接阅读结论章节。 1 内 ..
-
【摘要】 集算器作为敏捷数据计算引擎,可以在报表数据源、JAVA 计算层、离线自由计算 3 个方面提供高效的计算输出,帮助用户解决由于开发效率低,描述业务难等这些问题: 1、为报表准备数据的 ..
-
全文下载 [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] 资源 常用计算的 SPL 代码http:/ ..
-
一、 查询要求 Q18语句查询找到曾下过大数量订单的前 100 位顾客,大数量订单定义为总数量超过某一特定数量的订单。查询结果列出顾客的姓名、 ..