计算&AI •
991 引用 •
1070 回帖 •
471 关注
博客
关注
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
【摘要】 很多算法都会产生落地的中间结果,从而影响性能,尤其是数据量较大的时候。这种情况下通常可用程序游标来避免数据落地,下面举例说明。 计算目标:订单表原来已按时间排序,需要将数据按日期、产 ..
-
一、 查询要求 Q17 语句对于指定品牌和指定包装类型的零件,查询出订购量少于此类零件平均订购量 20%的订单平均每年的订购额。所以此查询可用 ..
-
JAVA 应用必须通过 JDBC 从数据库中取数,有时候我们会发现,数据库的负担并不重而且 SQL 很简单,但当数据量大到一定程度时取数的速度 ..
-
我们知道,数据挖掘的基本流程包括:(1)业务理解、(2)数据理解、(3)数据准备、(4)数据预处理和建模、(5)模型评估、(6)模型部署应用。其中第 4 步,数据预处理和建模是整个流程的核心部 ..
-
【摘要】 在数据计算时,除了每条记录本身,经常也会关心有序集合中与位置相关的计算。例如:编号为 752084 的订单在销售表中的第几行?2019 ..
-
在使用 Jasper 报表工具制作报表时,常常会遇到数据来自多个数据源的情况,通常的做法是使用主子报表或者使用javabean作为数据源。使用主子报表通常会增加报表设计的复杂度,而使用java ..
-
很多数据仓库产品都采用了列式存储。如果数据表的总列数很多而计算涉及的列很少,采用列存就只读取需要的列即可,能够减少硬盘访问量,提高性能。特别是数据量非常大时,硬盘扫描和读取的时间占比很大,这时 ..
-
SPL提供了丰富的日期时间操作函数,分为基本处理、运算两大类,包括当前时刻、日期时间分量的拆分、分量组合成日期时间、格式转换、精度调整、相关日期、时间间隔、相对时间、相同判断、工作日计算、时间 ..
-
概要 通过调用java.sql.DatabaseMetaData 类中的各种方法,程序可以动态了解数据库,获取数据源连接到的数据库表结构等信息。 本文主要介绍如何在 JAVA 中使用 Data ..
-
用户画像分析需要使用众多标签来描述用户属性,通常有两类标签。一类用户标签的值可能有多个,比如用户学历是中学、大学、研究生、博士等,年龄段是 children、juvenile、youth、mi ..
-
[链接]文本为什么更慢? 文本文件慢的原因,主要在于会多出很多数据类型解析的动作。 举个例子,设想一下把文本“12345' 转成内存二进制整数 12345 的过程: 1. 先设结果的初始值为 ..
-
大数据通常是需要外存的,要实现外存并行计算必须有较好的数据分段技术。也就是能方便的把数据拆分成若干部分,让每个线程或进程分别处理。 SPL 采用倍增分段技术,实现了单文件可追加分 ..
-
Spark 是最流行的分布式数据计算工具,在当前大数据分析领域占据主导地位。在这一领域发挥的作用,集算器与 Spark 有不少交集,和 Spark 对比有哪些不同? 对于底层使用了不同技术、设 ..
-
【摘要】 随着某产权交易所的业务发展,内部产生了大量的交易数据(如:交易的标的、价格、目前交易的阶段等),这对于参与交易的相关单位非常具有参考价值!同样地,其它地区的交易所也含有很多类似的重要 ..
-
依据用户、帐户明细数据做统计分析的场景比较常见。比如:用户行为分析、银行帐户统计、漏斗转化率、保险单分析等等,我们统称为帐户分析。这类场景的特征是:总数据量巨大但单个帐户数据量相对很小;数据涉 ..
-
【摘要】 全量预汇总真的是提高 OLAP 性能的可行方案吗?点击了解 ${article} 多 ..
-
筛选指定特征的曲线段一——计算曲线特征 算法背景 很多仪表设备都能定时产生一些数据,称之为时间序列。将时间序列画在图上就是一条曲线,如下图: [图片] 图中横轴是时间(dd hh:mm),纵轴 ..
-
【摘要】 多维分析(OLAP)中常见的枚举维度切片(过滤条件 in)和二值维度(是否型过滤条件)如何优化?点击了解 ${article} 问题描述 多维分析(OLAP)系统的汇总和切片,实际上 ..
-
随着人工智能技术的火热,各种 AI 培训也应运而生,翻阅各种社交网站和 APP,几乎每天都能刷到 Python、人工智能相关的文章,点进去很大一部分都是培训机构给自家 AI 课程打的广告。那么 ..
-
来源: https://forums.opentext.com/forums/discussion/173783/dynamic-grouping-of-crosstab-in-bir ..
-
相关性分析是数据分析和挖掘中经常用的方法,通过对特征和目标之间的关系分析可以发现业务运营中的影响因素,并对业务的发展进行预测。 两个变量之间的关系有以下几种: (1) 完全正线性相关:一个值随 ..
-
概述 集算器云服务是一款既可部署在云平台虚拟机,也可部署在本地的提供 SPL 计算的应用。管理多个 SPL 服务器,执行远程存储脚本文件时,会自动为 SPL 服务器分配任务实现云计算。 云服务 ..
-
【摘要】 连接(JOIN)用于把来自两个或多个表的记录结合起来。SQL 和 SPL 是大家比较熟悉的程序语言,本文将探讨对于连接问题,这两种语言 ..
-
用户分析(或帐户分析),是指对用户、帐户明细数据进行统计分析计算。常见的有:用户行为分析、银行帐户统计、漏斗转化率、保险单分析等等。 这类场景涉及众多用户的历史数据,总数据量巨大(几千万甚至上 ..