图书 •
828 引用 •
203 回帖 •
3 关注
博客
关注
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[链接] [链接]7.3 关联定位 前两节讨论的都是全表遍历。现实的任务中常常会还会关联表做条件过滤,当然我们可以在关联之后再做过滤,但这样会将所有关联表都遍历一次,表很大时就会耗时很多。有时 ..
-
[链接] [链接]9.2 集群复组表 对于数据表上的常规运算,使用 fork 写起来有些麻烦,SPL 也提供了集群表和集群游标来简化代码,但情况要比单机复杂一些。 回顾第二章出现的复组表概念。 ..
-
[链接] [链接]5.6 后半序分组 我们处理了“前半有序”的情况,那么“后半有序”是不是也会可利用的地方? 还是这个帐户交易表,在每个帐户下的数据是按日期排序的,现在我们想统计所有日期下的交 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
mstd(A, n) 对矩阵 A 在 n 层维度方向上求标准差 A 1 [[1,0,2,3],[0,71,5,6],[0,0,6,5],[35,53,2,3],[35,8,4,2]] 2 =m ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
1.3.1 解析文件名 函数 filename 可解析出文件名的不同部分: A 1 =filename(“ D://file/test.splx”) 2 =filename@e(“ D://f ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[链接] [链接]1.3 位置索引 有时候我们希望查找出目标值在序表中的位置,而不是目标值本身。如果序表对被查找键无序时,就无法使用二分法来提高性能了。事先把数据按被查找键排序后可以使用二分法 ..
-
[链接] [链接]8.4 布尔维序列 我们在前面使用对位序列提高维表过滤后的关联,这种技术还可以用于提高枚举型维度的切片性能。 所谓枚举型维度,是指维度的取值是事先已经确定的有限的几种值,如性 ..
-
[链接] [链接]5.3 有序分组子集 数据表对分组键有序时,可以依次将分组子集用游标方式读出,利用这一点,我们可以做一些复杂的运算。 比如一年的帐户交易表,我们想统计有多少帐户在连续 n 天 ..
-
平均真实波动范围 (Average True Range) 也称均幅指标,表示一定时间周期内的股价真实波动幅度的移动平均值 计算方法: 真实波幅等于当日股价振幅、最高与昨收差价、最低与昨收差价 ..
-
指数衰减函数是指权重随时间呈指数衰减,衰减后的权重序列记为Wei。 wej=bj-1-k’/s s=sum(bj-1-k’) 其中Wei是Rg[-(k’+1)]i+1的权重序列,b是底数,we ..
-
[链接] [链接]3.5 索引预加载 我们知道,大数据的索引经常也很大,需要建立多级索引,每次查找时都要一级一级地读入,才能最终定位到目标值。因为外存访问的复杂度很高,即使有操作系统的缓存能避 ..
-
成交量标准差(VSTD)就是求 N 周期成交量的估算标准差,该指标可很好追踪成交量放大和缩小的趋势。标准差是一种表示数据分散程度的统计学概念,主要是根据数据在一段时间内的波动情况计算而来的,用 ..
-
[链接] [链接]6.9 单边分堆 我们最后来处理维表和事实表都很大的情况,通常事实表会更大。这种情况无论如何都很难高速计算出来,但仍然要想办法尽量做得快。 是否可以把事实表用游标读出来,分批 ..
-
[链接] [链接]1.4 哈希索引 哈希索引可以理解为序号定位的延伸。 使用某个函数将被查找键值计算成一个 1…M 之间的自然数,称为该记录的哈希值,此函数称为哈希函数。将序表 T 的记录按哈 ..
-
2.7.1 TRIX 概念 TRIX(Triple Exponentially Smoothed Average)是根据移动平均线理论,对一条平均线进行三次平滑处理,再根据这条移动平均线的变动 ..
-
2.4.1 EMA 概念 EMA(Exponential Moving Average) 指数移动平均值是以指数式递减加权的移动平均,是一种趋势指标,要了均价趋势快慢的时候,用 EMA 更稳定 ..
-
[链接] [链接]6.2 临时地址化 地址是个内存概念,外键地址化只能在全内存时实施,但大数据常常需要外存计算。 我们先来考虑事实表大而维表仍然较小的情况,这也是现实中比较常见的情况。事实表用 ..