图书 •
860 引用 •
253 回帖 •
4 关注
博客
关注
-
1.4.1 T 函数和 E 函数 使用 import()/xlsimport 函数需要先定义文件对象,而读写结构化文件的操作很常见,SPL 提供了更简单的 T() 函数,可以自动根据文件扩展名 ..
-
[链接] [链接]9.6 备胎式容错 事先把数据加载进内存,能够获得比外存好得多的性能。数据量太大超出单机内存时,也可以利用集群的分机分段加载,同时分担计算量。我们前述的多机并行框架以及集群表 ..
-
CDP 指标又称逆市操作指标,是反映短线进出的作法,是在一天内同时买进卖出或卖出买进。 计算方法: (1)先计算 CDP 值(需求值) CDP=(H+L+C*2)÷4 H:当日最高价,L:当日 ..
-
[链接] [链接]5.1 有序分组汇总 如果数据表对分组键有序,可以实施有序分组算法。 有序分组的过程很简单,遍历时只要将当前记录和最后一个分组子集对比键值,如果相同,则将这条记录继续分到这个 ..
-
动力指数表示的是股票价格的涨跌速度,如果股票价格能始终不渝地上升则动力指数继续向上发展,就说明股票几个上升的速度在加快。反之,如果股票价格始终在下降, 则动力指数始终保持在 0 线的下方。如果 ..
-
计算向量的最大最小值、平均值、中位数、众数、四分位数、极差、方差、标准差、偏度、标准误 A 1 [7,9,6,23,56,1,6] 2 =A1.max() 3 =A1.min() 4 =A1. ..
-
[链接] [链接]3.2 哈希索引 使用二分法去查找时,还是需要多次读取原文件才能定位到目标值,而且过程中还有不少读取是多余的。如果我们有办法高效地获得目标值的物理位置,那就可以直接读出目标值 ..
-
[链接] [链接]9.7 多作业负载均衡 和单机上的多线程并行类似,第一节中讲述的多机并行框架也会等待最慢的分机返回结果后才会继续。我们可以尽量使分机计算的数据量更均衡,但并不能保证各分机执行 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1。 转化函数为: Z=(x−[图片 ..
-
[链接] [链接]3.4 行存和带值索引 上一章讲过,列式存储是提高性能的常用手段。然而,对于大多数查找任务来讲,列存却会导致更差的性能。 即使已经有序存储了,通常的列存也可以认为就无法执行不 ..
-
[链接] [链接]9.3 复写维表 我们来讨论外键关联,先看小维表的情况,也就是可以把维表装入分机内存的情况。 那么,把维表装入哪个分机的内存呢? 在所有分机都装入一份。 集群下的事实表很大, ..
-
[链接] [链接]8.1 部分预汇总 多维分析后台的运算本质上就是个分组汇总,前面讲过的分组方法都可以利用。但当数据量非常大的时候,想做到即时响应也不是很容易的事。 预汇总是个容易想到的方法, ..
-
三角衰减函数是指权重随时间呈三角函数衰减,衰减后的权重序列记为Wci。 wcj=[-cos((j-1)*π/k’)/2+0.5]/s s=sum(-cos((j-1)*π/k’)/2+0.5) ..
-
[链接] [链接]9.1 计算与数据分布 数据量很大时,可以采用多台机器来分担计算任务,也就是集群。参与计算的机器称为分机,通常还会有个控制程序,负责管理分配各分机的计算任务并汇总计算结果,称 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片]
-
VRSI 指标又名量相对强弱指标,是通过反映股价变动的四个元素:上涨的天数、下跌的天数、成交量增加幅度、成交量减少幅度来研判量能的趋势,预测市场供求关系和买卖力道,是属于量能反趋向指标之一。计 ..
-
问题 下面是某企业的历史销售合同记录: [图片] 去年有销售额而今年没有的客户称为今年的“流失客户”,“流失客户”的数量除以去年的总客户数量为今年“客户流失率”,请找出 1998 年的“流失客 ..
-
纵向合并多个 Excel 文件时,可能只以行头或者其中某一 / 几个关键列作为判断数据是否重复的标准,如下例所示,仅用 Name 作为判断是否重复的标准: 合并前 [图片] 和 [图片] 从上 ..
-
[链接] [链接]5.4 程序游标 继续帐户交易表,现在我们希望找出每月内连续 n 天都有交易的那些交易记录,然后按发生日期的星期几统计交易额度。 后半任务很简单,就是个普通的分组汇总。但找出 ..
-
9.1 分组与汇总 1. 请统计字符串”esProc SPL is a smart desktop data analysis tool”中每个字母出现的次数(忽略大小写,a与A是同一个字母) ..
-
有多卡片式表格 Cards.xlsx 如下: [图片] 现需要把它拆成一张卡片一个文件,并以姓名作为文件名,如: Andrew.Fuller.xlsx: [图片] Janet.Leverlin ..
-
合并前: CustomerFruits.xlsx [图片] 和 CustomerMeats.xlsx [图片] 可以发现,Bread 重复了,合并后希望保留第二个文件中的 Bread 列,去掉 ..
-
mmean(A, n) 对矩阵 A 在 n 层维度求均值 A 1 [[1,0,2,3],[0,71,5,6],[0,0,6,5],[35,53,2,3],[35,8,4,2]] 2 =mmea ..
-
有如下数据: [图片] 选出整行不重复的数据,重复出现的数据选出第一条: =spl('=E(?1).group(ID,Name,Gender,Birthday).(~(1))',A1:D7) ..