图书 •
828 引用 •
203 回帖 •
3 关注
博客
关注
-
8.5 字段上的计算 我们前面说过,结构化数据在行和列方向的能力是不对称的,方便的批量运算通常只对行方向提供,而列总是以独立的个体出现。但我们在个别时候也需要对列方向也进行一些整体运算,也就是 ..
-
2.1.1 环境 要求64 位的 Windows 和 Excel,不能用 32 位的,否则会出现异常。 判断 Windows 和 Excel 是否为 64 位的办法: 1、Windows: 点 ..
-
[链接]7.3 日期与时间 与时间相关的处理和计算也很常见,SPL 有三种数据类型:日期、时间、日期时间。 日期数据就只有日期信息,没有时间信息;时间数据只有时间信息,没有对应的日期信息;而日 ..
-
[链接]7.1 字符串 到现在这止,我们在程序中处理过的数据,除了 output 时有个少量文字外,都是数值或数值构成的序列。其实,计算机还能方便地处理文字,在程序语言中,我们把这些文字称为字 ..
-
线性、指数、对数、三角函数,这几类衰减函数都有各自的特点,详见下表: [图片]
-
[链接]8.3 序表生成 为了进一步学习排列上的运算,我们需要一个记录数多一点的序表,比如前面用过的四个字段的序表:name、sex、weight、height,能产生上百条记录再来做实验就方 ..
-
[链接]5.6 排序相关 为了解决数字黑洞问题,我们已经写了好几种排序代码了。排序确实是很常见的动作,所以 SPL 直接提供了排序函数。 A.sort() 将返回将 A 的成员从小到大排列的序 ..
-
麦克支撑压力(MIKE)指标是一种股价波动幅度大小而变动的压力支撑指标,设有初级、中级、强力三种不同级别的支撑和压力,用图标方式直接显示压力、支撑的位置。 MIKE 指标的计算方法比较复杂,其 ..
-
动态买卖气指标(ADTM)是用开盘价的向上波动幅度和向下波动幅度的距离差值来描述人气高低的指标。ADTM 指标在 +1 到 -1 之间波动。低于 -0.5 时为低风险区, 高于 +0.5 时为 ..
-
对于噪声比较多的数据通常需要先将数据平滑处理来去噪 比如,有一组含有噪声的数据如下图,使用sg()函数可以将数据进行多项式平滑处理 [图片] A 1 =file('sgdata.xlsx'). ..
-
计算方法: 1. 引力线(UDL)= 收盘价的(N1 日简单移动平均 +N2 日简单移动平均 +N3 日简单移动平均 +N4 日简单移动平均)/4 2.MAUDL=UDL 的 M 日简单移动平 ..
-
[链接]11.1 大数据和游标 我们这一章来讲如何处理大数据。 所谓大数据,在这里是指内存中装不下的数据,一般会在文件形式存放在硬盘上,或者存在数据库中(也是硬盘里),本书不涉及数据库,只讲述 ..
-
9.1 分组与汇总 当事物比较多的时候,人们会习惯将这些事物按属性分成若干类别,然后考察每个类别的一些汇总信息,这个操作表现在结构化数据上就叫分组。分组的具体动作为:把一个数据表中的记录按某个 ..
-
10.4 连接 接着上面这个订单例子,我们希望把两份文件中订单号相同但内容不同的记录挑出来之后。将字段(订单号除外)都拼到一起对照着看。也就是要想形成一个两倍字段数(除订单号)的数据表。 我们 ..
-
[链接]11.2 游标上的函数 仅是数数量,SPL 还有个 skip 函数。 A 1 =file('data.txt').cursor@t() 2 =A1.skip() skip 本意是跳过若 ..
-
第1 章 时间序列的异常发现 1.1 [链接] 1.2 [链接] 1.3 [链接] 1.4 [链接] 1.5 [链接] 1.6 [链接] 1.7 [链接] 第2 章 衍生时间序列 2.1 [链 ..
-
9.4 扩展和转置 分组后再汇总,通常会得到一个比原集合更小的集合,相当于做了聚合。那么,有没有分组的逆运算,用一个较小的数据表通过某种规则计算出一个更大的数据表呢? 我们把这类运算称为扩展或 ..
-
[链接]后记 本书用 12 章的篇幅从零基础开始介绍了程序设计的基本概念和逻辑,以及最常用到的结构化数据及其运算,包括大数据处理方法和统计图绘制。这些内容涵盖了常规程序设计的方方面面,用于应对 ..
-
msum(A, n) 表示在矩阵或多维矩阵中汇总求和,其中 n 为汇总的维度层数 比如一个5*4 的矩阵[[1,0,2,3],[0,71,5,6],[0,0,6,5],[35,53,2,3], ..
-
10.1 主键 在讲结构化数据概念时,我们说过数据表的字段有名字,但记录却没有名字。那么我们用什么办法来标识一条记录和另一条记录的不同呢?我们知道,每条记录都对应着某个事物的信息,到底是哪个呢 ..
-
[链接] [链接]4.2 遍历复用 我们知道,外存数据表的遍历运算中读取时间占比非常大,但读取又不可以避免,所以我们会希望一次读取能做尽量多的事情,也就是尽量做到能复用遍历过程中读出来的数据。 ..
-
[链接] [链接]2.2 集文件及倍增分段 文本文件使用字符来编码数据,通用性虽然比较好,但性能很差。要把字符转换成可以计算的数值,还需要较多的运算量,日期时间类数据还需要很复杂的解析判断过程 ..
-
[链接] [链接]6.3 外键序号化 从事实表的外键关联维表,本质上是一个查找动作。在事实表较大时无法做到预关联了,如果有办法能提高查找速度那也可以获得好的关联性能。 维表上通常已经建立有哈希 ..
-
[链接]9.2 枚举与对齐 将分组键相等的成员分到一个组,这种分组称为等值分组。等值分组满足这样两个特点: 1) 原集合的所有成员都在且只在唯一的组中; 2) 没有一个组是空集; 满足这种特点 ..
-
[链接] [链接]2.5 有序及数据追加 即使不减少存储量,有序存储对于查找和遍历也有巨大的意义,我们会后面会逐步讲到如何利用有序提高运算性能。 A 1 =file('data.ctx').c ..