图书 •
828 引用 •
203 回帖 •
3 关注
博客
关注
-
[链接]1.2.1 结构化表格 结构化 Excel 表格比较规范, SPL 用 xlsimport/xlsexport 函数读写。 比如:ordersNT.xlsx 中第 1 个 sheet ..
-
[链接] [链接]2.3 数据类型 使用二进制文件后,我们可以采用更优化的编码方案。 一个整数在计算机可能占 4 字节或 8 字节,原则上存储到文件中也是这个大小。但是,其实有相当一部分整数并 ..
-
[链接] [链接]7.1 有序归并 我们已经多次提到过有序归并,比如第二章中讲有序组表的追加时就用到这个算法,它可以用于实现大集合的交并差运算。以并集为例写出来的算法逻辑大体如下: A B C ..
-
http://c.raqsoft.com.cn/article/1615762149295 4.3 并行遍历 我们在第二章讲过外存数据集分段的方法,它不仅可以用于二分法查找,更重要的是可以用于 ..
-
http://c.raqsoft.com.cn/article/1615244188566 3.6 批量查找 前面讨论的查找主要是单个查找值,如果同时有多个查找值,是否只要简单重复多次就可以了 ..
-
IQR=QU-QL 在QU+1.5IQR 和 QL-1.5IQR 处画两条与中位线一样的线段,称其为内栏 在QU+3IQR 和 QL-3IQR 处画两条线段,称其为外栏 落在内栏和外栏之间的观 ..
-
[链接] [链接]6.5 内连接语法 我们知道,事实表的外键不一定总有对应的维表记录,有可能存在无效值。一种很常见的动作是:如果发现外键没有对应的维表记录,则删除这条事实表记录;如果有,则做地 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
12.3 更多坐标系 第一节中我们还看到过饼图,但要在坐标系描述清这些圆和扇形的位置似乎太麻烦了。这是怎么画出来的? 除了直角坐标系,SPL 还提供了极坐标系。 极坐标系也需要两个轴(平面图形 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[链接] [链接]3.3 排序索引 外存中更常见的是排序索引。 哈希索引只能针对查找值做等值查找,即判断条件是相等,而不能做区间查找,即判断条件是被查找键在一个指定区间。而且,哈希索引在运气不 ..
-
[链接] [链接]4.1 游标过滤 使用索引或利用有序可以高速查找记录,但建立和维护索引以及保持数据有序的成本并不低,我们不可能预先为所有查询条件建立索引,必须时还要使用顺序查找,也就是遍历。 ..
-
[链接] [链接]1.2 序号定位 有时被查找键的取值正好是目标值在序表中的序号(即位置),或者很容易通过查找值计算出目标值的序号,这时可以使用序号定位方法。 A 1 =10000.new(~ ..
-
资金流量指标(MFI,英文全名 Money Flow Index)是相对强弱指标(RSI)和人气指标(OBV)两者的结合。MFI 指标可以用于测度交易量的动量和投资兴趣,而交易量的变化为股价未 ..
-
[链接] [链接]2.1 文本文件分段 性能问题常常都和数据量大相关,而大数据通常不能在内存中放下,我们要考虑外存数据的运算方案。数据库可能是最常见的外存数据存储方案,但我们无法在数据库中实施 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[链接] [链接]1.5 多层序号定位 前面讲过,不能针对身份证号直接使用序号定位的方法。但在某些特定情况下,还有变通的手段。 我们仍以用身份证号查找人员为例。如果待查找人群具有一些共同的特征 ..
-
[链接] [链接]4.6 分组汇总 分组是一种常见的遍历型运算,它需要读出并计算所有参与分组的记录。对这类需要全集参与的运算,索引几乎没有意义(极个别的场景有用,我们在下一章会讲到)。有些程序 ..
-
过去 N 日( 默认 5 天) , 每亿元成交额引起的股价振幅。 值大表明流通性差, 容易得到更高的收益补偿。 计算方法: 股价振幅等于当日最高价和最低价之间的差的绝对值与昨日收盘价的百分比 ..
-
[链接]无结构计算 本章主要对集算器中无结构计算的例题进行讲解,讲解中包括问题、思路、代码以及最终结果。 [链接] [链接] [链接] [链接] [链接] [链接] [链接] [链接] [链接 ..
-
[链接] [链接]8.5 标签位维度 标签维度是指取值只有是与否(或 true/false)两种的枚举维度,比如人员是否结婚、是否上过大学、是否拥有信用卡、…,也称二值维度。标签维度很常见,对 ..
-
[链接] [链接]5.5 前半序分组 还是以帐户、日期的帐户交易表,现在我们想把它换一种次序,将帐户内的交易记录改成按发生日的星期几排序,即把所有周日的交易都排到一起、然后再排周一的、周二、… ..
-
http://c.raqsoft.com.cn/article/1615504551386 3.9 全文检索 在结构化数据查询时常常会查找某字符串字段是否含有某确定子串的记录。如果是形如 li ..
-
[链接] [链接]7.2 分段归并 面向大数据的有序归并算法有个不太方便的地方,数据要一条条从两个(或更多)游标中读出后比对,这种逻辑下无法直接实现分段并行。因为无法保证两个表的关联键值是在对 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..