5 SPL 实践例程

 

【实践例程】

SPL 实践:向数据库外迁移计算任务
SPL 实践:海量灵活结构数据查询
SPL 实践:异构库的数据比对
SPL 实践:数据转存时的整数化
SPL 实践:搞死 MPP 的时空碰撞问题
SPL 实践:万亿计算量时空碰撞三分钟搞定
SPL 实践:高并发帐户查询
SPL 实践:计算路由提升并发能力
SPL 实践:多指标实时计算
SPL 实践:客户画像
SPL 实践:漏斗分析
SPL 实践:单节点实现每日百亿时序数据实时写入和秒级统计
SPL 实践:高维二值向量查找

用 SPL 做数据挖掘建模预测

【数据维护】

SPL 实践:跑批提速时的数据流程

数据维护例程
热数据缓存例程

定期小量主动更新例程
单组表定期维护例程
复组表定期维护例程
实时追加例程 (分表)
实时更新例程
实时追加例程—用内存避免小分表

【量化模型】

SPL 量化系列实践:回测例程
SPL 量化系列实践:海龟策略
SPL 量化系列实践:MACD 背离策略

【工业智能】

剔除集合中过大过小的异常值
有边界的线性拟合算法
质量守恒约束下的多变量线性拟合算法
无监督实时异常发现算法
拟合曲线趋势
筛选指定特征的曲线段一——计算曲线特征

【高性能练习】

用 TPCH 练习性能优化
SPL 性能优化基础练习

【用户行为分析】

用户行为分析系列实践 1 - 常规分组统计
用户行为分析系列实践 2 - 冗余分组键
用户行为分析系列实践 3 - 有序二分法过滤
用户行为分析系列实践 4 - 使用列存
用户行为分析系列实践 5 - 使用维表
用户行为分析系列实践 6 - 维表序号化
用户行为分析系列实践 7 - 维表过滤
用户行为分析系列实践 8 – 变化的维表
用户行为分析系列实践 9 – 枚举和标签维度
用户行为分析系列实践 10 – 帐户有序存储
用户行为分析系列实践 11 – 有序分组
用户行为分析系列实践 12 – 使用虚表
用户行为分析系列实践 13 – 双维有序
用户行为分析系列实践 14 – T+0 实时分析

【多维分析后台】

多维分析后台实践 1:基础宽表
多维分析后台实践 2:数据类型优化
多维分析后台实践 3:维度排序压缩
多维分析后台实践 4:预汇总和冗余排序
多维分析后台实践 5:小事实表关联小维表
多维分析后台实践 6:大事实表关联小维表
多维分析后台实践 7:布尔维度和二值维度
多维分析后台实践 8:主子表及并行计算