SPL SQL Python 代码示例对比

 

约定

大多数的 Python 代码都会用到 pandas 和 numpy 这两个包,所以默认 Python 代码开始都会导入这两个包。即:

import pandas as pd
import numpy as np

目录

1 数据对象

1.1 简单集合
1.2 结构化数据

2 循环函数

2.1 当前值引用
2.2 使用变量
2.3 序号引用
2.4 相邻引用
2.5 循环产生和执行

3 分组理解

3.1 等值分组
3.2 非等值分组
3.3 有序分组
3.4 逆分组

4 聚合理解

4.1 基本聚合

4.2 选出聚合

4.3 集合聚合

4.4 分组聚合

5 迭代运算

5.1 简单迭代运算

5.2 提前终止的迭代运算

5.3 分组迭代

6 定位选出

6.1 定位运算

6.2 选出运算

6.3 定位计算

7 排序与转置

7.1 序列排序

7.2 结构化数据排序

7.3 序列排名

7.4 结构化数据排名

7.5 转置

8 连接理解

8.1 外键关联

8.2 主键关联

8.3 混合关联

9 综合示例

9.1 如果用户 10 分钟没有任何动作或退出后 5 分钟没有登录则认为会话结束,计算各用户的会话次数

9.2 1 分钟内连续得分 3 次的球员

9.3 每 7 天中连续三天活跃的用户数

9.4 每天新用户的次日留存率

9.5 股价高于前后 5 天时当天的涨幅