SPL SQL Python 代码示例对比

 

约定

大多数的 Python 代码都会用到 pandas 和 numpy 这两个包,所以默认 Python 代码开始都会导入这两个包。即:

import pandas as pd
import numpy as np

目录

1 数据对象

1.1 简单集合
1.2 结构化数据

2 循环函数

2.1 当前值引用
2.2 使用变量
2.3 序号引用
2.4 相邻引用
2.5 循环产生和执行

3 分组理解

3.1 等值分组
3.2 非等值分组
3.3 有序分组
3.4 逆分组

4 聚合理解

4.1 基本聚合
4.2 选出聚合
4.3 集合聚合
4.4 分组聚合

5 迭代运算

5.1 简单迭代运算
5.2 提前终止的迭代运算
5.3 分组迭代

6 定位选出

6.1 定位运算
6.2 选出运算
6.3 定位计算

7 排序与转置

7.1 序列排序
7.2 结构化数据排序
7.3 序列排名
7.4 结构化数据排名
7.5 转置

8 连接理解

8.1 外键关联
8.2 主键关联
8.3 混合关联

9 综合示例

1. 计算用户会话次数
2. 1 分钟内连续得分 3 次的球员
3. 每 7 天中连续三天活跃的用户数
4. 每天新用户的次日留存率
5. 股价高于前后 5 天时当天的涨幅