"esProc SPL在结构化文本文件上的常规运算结构化文本文件是指以tab分隔的TXT文件或是逗号分隔的csv文件，这类文件可以看成是数据表。使用esProc SPL能够很方便地对这类文件进 .."

sjr 北京
乾学院 32 号会员
1 回帖 • 221 浏览 • 1 年前

esProc SPL 在结构化文本文件上的常规运算

计算＆AI

esProc SPL在结构化文本文件上的常规运算

结构化文本文件是指以tab分隔的TXT文件或是逗号分隔的csv文件，这类文件可以看成是数据表。使用esProc SPL能够很方便地对这类文件进行常见的SQL式运算。

这里假定文件第一行是字段标题。

	A	B
1	=T("scores.txt")
2	=A1.select(CLASS==2)	// filter
3	=A1.avg(Chinese)
4	=A1.max(Math)
5	=A1.sum(English)
6	=A1.derive(English+Chinese+Math:total_score)	// derive a total_score column
7	=A1.derive(if(Chinese>=90:"A",Chinese>=80:"B",Chinese>=60:"C";"D"):Chinese_evaluation)	// evaluate Chinese score
8	=A1.sort(English)
9	=A1.sort(CLASS,-Math)
10	=A1.groups(CLASS;min(English),max(Chinese),avg(Math))
11	=A1.groups(CLASS;avg(English):avg_En).select(avg_En<85)
12	=A1.top(-3;English)	// Top 3 high English students
13	=A1.groups(CLASS;top(3,English))	// Top 3 low English value in CLASS
14	=A1.id(CLASS)	// distinct CLASS
15	=A1.icount(CLASS)	// count distinct CLASS
16	=A1.groups(CLASS;icount(English))	// count distinct English every CLASS
17
18	=T("sales.csv")
19	=T("product.csv").keys(ID)	// ID as key
20	=A18.switch(ProductID,A19:ID)	// ProductID join ID
21	=A20.derive(Quantity*ProductID.Price:amount)
22
23	=T("sales.csv")
24	=A23.join(ProductID,A19:ID,Name,Price)	// import Name, Price join on ProductID=ID
25	=A24.derive(Quantity*Price:amount)