"分类数据属于定性数据，通常可以从以下几个维度来探索分析 [图片]在SPL中可以使用A.id(), A.group(),A.groups()等函数来进行相关的操作。例如，在泰坦尼克的数据中，有 .."

jiangzhucao 北京
乾学院 1061 号会员
547 浏览 • 3 年前

分类数据探索

图书

分类数据属于定性数据，通常可以从以下几个维度来探索分析

在SPL中可以使用A.id(), A.group(),A.groups()等函数来进行相关的操作。

例如，在泰坦尼克的数据中，有一个”Embarked”的变量表示乘客的登船信息，是一个分类变量，用上述几个函数探索如下：

	A
1	=file("D://titanic.csv").import@qtc()
2	=A1.id(Embarked)
3	=A1.(Embarked).mode()
4	=A1.group(Embarked)
5	=A1.groups(Embarked;count(~):count,count(~)/A1.len():freq)
6	=A4.run(if(Embarked,Embarked,"null"):Embarked)
7	=canvas()
8	=A6.plot("EnumAxis","name":"x","location":3,"polarX":0.55, "allowLabels":false)
9	=A6.plot("NumericAxis","name":"y","location":4,"allowLabels":false)
10	=A6.plot("Sector","text":A4.(count),"axis1":"x","data1":A4.(Embarked),"axis2":"y","data2":A4.(count))
11	=A6.draw@p(600,450)