变量相关性

 

SPL中可以使用pearsonspearman来评估变量之间关系的函数

例如,在房价预测的数据中,分析房屋的居住面积GrLivArea和销售价格SalePrice之间的关系


A
1 =file("D://house_prices_train.csv").import@qtc()
2 =A1.(GrLivArea)
3 =A1.(SalePrice)
4 =pearson(A2,A3)
5 =spearman(A2,A3)
6 =canvas()
7 =A6.plot("NumericAxis","name":"x")
8 =A6.plot("NumericAxis","name":"y","location":2)
9 =A6.plot("Dot","lineWeight":0,"lineColor":-16776961,"markerWeight":1,"axis1":"x","data1":A2,"axis2":"y","data2": A3)
10 =A6.draw(800,400)

A4 计算居住面积和销售价格之间的pearson相关系数

..

A5 计算两变量的spearman相关系数

..

同样在SPL中也可以通过可视化的方式来分析变量之间的关系

A6-A10 绘制两变量之间的散点图,可以看到随着房屋面积的增加,销售价格也呈线性增加趋势。

..