变量相关性
在SPL中可以使用pearson和spearman来评估变量之间关系的函数
例如,在房价预测的数据中,分析房屋的居住面积GrLivArea和销售价格SalePrice之间的关系
A |
|
1 |
=file("D://house_prices_train.csv").import@qtc() |
2 |
=A1.(GrLivArea) |
3 |
=A1.(SalePrice) |
4 |
=pearson(A2,A3) |
5 |
=spearman(A2,A3) |
6 |
=canvas() |
7 |
=A6.plot("NumericAxis","name":"x") |
8 |
=A6.plot("NumericAxis","name":"y","location":2) |
9 |
=A6.plot("Dot","lineWeight":0,"lineColor":-16776961,"markerWeight":1,"axis1":"x","data1":A2,"axis2":"y","data2": A3) |
10 |
=A6.draw(800,400) |
A4 计算居住面积和销售价格之间的pearson相关系数
A5 计算两变量的spearman相关系数
同样在SPL中也可以通过可视化的方式来分析变量之间的关系
A6-A10 绘制两变量之间的散点图,可以看到随着房屋面积的增加,销售价格也呈线性增加趋势。