数据样本量和变量数统计
无论是数据分析还是数据挖掘,首先都会浏览数据,查看一下数据的基本情况
SPL提供交互式的操作界面,这对数据分析用户来说非常友好。
比如泰坦尼克的数据,使用SPL进行查看代码如下:
A |
|
1 |
=file("D://titanic.csv").import@qtc() |
2 |
=A1.len() |
3 |
=A1.fno() |
4 |
=A1.fname() |
A1 导入数据,在SPL界面右侧返回运行结果,可直接浏览数据
A2 查看数据样本量
A3 查有多少个字段
A4 获取字段名
通过上述操作,我们知道泰坦尼克的数据有891行12列,数据中有乘客的个人信息和船票信息等。