数据样本量和变量数统计

 

无论是数据分析还是数据挖掘,首先都会浏览数据,查看一下数据的基本情况

SPL提供交互式的操作界面,这对数据分析用户来说非常友好。

比如泰坦尼克的数据,使用SPL进行查看代码如下:


A

1

=file("D://titanic.csv").import@qtc()

2

=A1.len()

3

=A1.fno()

4

=A1.fname()

A1 导入数据,在SPL界面右侧返回运行结果,可直接浏览数据

..

A2 查看数据样本量

..

A3 查有多少个字段

..

A4 获取字段名

..

通过上述操作,我们知道泰坦尼克的数据有89112列,数据中有乘客的个人信息和船票信息等。