增补数据库表的各列统计特征建议
spl 作为处理数据的工具,用户进行处理的时候,一般会先看一下数据各列的大概特征。
如
sum,min,max,count,icount,describer,mean, 中位数等。(类似 python 的 pandas 的一个 describe 出来的结果)
建议 spl 中,增加一个函数,能很方便的将数据库的某一个表,各列的统计特征 展现出来。
这个功能很实用。
"spl 作为处理数据的工具,用户进行处理的时候,一般会先看一下数据各列的大概特征。 如 sum,min,max,count,icount,describer,mean, 中位数等。(类似 py .."
spl 作为处理数据的工具,用户进行处理的时候,一般会先看一下数据各列的大概特征。
如
sum,min,max,count,icount,describer,mean, 中位数等。(类似 python 的 pandas 的一个 describe 出来的结果)
建议 spl 中,增加一个函数,能很方便的将数据库的某一个表,各列的统计特征 展现出来。
这个功能很实用。
如果来自数据库,直接用 SQL 写就好吧,这样 IO 负担也很轻
而且,写成 xxx.groups(;sum,min,max,…) 有什么区别呢?如果期望后面这些 min,max,sum 都不写,那也可以自己 register 一个函数。SPL 层面没必要也不适合提供这种东西了。
主要是针对数据库中每个字段,都要单独写一个 group 比较麻烦,最好有一个统一的封装函数。简单调用一下该方法之后,列出所有列的统计特征。