"大佬们,麻烦看一下 pjoin 里的聚合问题,当一对多时,聚合函数部分能不能拓展一下,返回波浪线 ~,以排列的形式出现,也可以用 ~.func(字段) 这样的形式去处理?如下图所示: [图片] .."
大佬们,麻烦看一下 pjoin 里的聚合问题,当一对多时,聚合函数部分能不能拓展一下,返回波浪线 ~,以排列的形式出现,也可以用 ~.func(字段) 这样的形式去处理?如下图所示:
谢谢!!
Excel 的小数据用 join 函数。pjoin 是为了大数据列式计算优化的,为了保持兼容性在小数据下也支持(方便调试)。
大神,早😄我有两个问题:1、pjoin 里,一对多聚合的时候,聚合函数的使用只能像 groups 里那样使用,不能写成 "~.f(字段)" 这样的形式对吧?2、算是一个需求,join 系列函数有点多,join,fjoin,pjoin,xjoin 每一个函数里还有不同的选项,官方能不能写一些小文章介绍一下使用的场景,性能上的比较,特别是关联计算的时候性能上的比较?陈虎老师写了一些,您也有阐述 join 核心思想的相关文章,但对小白来说属于高阶了,不好理解消化。
pjoin 为了高性能,不能出现这种显式集合(严重拖累性能)。先忽略 fjoin 和 pjoin,xjoin 使用点很明确,其它的就是分清外键和主键即可,也不算太费劲。Excel 这种小数据,通常都慢不到哪去。如果是因为反复循环导致的计算量大,用 fjoin/pjoin 这些也解决不了。
谢谢老贼解惑🙏我对着文章慢慢学吧,不懂再问。
Excel 的小数据用 join 函数。pjoin 是为了大数据列式计算优化的,为了保持兼容性在小数据下也支持(方便调试)。
大神,早😄
我有两个问题:
1、pjoin 里,一对多聚合的时候,聚合函数的使用只能像 groups 里那样使用,不能写成 "~.f(字段)" 这样的形式对吧?
2、算是一个需求,join 系列函数有点多,join,fjoin,pjoin,xjoin 每一个函数里还有不同的选项,官方能不能写一些小文章介绍一下使用的场景,性能上的比较,特别是关联计算的时候性能上的比较?陈虎老师写了一些,您也有阐述 join 核心思想的相关文章,但对小白来说属于高阶了,不好理解消化。
pjoin 为了高性能,不能出现这种显式集合(严重拖累性能)。
先忽略 fjoin 和 pjoin,xjoin 使用点很明确,其它的就是分清外键和主键即可,也不算太费劲。Excel 这种小数据,通常都慢不到哪去。如果是因为反复循环导致的计算量大,用 fjoin/pjoin 这些也解决不了。
谢谢老贼解惑🙏
我对着文章慢慢学吧,不懂再问。