如何删除指定列中包含重复值的行

例题描述和简单分析

有 Excel 文件 book1.xlsx,数据如下所示:

现需要按列去重不保留。从 Container 列里找到重复的值,并删除这些值所在的行,不保留记录,结果如下:

解法及简要说明

在集算器中编写脚本 p1.dfx,如下所示:


A

1

=clipboard().import@t()

2

=A1.group(Container).select(~.len()==1).conj()

3

=file("result.xlsx").xlsexport@t(A2)

简要说明:

A1   把剪贴板里的数据读成序表

A2  Container列分组,只取组内记录数为 1 的结果,合并。

A3  结果导出至 result.xlsx

执行程序后,result.xlsx 中就是需要的结果。

问答搜集

https://stackoverflow.com/questions/64219953/remove-duplicates-based-on-specific-column-name