如何删除指定列中包含重复值的行
例题描述和简单分析
有 Excel 文件 book1.xlsx,数据如下所示:
现需要按列去重不保留。从 Container 列里找到重复的值,并删除这些值所在的行,不保留记录,结果如下:
解法及简要说明
在集算器中编写脚本 p1.dfx,如下所示:
A |
|
1 |
=clipboard().import@t() |
2 |
=A1.group(Container).select(~.len()==1).conj() |
3 |
=file("result.xlsx").xlsexport@t(A2) |
简要说明:
A1 把剪贴板里的数据读成序表
A2 按Container列分组,只取组内记录数为 1 的结果,合并。
A3 结果导出至 result.xlsx
执行程序后,result.xlsx 中就是需要的结果。
https://stackoverflow.com/questions/64219953/remove-duplicates-based-on-specific-column-name
英文版
英文已更新