关于大数据文件的处理优化的问题

我想把一个 17G 的集文件中的部分字段组合去重,然后拼接字符串,转换为 JSON 文件,我用游标处理,代码如下,跑了一晚上没跑完,麻烦帮我看看,我的代码有啥问题,可以优化不

b32b3ade88963c24c0e3d41c04d8147jpg