文本匹配变换
【问题】
How can awk be used to find values that match in row 2 for each column?
I would like to take in a tab limited file and for each column if any row below row 2 matches what is in row 2, print field with "match".
transforming this tab delimited file:
header1 header2 header3
1 1 B
3 1 A
2 A B
1 B 1
To this:
header1 header2 header3
1 1 B
3 1 match A
2 A B match
1 match B 1
【回答】
有些逻辑判断的运算,用SPL比awk更简单些,SPL可以用命令行执行,也可以集成进java(参考Java 如何调用 SPL 脚本):
A |
|
1 |
= file("user/data.txt").import@t() |
2 |
=A1(1).array() |
3 |
=A1.to(2,).run(~.record(~.array().(if(~==A2(#),~/"match",~)))) |
A1:读取data.txt文件内容。
A2:将A1第一条记录中的字段值返回成序列。
A3:从A1第二条记录开始分别对每一条记录进行计算处理,其中A2(#) 表示读取 A2的同位置记录。