文本匹配变换

【问题】

How can awk be used to find values that match in row 2 for each column?

I would like to take in a tab limited file and for each column if any row below row 2 matches what is in row 2, print field with "match".

transforming this tab delimited file:

header1	header2	header3
1	1	B
3	1	A
2	A	B
1	B	1

To this:

header1	header2	header3
1	1	B
3	1 match	A
2	A	B match
1 match	B	1

【回答】

有些逻辑判断的运算,用SPLawk更简单些,SPL可以用命令行执行,也可以集成进java(参考Java 如何调用 SPL 脚本):


A

1

= file("user/data.txt").import@t()

2

=A1(1).array()

3

=A1.to(2,).run(~.record(~.array().(if(~==A2(#),~/"match",~))))

 

A1:读取data.txt文件内容。

undefined

A2:将A1第一条记录中的字段值返回成序列。

A3:从A1第二条记录开始分别对每一条记录进行计算处理,其中A2(#) 表示读取 A2的同位置记录

undefined