資料的截取與邏輯判斷 - Linux

By Doris
at 2018-06-26T21:26
at 2018-06-26T21:26
Table of Contents
我現在正在處理一些有關於生物資訊的資料
基本上的資料格式長這樣
ID A_1 A_2 B_1 B_2 ……
1 0/0 0/0
2 0/0 ./.
3 ./. ./.
4. 0/0 0/1
5. 1/1 0/1
6. 0/1 0/1
……
接著我想要做幾件事情
依據相同字母的樣本(像是A_1和A_2)
逐列統計四種欄位的數量
1. A_1和A_2相同
2. A_1和A_2都一樣是./.
3. A_1和A_2不一樣
4. 以及任一樣本含有./.的欄位數量
以上表為例
A_1和A_2相同的數量是3 (ID1, 3, 6)
兩行數值都是./.的數量是1
A_1和A_2不同的列有3 (ID2, 4, 5)
有任一行數值為./.的數量為2 (ID2, 3)
然後統計成四個數值這樣並輸出
不過有問題的部分是要如何擷取含有特定字串的兩欄
並逐行進行邏輯判斷?
我知道可以利用awk逐行進行擷取並用grep計算數量並輸出 (不過awk和grep的管線順序還沒參透)
但要如何依據相同字母擷取特定行就不清楚了
想問有甚麼指令可以針對首列帶有特定字串的行進行擷取?
--
Sent from my Windows
--
基本上的資料格式長這樣
ID A_1 A_2 B_1 B_2 ……
1 0/0 0/0
2 0/0 ./.
3 ./. ./.
4. 0/0 0/1
5. 1/1 0/1
6. 0/1 0/1
……
接著我想要做幾件事情
依據相同字母的樣本(像是A_1和A_2)
逐列統計四種欄位的數量
1. A_1和A_2相同
2. A_1和A_2都一樣是./.
3. A_1和A_2不一樣
4. 以及任一樣本含有./.的欄位數量
以上表為例
A_1和A_2相同的數量是3 (ID1, 3, 6)
兩行數值都是./.的數量是1
A_1和A_2不同的列有3 (ID2, 4, 5)
有任一行數值為./.的數量為2 (ID2, 3)
然後統計成四個數值這樣並輸出
不過有問題的部分是要如何擷取含有特定字串的兩欄
並逐行進行邏輯判斷?
我知道可以利用awk逐行進行擷取並用grep計算數量並輸出 (不過awk和grep的管線順序還沒參透)
但要如何依據相同字母擷取特定行就不清楚了
想問有甚麼指令可以針對首列帶有特定字串的行進行擷取?
--
Sent from my Windows
--
Tags:
Linux
All Comments

By Gary
at 2018-06-29T08:06
at 2018-06-29T08:06

By Anthony
at 2018-07-01T14:59
at 2018-07-01T14:59

By Hamiltion
at 2018-07-02T17:02
at 2018-07-02T17:02

By Olive
at 2018-07-04T05:52
at 2018-07-04T05:52

By Leila
at 2018-07-05T13:47
at 2018-07-05T13:47

By Heather
at 2018-07-07T14:51
at 2018-07-07T14:51

By Lucy
at 2018-07-10T11:34
at 2018-07-10T11:34

By Audriana
at 2018-07-12T13:56
at 2018-07-12T13:56

By Anonymous
at 2018-07-16T13:10
at 2018-07-16T13:10

By Charlie
at 2018-07-19T16:00
at 2018-07-19T16:00
Related Posts
尋找空的資料夾或是非空的資料夾?

By Ina
at 2018-06-21T10:11
at 2018-06-21T10:11
請問現在 Manjaro 安全性還是很低嗎?

By Joe
at 2018-06-20T20:58
at 2018-06-20T20:58
GTK+ UVC Viewer(Guvcview) Snap 軟體包

By Ivy
at 2018-06-19T18:47
at 2018-06-19T18:47
如何關閉 crontab 觸發 mail

By William
at 2018-06-19T15:04
at 2018-06-19T15:04
要如何查資料夾所有文件檔裡面的特定字

By Blanche
at 2018-06-19T13:08
at 2018-06-19T13:08