字串段落尋找 - Linux

Table of Contents

請問版友 要怎麼取得Html文字中的某個區段內容

例如內容如下

<head>
<li><a href="#01">XXXXXX</a></li>
<li><a href="#02">YYYYYY</a></li>
</head>

<head>
<li><a href="#01">MMMMMM</a></li>
<li><a href="#02">NNNNNN</a></li>
</head>

要怎麼取得第二組head內中的資料,例如取得

<li><a href="#01">MMMMMM</a></li>
<li><a href="#02">NNNNNN</a></li>

目前的處理方式是用grep "MMMMMM" 跟grep "NNNNNN"
但是因為MMMMM跟NNNNN會變動,所以不好處理

想請問有沒有方式可以用<head>跟</head>當成標記
來處理字串的方式呢?

--

All Comments

Kristin avatarKristin2014-04-10
grep href=\"#0 filename
Eartha avatarEartha2014-04-14
grep href=\"#0[12] filename
Audriana avatarAudriana2014-04-17
sed -n '3,4p'
Agnes avatarAgnes2014-04-18
看看 grep -C 3 "MMMMMM" 能不能符合你的需求
Elizabeth avatarElizabeth2014-04-21
cat test.html | sed '1,/<\/head>/d'
(承上) | sed -e '/^.*<head>/ d' -e '/<\/head>.*$/ d'
Una avatarUna2014-04-22
Awk 設定字首字尾
Vanessa avatarVanessa2014-04-25
謝謝 版友們 ^_^