Search Console設定SEO robots.txt文件 - Google

Doris avatar
By Doris
at 2020-05-31T22:13

Table of Contents


【Google Search Console】設定SEO robots.txt文件,告訴搜索引擎哪些網頁不適合關
鍵字搜尋

網誌圖文版:

https://www.b88104069.com/archives/4510

robots.txt是網站SEO重點文件,本文以贊贊小屋網站的Google Search Console涵蓋範圍
報告為實際範例,介紹robots.txt文件的作用以及如何編寫,可以提高網頁收錄和關鍵字
搜尋的效率。

一、Google Search Console涵蓋範圍

登入Google Search Console之後,左邊欄位選擇「涵蓋範圍」 ,這裡共有四個類別,將
游標移到每個類別右下角的問號會有相關說明,其中「有效」指的是Google已經建立索引
的網頁,意思是網站有948個網頁文件被收錄在Google圖書館,當有人搜尋和網頁有關的
關鍵字,Google會考慮呈現該網頁,網站SEO便是致力於提高被Google選中的機率。

二、詳細資料

同一頁面下方的詳細資料中,有效狀態的網頁又分成兩個類型:「已提交並建立索引」和
「已建立索引,但未提交至Sitemap」。已提交Sitemap意思是自己有寫好一份網頁目錄提
交給Google參考。此時我的Wordpress總共有891篇文章,也提交了Sitemap,Google只收
錄869,沒有照單全收這倒是可以理解,但是有79篇不在我目錄裡面,Google卻幫我建立
索引了,這比較奇怪,為了網站SEO有必要進一步瞭解,點擊進入明細清單。

三、已建立索引,但未提交至Sitemap

看了明細比較清楚。「https://www.b88104069.com/profile」是贊贊小屋網站的介紹頁
面,「https://www.b88104069.com/」是網站首面,因為我是利用PHP程式讓Wordpress自
動產生Sitemap,只會有文章頁面,這兩個頁面確實會漏掉,Goggle幫忙收錄最好。

其餘網頁以「https://www.b88104069.com/archives/date/2015/03/page/6」和「
https://www.b88104069.com/archives/author/b88104069/page/60」為典型,從網址結
構大略可知是依照日期和作者的分頁目錄,日期還有些久遠,這應該我以前有設定過相關
網站機制,現在已經不用了,沒想到Google還留著。

四、網站分頁目錄

實際瀏覽網頁,果然和我猜想的一樣,像這樣的網頁目錄頁面其實並沒有全部文章內容,
如果真的出現在搜索結果,讀者點進來發現不如預期的話,馬上離開,這個訊息會反饋到
Google那裡,Google因此會降低網站分數,對於SEO不是件好事。

五、robots.txt文件

這種事讀者不高興、Google不想要、我當然也不喜歡。為了有效避免,SEO技術中有一種
robots.txt文件,可以很清楚告訴各家搜索引擎,網站中有哪些網頁並不是要給讀者的,
如此一來,提高了網路讀者的使用者體驗,同時也增加搜索引擎收錄效率。以Goggle為例
,www全球資訊網這麼多網站網頁,如果能預先知道哪些沒有必要收到圖書館中,大大減
輕館員工作負擔,利己利人。

robots.txt文件必須放在網站入口、亦即網站根目錄,沒有架過網站的讀者,把網站想成
電腦資料夾、網頁是資料夾裡的文件,應該會比較容易理解。截圖是贊贊小屋網站範例,
第一次看可能難以理解,同樣以電腦文件,Windows裡面有很多系統文件和使用者操作無
關,網站也是如此,可想見會有很多網站運作有關的程式文件,這裡很多的「Disallow:
」就是要避免這些技術被Google收錄為www網頁,類似於Windows系統隱藏文件的效果。

六、Search Console說明

由於對雙方有利,Google在Search Console說明中心提供很多robots.txt的說明文件,具
體到完整語法和示例語句,有興趣讀者可以參考。

七、遭到robots.txt封鎖

到這裡已經基本瞭解robots.txt文件,回到第一步驟涵蓋範圍中有個「排除」,有2976個
之多,其中237個是被robots.txt文件擋掉的網站文件,可想見如果沒有robots.txt的話
會很麻煩。

以第一個被排除的網頁為例:「
https://www.b88104069.com/archives/category/journey」,這是分類頁面的網頁,參
照第五步驟的「Disallow: /archives/category/」,robots.txt的實際作用和如何設定
應該很清楚了。

八、robots.txt的Disallow設定

終於到達本文最後步驟,依照Google Search Console的索引報告相對應修改robots.txt
文件:「Disallow: /archives/date/」、「Disallow: /archives/author/」。

這篇文章出現了幾次Sitemap,從Google Search Console網站工具上便可知道SEO少不了
Sitemap,以後在系列文章會再作介紹。另外在涵蓋範圍的報告中有很多類別,這篇文章
是集中在robots.txt排除的部份,其他部份同樣留後往後的系列文章。


延伸閱讀:

Google Search Console除了網站搜尋量,可查詢網頁關鍵字排名報告,轉Google文件或
Excel

https://www.b88104069.com/archives/4484

Google Analytics網站分析與Google Search Console網站排名,兩大工具資料共用容易
卡死的盲點

https://www.b88104069.com/archives/4430

Google Adsense廣告拖慢網站速度不利SEO?刪掉重覆的網頁Async Script非同步程式碼

https://www.b88104069.com/archives/4420

--


周末,我們繼續Excel:精華區=>21.心得=>5.其他=>3.office

會計人的Excel小教室: https://www.facebook.com/acctexcel


--
Tags: Google

All Comments

有人想要一起研究google studio嗎?

Noah avatar
By Noah
at 2020-05-30T20:57
如題 最近因為工作關係,自己開始玩了一些目視化圖表 但教學大部分是英文的 雖然靠自己摸索,複製樣本開始自己改 雖然有些雛形,但相較於其他高手,一定還有很多不足的地方 所以想看看板上有沒有大大也有興趣, 一起學習,教學相長 不熟,或是剛想學也沒關係 也許會產生許多意想不到的想法 有興趣的可以站 ...

Gmail可否直接編輯office文件後做回覆?

Donna avatar
By Donna
at 2020-05-29T20:10
經常使用Gmail網頁版 有時收到的ppt or word只需補充一句話就回復信件 目前做法是需要先下載編輯後 重新掛附件 可否直接點開ppt/word後在文件/試算表/簡報中修改 並儲存後直接回到回覆編輯信件中 (等於整個流程都在雲端中執行) 不知可否如此 還請經驗分享看看 謝謝:) - ...

Chrome 在插上耳麥時會自動撥放影片

Olive avatar
By Olive
at 2020-05-26T22:00
如題, 想請問要怎麼解決在插上耳麥時Chrome會自動撥放影片的問題 謝謝! - ...

GOOGLE的搜尋結果的介面是不是更改了

Connor avatar
By Connor
at 2020-05-26T20:29
※ [本文轉錄自 ask 看板 #1UpGdkeh ] 作者: OuttaControl (奧達肯啜) 看板: ask 標題: [請問] GOOGLE的搜尋結果的介面是不是更改了 時間: Tue May 26 20:22:04 2020 小弟使用的瀏覽器是Chrome 平常習慣在網址列輸入要搜尋的關鍵字 ...

如何查看已追蹤嚮導之新動態

Kama avatar
By Kama
at 2020-05-24T23:17
google map開啟了追蹤嚮導的選項一陣子 不過追蹤後對方發新評價也不會有什麼通知 打開地圖也不知道要去哪邊看 還是說其實追蹤嚮導功能 只是方便從自己的已追蹤列表 去點他們的資料來看他們的評論 而不是有一個頁面能看到新的評價動態 像社群軟體那樣 - ...