Google勝華佗 診病超準確 - Google

By Candice
at 2006-11-24T15:00
at 2006-11-24T15:00
Table of Contents
※ 引述《wasabicat (貓科動物)》之銘言:
: ※ 引述《thxmotor (天天都有好狗運)》之銘言:
: : Google勝華佗 診病超準確
: : 中時電子報 更新日期:2006/11/11 04:09 記者: 潘勛/綜合報導
: : 舉例來說,有個四十八歲男病患有「多重脊椎腫瘤」與「皮膚腫瘤」,兩位醫師輸入這兩
: : 個詞彙,古鉤便回答,病人可能罹患「第一型神經線纖維瘤」,答案正確無誤。
: : 另一個病例中,有名男子慢跑時失去意識;輸入「心跳遽停」、「運動」及「年輕」這三
: : 個詞彙,古鉤則回答病名是「阻塞性肥厚心肌症」,也答對了。其他診斷成功的病例還有
: : 庫賈氏症、胃腸出血、肌萎縮、腦炎等。
: : http://w114.news.tpc.yahoo.com/article/url/d/a/061110/4/6dot.html
: 這篇看推文的網友好多喔
: 可以問一下到底是該怎麼查詢嗎?
: 是直接到google上面,輸入上面病症的正確英文學名就可以查到了嗎?
: 還是有什麼特殊的網頁是用來查這個的
: 謝謝大家啦~~~
應該就是把症狀描述當做keyword,google會找出一堆相關疾病的網頁,
keyword下得好的話,出來的資訊還蠻有用的。
又,google的搜尋引擎真是越做越好。
之前去聽了Peter Norvig的演講,
講了google在搜尋、natural language processing(NLP)、
computational linguistics(CL)上的發展,
還真是令人印象深刻。
(先說,我不是做NLP、CL的人,或許這些領堿的人會有不同的意見)
他們用了蠻多AI、learning的東西來加強本身的技術。
最值得稱道的就是他們的training database,
畢竟是玩搜尋引擎的,他們擁有的training database大的嚇人,
相比之下,其它研究人員的training dataset看起來有點像玩具。
(again,我不是做NLP、CL的人,或許實情並不是如此)
就因為database很大,所以他們發展的方法也都是data-driven。
譬如說,他們讓電腦自己去learn各辭彙間的relation,語言、句子的pattern。
舉例而言,假如你在google上打population japan,
第一項就是直接告訴你日本的人口有多少(電腦直接去網路上幫你找出解答)。
當然有很多別的網站也是做的到這功能,
不過很多是靠定義regular expression、定義population是japan的一個屬性,
然後再去各網頁中尋找這個pattern,進而找到解答。
而google的作法則是讓電腦自己去learn這個pattern、
發現population是japan的一個屬性。
另外像google也在做statistical machine translation(MT),
用的也是learning based、data driven的方法,
就是讓電腦自己去learn各語言間的對應關係。
google在NIST的Arabic-English跟Chinese-Englis的MT evaluation中名列前矛,
據說他們的team裡面還沒有chinese跟arabic的linguistic expert!?
(後面這點不是Peter說的,是我聽別人講的,有可能是謠言:p)
對了,Peter還提到了他對搜尋引擎的想法,
大部分的人應該都認為搜尋引擎是單向的互動,
就是由內容提供者提供網頁->google分析、整理這些網頁
->最後在使用者查詢時給出結果。
不過Peter認為搜尋引擎應該是雙向的溝通,
因為一般的網頁中,絕大多數的東西都是垃圾,只有少數的內容才有意義,
因此只用網頁來learning,實在是問題多多(譬如說noise太多)。
但使用者所下的keyword不同,絕大多數的keyword簡短、有意義,
因此更適合用來整理、歸納各種資訊,幫助電腦來learn各種語言、辭彙上的關係。
(譬如說如果你想知道bush幾歲,絕大多數的人應該是下age bush當關鍵字,
而不是啥how old is bush之類的,
從這個query就可以知道而age和bush有關係:age是bush的屬性之一)
簡而言之,當你每次在google下關鍵字找東西時,
也算是間接的幫助了他們改善整個搜尋的效能。
--
: ※ 引述《thxmotor (天天都有好狗運)》之銘言:
: : Google勝華佗 診病超準確
: : 中時電子報 更新日期:2006/11/11 04:09 記者: 潘勛/綜合報導
: : 舉例來說,有個四十八歲男病患有「多重脊椎腫瘤」與「皮膚腫瘤」,兩位醫師輸入這兩
: : 個詞彙,古鉤便回答,病人可能罹患「第一型神經線纖維瘤」,答案正確無誤。
: : 另一個病例中,有名男子慢跑時失去意識;輸入「心跳遽停」、「運動」及「年輕」這三
: : 個詞彙,古鉤則回答病名是「阻塞性肥厚心肌症」,也答對了。其他診斷成功的病例還有
: : 庫賈氏症、胃腸出血、肌萎縮、腦炎等。
: : http://w114.news.tpc.yahoo.com/article/url/d/a/061110/4/6dot.html
: 這篇看推文的網友好多喔
: 可以問一下到底是該怎麼查詢嗎?
: 是直接到google上面,輸入上面病症的正確英文學名就可以查到了嗎?
: 還是有什麼特殊的網頁是用來查這個的
: 謝謝大家啦~~~
應該就是把症狀描述當做keyword,google會找出一堆相關疾病的網頁,
keyword下得好的話,出來的資訊還蠻有用的。
又,google的搜尋引擎真是越做越好。
之前去聽了Peter Norvig的演講,
講了google在搜尋、natural language processing(NLP)、
computational linguistics(CL)上的發展,
還真是令人印象深刻。
(先說,我不是做NLP、CL的人,或許這些領堿的人會有不同的意見)
他們用了蠻多AI、learning的東西來加強本身的技術。
最值得稱道的就是他們的training database,
畢竟是玩搜尋引擎的,他們擁有的training database大的嚇人,
相比之下,其它研究人員的training dataset看起來有點像玩具。
(again,我不是做NLP、CL的人,或許實情並不是如此)
就因為database很大,所以他們發展的方法也都是data-driven。
譬如說,他們讓電腦自己去learn各辭彙間的relation,語言、句子的pattern。
舉例而言,假如你在google上打population japan,
第一項就是直接告訴你日本的人口有多少(電腦直接去網路上幫你找出解答)。
當然有很多別的網站也是做的到這功能,
不過很多是靠定義regular expression、定義population是japan的一個屬性,
然後再去各網頁中尋找這個pattern,進而找到解答。
而google的作法則是讓電腦自己去learn這個pattern、
發現population是japan的一個屬性。
另外像google也在做statistical machine translation(MT),
用的也是learning based、data driven的方法,
就是讓電腦自己去learn各語言間的對應關係。
google在NIST的Arabic-English跟Chinese-Englis的MT evaluation中名列前矛,
據說他們的team裡面還沒有chinese跟arabic的linguistic expert!?
(後面這點不是Peter說的,是我聽別人講的,有可能是謠言:p)
對了,Peter還提到了他對搜尋引擎的想法,
大部分的人應該都認為搜尋引擎是單向的互動,
就是由內容提供者提供網頁->google分析、整理這些網頁
->最後在使用者查詢時給出結果。
不過Peter認為搜尋引擎應該是雙向的溝通,
因為一般的網頁中,絕大多數的東西都是垃圾,只有少數的內容才有意義,
因此只用網頁來learning,實在是問題多多(譬如說noise太多)。
但使用者所下的keyword不同,絕大多數的keyword簡短、有意義,
因此更適合用來整理、歸納各種資訊,幫助電腦來learn各種語言、辭彙上的關係。
(譬如說如果你想知道bush幾歲,絕大多數的人應該是下age bush當關鍵字,
而不是啥how old is bush之類的,
從這個query就可以知道而age和bush有關係:age是bush的屬性之一)
簡而言之,當你每次在google下關鍵字找東西時,
也算是間接的幫助了他們改善整個搜尋的效能。
--
Tags:
Google
All Comments

By Margaret
at 2006-11-28T11:28
at 2006-11-28T11:28

By William
at 2006-12-03T04:31
at 2006-12-03T04:31

By Catherine
at 2006-12-07T17:30
at 2006-12-07T17:30

By Skylar DavisLinda
at 2006-12-08T11:08
at 2006-12-08T11:08
Related Posts
Red Marker

By Mason
at 2006-11-24T01:43
at 2006-11-24T01:43
Re: 你敢嘗試嗎? Goggle.com

By Olga
at 2006-11-24T00:49
at 2006-11-24T00:49
Re: 你敢嘗試嗎? Goggle.com

By Mason
at 2006-11-23T22:09
at 2006-11-23T22:09
你敢嘗試嗎? Goggle.com

By Liam
at 2006-11-23T21:50
at 2006-11-23T21:50
Google Docs&Spreadsheets 方便快速的文書處理與試算表

By Todd Johnson
at 2006-11-23T20:01
at 2006-11-23T20:01