上 Google Search 尋找答案是現代許多人遇到疑問時的第一個動作,搜尋引擎早成為生活中不可或缺的一部分。過去你可能要把常用網站儲存在「我的最愛」裡,下次使用時才找得到;現在在 Google Search 上用關鍵字來找還比較快,尤其是瀏覽器網址列整合了搜尋功能後,我們就更離不開 Google Search 了。
不過 Google Search 裡有接近一百六十四億筆中文資料,我們要找到自己想要的結果確實不太容易。有時想要搜尋繁體中文的結果,不過跑出來的盡是簡體中文資料;或是搜尋結果和你想要的不太一樣。這到底是怎麼回事呢?
我們在T客邦網站經過網友投票選出中文搜尋難題,有55.08%的網友都對搜尋繁體中文卻出現較多簡體結果感到困擾,我們特地採訪到 Google 台灣區總經理簡立峰先生,由這位中文搜尋的專家告訴我們答案。
▲Google台灣區總經理接受T客邦採訪,談論網友常遇到的搜尋難題。
TIPS:要怎麼確認 Google Search 裡有多少中文資料?Google 台灣區總經理簡立峰給我們一個小撇步:只要搜尋「的」這個字就可以了,因為絕大多數的中文網站都會用到這個字。
三個面向決定 Google Search 搜尋結果
Google是如何決定搜尋結果的?簡立峰先生告訴我們 Google Search 的結果會受到三個面向影響:
- 第一個面向是使用者的語言,Google Search 一共提供了四十幾種不同的語言結果。
- 第二個面向是使用者所在的地區,世界上一共有兩百多個不同的國家和地區。
- 最後一個面向則是使用者所選擇的網站,在台灣就是指「www.google.com」和「www.google.com.tw」的不同。一個關鍵字會受到這三個面向的影響而產生不同的結果。
▲ 搜尋的三個面向都會讓你的搜尋結果有所不同。
簡立峰先生以「NTU」這個關鍵字為例說明這些面向的影響;如果你在「www.google.com.tw」搜尋這個關鍵字,第一條結果會是台灣大學(National Taiwan University),因為你指定了使用 Google Search 台灣版;不過如果你在「www.google.com」中輸入這個關鍵字,第一條結果會是新加坡的南洋理工大學(Nanyang Technological University),而台大則落到第四個結果,因為世界上以NTU為縮寫的大學不少,影響力愈大的大學在Google Search中的關鍵字排名就愈前面。使用者所採用的面向決定了搜尋結果。不過簡立峰先生也表示,Google雖然會自動決定這些會影響搜尋結果的因素,不過並不是百分之百精準,例如受到自動偵測IP位置功能的影響而產生誤差,因此有時候還是需要手動調整這些結果。
找到簡體中文的原因
簡立峰先生也解釋了輸入繁體中文的關鍵字卻出現簡體結果的原因。這是因為部份網站內容包含繁體與簡體中文,例如多數 Wikipedia 網頁,由於同時提供簡體與繁體中文內容,因此在搜尋時輸入繁體中文的關鍵字之後,也會發現有簡體中文出現在你的搜尋結果中。
另外,由於繁體中文的資料大約只佔了全部中文資料的九分之一,而 Google Search 則希望使用者盡可能找到最多筆的相關資料,因此也會有混合繁體與簡體中文的內容出現在搜尋結果中。
▲如果你找的資料沒有繁體中文的資料,就會顯示簡體資料。
利用搜尋工具可改變結果
雖然搜尋的三個面向是由Google Search自行決定,不過你可以透過搜尋工具來改變搜尋結果,這些搜尋工具就在Google Search搜尋結果頁面的左下方。如果你的搜尋結果出現繁體中文的資料,但你的「位置」顯示與實際的地理位置有很大差距時,也會對搜尋結果的相關度產生影響。這時你可以透過「變更位置」功能,在Google Search指定你想找到哪個國家、地區的結果。另外你也可以透過「網路」工具指定只列出「繁體中文」的結果,甚至可以只列出「台灣的網頁」。
▲ 你可以透過搜尋工具影響Google的搜尋結果。
使用者行為才是關鍵
對整體關鍵字搜尋所列出的結果排名來說,使用者行為才是影響這些排名的最大因素,由於搜尋結果都是按照點擊率自然排列,若是透過繁體中文搜尋,卻頻頻出現簡體中文的搜尋結果,就表示這些簡體中文資料即使在台灣地區也是有一定數量的使用者會點閱。
Google 使用許多方式分析使用者行為。不過其中一個最重要的判斷動作就是使用者在搜尋結果網頁的停留時間,例如使用者在打開某個「可能是你要的」網頁後,快速關閉或離開該網頁,就表示該網站並非適當的搜尋結果。久而久之,該網站就會在某個關鍵字的搜尋結果排名中下降。
使用者行為甚至可以在 Google Search 中產生特例,例如一般來說半形標點符號是不列出搜尋結果的,不過 Google 以使用者行為判斷的結果,就出現了「s.h.e」這個特例,搜尋結果即會出現台灣女子偶像團體「S.H.E」,而非僅是英文單字「she」。
▲ 使用者行為讓「s.h.e」成為 Google Search 裡一個包含標點的特例關鍵字。
網頁的標題、內容用字不同所產生的差異
雖然有時找不到想要的結果,可能是你下的關鍵字不正確;但是,也可能是由於網站管理者為自己的網站所列出的標題名稱,不是使用者慣常使用的名稱。例如,兩岸主管觀光的機關名稱不同,台灣稱為「觀光局」,不過在中國稱為「旅遊局」,這種用詞的差異也會影響到搜尋的結果。
如果台灣交通部觀光局沒有將「旅遊局」這個名稱列為網站關鍵字中,那麼中國使用者用「旅遊局」找觀光局相關資訊時,可能就找不到所需的資料了。
▲如果兩岸用詞不同,找到的資料一開始可能不是你需要的,不過透過使用者行為的累積,Google Search的搜尋結果會愈來愈正確。