追蹤
沙哇啦的無聊發想
關於部落格
Blog開始轉型中!
  • 40621

    累積人氣

  • 1

    今日人氣

    2

    追蹤人氣

圖書館學與 Google

在此之前,我必須要說明一些名詞。

Google 的 PageRank : PageRank 越高,該網站的排行就越高。比如說,你的網站內容是關於圖書館學資訊,如果 Google 給你的 PageRank 值越高, user 假如輸入「圖書館學資訊」,那搜尋結果中,你的網站就越前面。基本上, PageRank 值若在6以上都算不錯。

Google 的 PageRank 如何計算: Google 有訂出一套複雜的計算方式。 Google 會定期派出程式機器人,不停的穿梭在各網站,然後回報 Google 各種數值。 Google 再利用各種資料結算出該網站的 PageRank 。其中以回溯連結( Backlinks )的比重最高。簡單的說,越多人連結你的網站,你的網站的 PageRank 值越高。

SEO :搜尋引擎最佳化( Search Engine Optimization )。就是說,你必須要用某一種規則,使得搜尋引擎能夠以最佳的方式替你的網站做搜尋。換句話說,你的 SEO 能力越強, PageRank 的值就越高。

Google Bomb :某個 SEO 高手,如果對於某事件不滿,可以利用 SEO 技術,來擾亂 GOOGLE 排行。或者是,利用 SEO 技術,使得某個議題在某關鍵字中被突顯。比如說,你在 GOOGLE 打上「打壓新聞自由」做搜尋,第一個跑出來的就是「鴻海」。若是打「新聞自由」,「鴻海」還是排行第三。這是李怡志先生所主導的抗議活動。或者是最近的「 Google 王建民的挫敗 !

從以上解釋,我們可以發現, Google 在判斷某網站的資訊權威性,大部分是以回溯連結( Backlinks )來決定。
這套觀念對於圖書館學來說完全不陌生。比如說 SCI ,若是某篇論文被越多的學術論文與期刊所引用,我們就認定,該篇學術論文越有價值和權威性。
在此,我們就發現奧妙所在了。在 SCI 理論中,其被引用者和引用者的樣本是經過挑選的,必須是有價值的文獻,我們才會列入考量。然而, Google 對於樣本的挑選是一視同人(除非有重大作弊行為的網站),這樣會導致某網站數位資料的權威性無法認定。

如果事實是如此,圖書館界就不該對 GOOGLE 有任何幻想。
另外,我們可以由 Google Bomb 看出來,一個網站的排名(或者是權威度)是可以被操作的。

因此,我認為圖資界人士應該要思考以下幾點。

1. 數位資訊只會越來越多,而資訊遺失的可能性卻可能高於紙本:第一方面是載體的問題。當數位個人出版的機制越來越普及之後,想必會有更多的學術資料以數位方式出版。但是,數位不代表永久存在,數位的永久性在於載體。舉例而言,你用 Mirisoft Word 打了一篇文章,理論上,這篇文章會已完全不耗損的狀態保存,但是,萬一硬碟損壞、電腦中毒,這些資料就會消失。第二方面,是資料搜尋的問題。數位資訊由於產出迅速,被雜亂淹沒的可能性就會越高。在此之下,將資訊做有效的搜尋和分類就更顯的重要。

2.  Google 是一套機制,而非一套制度:機制是由程式決定,而制度是由人來執行。當我們了解了 Google 的 PageRank 的計算方式之後,我們就可以來操作 Google 排行。這樣的東西用在普羅大眾的資訊需求上,是好的。但是應用在學術資料上,卻是非常的不適用。

3. Google 是一家跨國民營公司,不是一個人類文化管理機構:當我們開始確定,人類文化傳承將以數位化進行時,圖書館界就應該要有所準備。比如說,目前部落格的盛行,圖書館界做了什麼?除了告訴大家這很好用之外。讓我們看看中時電子報的「編輯部落格」。他們已經開始用人工的方式審核部落格,只要是被評選合格,就可以納入聯播機制。也就是,聯播機制大家都可以做,但是這是大雜燴的做法,充其量只是讓 Blogger 有曝光的機會。但是,具有參考價值的聯播機制,真的需要一個以人為主的制度來運行。

真的, Google 的搜尋功能是非常好的、值得讚賞的。但是,這是只是從資訊界的角度來看的。然而,從圖資界來看,我想,也許圖資界要思考另一種方式,來處理越來越多的網路資訊。

相簿設定
標籤設定
相簿狀態