,但是有的同學在看了一個很漂亮的網頁後想介紹給別人時不得不繁瑣的記下該站得網址,要知道網址要鏈到某個具體網頁的時候有可能會非常的長,所以他忍不住想到,能不能做一個工具將網路上所有地網頁都抓取下來,然後存在自己的伺服器中,當人們輸入一定的關鍵字後進行自動匹配。 從而將某個具體的資源返還給人們呢。 大學的研究還不像公司,公司開發一款產品往往會進行大量的市場
調查,然後還要考慮是否盈利,而大學生做產品往往是靈光一閃。 趙維均也是這樣,做這個產品他沒有告訴任何人,經過長達四個多月的程式設計實現,趙維均得到了一款比較滿意的產品。 隨後他前去美國專利局進行註冊,產品名Yout。 可能註定著世界上要多一家偉大地公司。 那天龔定雨和幾個公司的技術專家也去專利局去申請兩項專利,由於總公司和香港分公司專利都在不斷增加,給了美國分公司很大的壓力,所以龔定雨是為了擺個姿態,就一起去了,結果趙維均正好排在他們後面。 得知龔定雨竟然是中國龍騰公司的人。 趙維均非常佩服,畢竟他用的很多計算機產品都是龍騰生產的,可以說龍騰是整個中國人地驕傲。
而龔定雨也不愧擁有鬼神之智,竟然一眼就瞧出了趙維均手上專利的價值,隨後就隆重邀請趙維均加盟了,能加盟自己心目中的大公司,趙維均其實也非常滿意,他博士也快畢業了,只剩下最後論文答辯,本來他最近就一直在猶豫要加入哪個公司。 不過當他聽說龍騰還有一個創業投資基金後。 他就覺的有點心動了。 他想要創業!
開始龔定雨見他婉拒還以為是給的條件不夠吸引人,所以咬咬牙一再的提高籌碼。 搞得那兩個技術人員都是臉一陣陣抽動。 不過當他得知趙維均是想自己創業時,失落的心情又好了一點點。
和Archie不同,由於有了網際網路,趙維均的Yout擁有世界上第一個Spider程式。 Spider指自動抓取網頁內容的機器人Robots,是搜尋引擎用來訪問Internet上網頁的自動程式。 spiders根據html地語法和格式,對讀取地頁面進行程式碼過濾,收入相關的文字內容。 爬蟲從一個或若干初始網頁地URL開始,獲得初始網頁上的URL,在抓取網頁的過程中,不斷從當前頁面上抽取新的URL放入佇列;直到滿足系統的一定停止條件。 有被爬蟲抓取的網頁將會被系統存貯,進行一定的分析、過濾,並建立索引,以便之後的查詢和檢索;對於聚焦爬蟲來說,這一過程所得到的分析結果還可能對以後的抓取過程給出反饋和指導。
可以說Yout已經具備了後世搜尋引擎的一些特徵了,雖然還比較毛糙,在切詞計算詞之間距離的方面做得還不是那麼完善,但是作為世界上第一個誕生的網頁搜尋器,Yout仍然具備光輝的前景。
沒能將這一專案握在自己手上的張國棟還有些遺憾,不過旋即又開心起來,畢竟這第一的榮譽好歹也是中國人自己的了,於是張國棟馬上自己炮製了一份PageRank演算法的論文寄給了英國自然雜誌。
歷史上PageRank(網頁級別)。 取自Google地創始人LarryPage。 它是Google排名運演算法則(排名公式)的一部分,是Google用於用來標識網頁的等級/重要性的一種方法,是Google用來衡量一個網站的好壞的唯一標準。 在揉合了諸如Title標識和Keywords標識等所有其它因素之後,Google透過PageRank來調整結果,使那些更具“等級/重要性”的網頁在搜尋結果中另網站排名獲得提升,從而提高搜尋結果地相關性和質量。
級別從1到10級,10級為滿分。 PR值越高說明該網頁越受歡迎(越重要)。 例如:一個PR值為1的網站表明這個網站不太具有流行度。 而PR值為7到10則表明這個網站非常受歡迎(或者說極其重要)。 一般PR值達到4,就算是一個不錯地網站了。 Google把自己的網站的PR值定到10。 這說明Google這個網站是非常受歡迎的,也可以說這個網站非常重要。
PageRank是Google演算法的重要內容。 2001年9月被授予美國專利,專利人是Google創始人之一拉里※#8226;佩奇(Larry Page)。 因此,PageRank裡的page不是指網頁,而是指佩奇,即這個等級方法是以佩奇來命名的。 而