進行儘可能全面的目錄蒐集,目錄的提供完全是商戶的自願行為,而且被選中參與這項測試專案的商戶也不是很多。因此這個目錄測試版本並沒有在海量掃描方面為谷歌提供太多的經驗。
2002年,當佩奇和布林開始不斷地談論運用Google瀏覽書籍的時候,他們兩個曾經做過一個實驗來測試瀏覽一本書究竟要花多少時間。這個實驗後來在很多場合都被反覆提到過,他們按照節拍器發出的節奏將一本300頁的書逐頁地翻過,然後得出了一個二人認為雖然簡單但卻足夠有用的資料:掃描300頁的書需要花費的時間是40分鐘。透過這個實驗,他們至少有理由認為他們能夠對掃描成百上千萬冊的書所需要的費用進行大致的測算,甚至能夠得出一個在想像力範圍內的具體費用。
儘管谷歌一直對這個小實驗津津樂道,並且聲稱正是這次測試的結果引發了公司的傳奇###發展,但這一說法是否可信還有待商榷。因為在當時的情形下,谷歌是不可能向外界透露任何有關如何獲取書頁影像的細節的。不過一個不爭的事實是,透過這次試驗讓兩位創始人意識到利用掃描器對裝訂好的書本進行人工逐頁掃描耗費的時間巨大,而使用數碼相機則無疑是個更省時省力的辦法——只需要零點幾秒的時間就可以獲取書本當前頁上的影像。數年之後的2007年,當負責監督Google圖書搜尋專案的產品管理部主管亞當·斯密斯(Adam Smith)被問及到底是使用掃描器還是數碼照相機來對書頁進行處理時,他反問道:“有什麼區別嗎?”
事實上,雖然二者的差別看似不大,但是前者因為既浪費時間又浪費金錢而不具有可行###,後者則完全避免了這種情況的出現。2002年,拉里·佩奇訪問了他的母校密歇根大學並且會見了學校官員。他告訴校長瑪麗·蘇·科曼(Mary Sue Coleman)女士谷歌能夠在6年之內將密歇根大學圖書館藏有的700萬冊書全部掃描完畢。而在當時,密歇根大學曾預計如果利用其現有資源進行這項工作的話,要花上1000年的時間才能夠完成。
作為一傢俬人持股公司,谷歌的股票當時還尚未上市交易,但其股票的持有者,包括它的創始人、風險資本投資人以及早期的員工都一直共同致力於追求企業的利潤。谷歌高層並沒有將書籍數字化看作是一個慈善專案,他們不考慮向非營利###組織——比如在當時已經開始了圖書數字化的密歇根大學——提供資金援助。谷歌關注的是利用Google完成所有書籍數字化的可行###,以及如何使用數碼複製達到自己的目的。即使Google圖書搜尋不能夠立即產生效益,至少可以預計,該專案的收益將會與谷歌為完成這一專案所付出的巨大投資相稱。毋庸置疑,只需要透過瀏覽網頁就能夠搜尋到書籍的內容,這種前景是多麼地令人###。但是當谷歌公開推出這一專案時,也有不少冷眼旁觀者對於由這樣一傢俬人公司將全世界的書籍資訊收集起來並透過建立詞條來賺錢的做法深表不滿。
“登月”計劃(3)
然而不管怎麼說,谷歌的“登月”計劃與美國太空總署的月球旅行還是有很大差別的:沒有一個競爭對手願意與它在圖書搜尋計劃上展開競爭。在20世紀60年代,空間探索成為冷戰的延伸,美國和前蘇聯在很多科技領域裡勢均力敵。然而,在2002年和2003年,在谷歌神不知鬼不覺地開始其圖書搜尋計劃的時候,沒有其他的公司願意同它進行一對一的較量——完成這項計劃所需要的大量資金足以使其他公司望而卻步。
谷歌在這一計劃上佔盡先機不單是因為它擁有雄厚的財力,更是緣於那些曾經試圖將書籍數字化的公司在這條路上沒有走得很遠。最早承擔這個艱鉅任務的是由邁克爾·哈特(Michael Hart)在1971年開始的“古登堡計劃”(Project Gutenberg)。那時掃描器和個人電腦還沒有出現,所謂的數字化只是將鍵盤連線到擺在伊利諾伊大學的材料研究實驗室裡的大型電腦主機上進行資料存取。哈特向一些接觸過電腦而且有空餘時間的志願者尋求幫助,他們願意將公共領域內的重要文學作品的全文錄入電腦(他們用不停地打字的手指詮釋著“數字”對於“數字化”的意義)。隨後,個人電腦的出現使這些志願者的工作速度得以大幅度提高。
“古登堡計劃”一直迴避所謂的“權威版本”,認為“在一般讀者眼中達到%的準確度的收錄文章才是最受歡迎的”。這個計劃沒有辦法很好地涵蓋全世界的文學作品:到2002年,該