百度是全球最大的中文搜索引擎、最大的中文網(wǎng)站,近年來百度在技術研發(fā)方面的成就顯著,尤其是AI研發(fā)方面,我們在之前的文章中談到了,在2016年至2018年的3年,在日經(jīng)人工智能(AI)專利申請50強排行榜中,百度以1522件的申請量占據(jù)首位,排名從此前的第11位迅速躍升至第4位,詳情可查看《中國人工智能技術專利申請排名大幅增長趕超美國,百度名列第四》,自從2016年6月到現(xiàn)在,李彥宏在公開場合提到“AI”這個關鍵詞不下500次,他始終堅信AI將改變世界,他是中國的“AI先生”。
關于百度在人工智能方面的研發(fā)成就太多了,不過今天賽貝小編不是要聊百度在AI方面的成就,而且聊一聊百度最核心的技術領域——搜索引擎。
百度有超過千億的中文網(wǎng)頁數(shù)據(jù)庫,可以瞬間找到相關的搜索結果,它最核心的技術就是“超鏈分析技術”,這項技術是由百度創(chuàng)始人李彥宏發(fā)明的并于1997年在美國申請了專利,今天賽貝小編就跟大家聊一聊這項搜索引擎核心基礎的專利技術。
要了解此次專利,那么我們就必須先回過頭去看李彥宏當時所申請的“超鏈分析”,當時28歲的李彥宏還在道瓊斯擔任高級技術參謀,當時遇到了《華爾街日報》網(wǎng)絡版的實施信息呈現(xiàn)問題,當時網(wǎng)站每天約有15萬條的內(nèi)容產(chǎn)生,用戶很難檢索到自己想要的內(nèi)容,而此時的李彥宏為了應對該問題,開始著手對搜索結果進行算法優(yōu)化。
李彥宏在思考如何解決搜索正確性技術時,赫然想到,自己在北大所學的科技論文索引方法?!翱茖W論文通過索引被引用次數(shù)的多寡來確定一篇論文的好壞,超鏈就是對頁面的引用。”李彥宏回憶,“超鏈上的文字就是對所鏈接網(wǎng)頁的描述,通過這個描述可以計算出超鏈和頁面之間的相關度?!?/p>
這讓李彥宏非常高興,他立刻反復論證這一理論并收拾整頓成稿,1996年正式提出“超鏈分析”概念并發(fā)表了相關文章,1997年2月申請專利——“超鏈分析技術”(Hypertext document retrieval system and method,專利號5,920,859)。超鏈分析技術的發(fā)明,一改互聯(lián)網(wǎng)搜索雜亂無章、信息冗余的局面,使搜索效果大幅晉升。隨后被Infoseek搜索引擎的CEO看中,李彥宏正式進入搜索引擎行業(yè)。
也就是在1998年,Infoseek被迪士尼控股,被迫轉型成了門戶網(wǎng)站。而李彥宏也在此期間發(fā)表大量關于搜索引擎技術的文章,并申請了大量相關專利有了足夠的積累,再加上谷歌的成功,李彥宏終于決定創(chuàng)業(yè),并在后來有了我們所知道的那些百度的故事。
李彥宏在發(fā)明超鏈分析技術之后,對未來的其他語種的搜索引擎做過預言,最后證明李彥宏說的非常正確。實際上當年谷歌創(chuàng)始人佩奇和布林就受到過李彥宏超鏈分析的啟發(fā),當年李彥宏去澳大利亞做技術前瞻分享的時候,其中谷歌的創(chuàng)始人佩奇和布林就在當時的現(xiàn)場,后來在同一年10月份谷歌就開始上線,之后也是這一年谷歌申請了pherank的技術專利,但是美國專利商標局認為這個技術和李彥宏的申請的超鏈分析專利非常相似,后來在2001年的時候才給了他專利申請。所以我們也可以說谷歌搜索引擎很大程度上也借鑒了李彥宏的“超鏈分析技術”。
對于李彥宏申請的這項“超鏈分析技術”專利,美國駐華大使駱家輝曾給與過高度評價,2012年3月30日,駱家輝在交流中特別提到李彥宏的這項專利,在他看來,"這項技術專利具有象征意義,象征著知識或者智慧的進程、創(chuàng)造,最終促成了一個新產(chǎn)業(yè)的出現(xiàn)。"
該專利首次提出了與傳統(tǒng)信息檢索系統(tǒng)不同的基于鏈接的排名方法,并奠定了當代搜索引擎技術基礎,而李彥宏是這項專利的唯一持有人。目前,該技術已為世界各大搜索引擎普遍采用。也正因為此,駱家輝表示:"百度不僅僅是一個公司,它是革命性的,它真正改變了人們的生活。"