百度是全球最大的中文搜索引擎、最大的中文網(wǎng)站,近年來百度在技術(shù)研發(fā)方面的成就顯著,尤其是AI研發(fā)方面,我們在之前的文章中談到了,在2016年至2018年的3年,在日經(jīng)人工智能(AI)專利申請50強排行榜中,百度以1522件的申請量占據(jù)首位,排名從此前的第11位迅速躍升至第4位,詳情可查看《中國人工智能技術(shù)專利申請排名大幅增長趕超美國,百度名列第四》,自從2016年6月到現(xiàn)在,李彥宏在公開場合提到“AI”這個關(guān)鍵詞不下500次,他始終堅信AI將改變世界,他是中國的“AI先生”。
關(guān)于百度在人工智能方面的研發(fā)成就太多了,不過今天賽貝小編不是要聊百度在AI方面的成就,而且聊一聊百度最核心的技術(shù)領(lǐng)域——搜索引擎。
百度有超過千億的中文網(wǎng)頁數(shù)據(jù)庫,可以瞬間找到相關(guān)的搜索結(jié)果,它最核心的技術(shù)就是“超鏈分析技術(shù)”,這項技術(shù)是由百度創(chuàng)始人李彥宏發(fā)明的并于1997年在美國申請了專利,今天賽貝小編就跟大家聊一聊這項搜索引擎核心基礎(chǔ)的專利技術(shù)。
要了解此次專利,那么我們就必須先回過頭去看李彥宏當(dāng)時所申請的“超鏈分析”,當(dāng)時28歲的李彥宏還在道瓊斯擔(dān)任高級技術(shù)參謀,當(dāng)時遇到了《華爾街日報》網(wǎng)絡(luò)版的實施信息呈現(xiàn)問題,當(dāng)時網(wǎng)站每天約有15萬條的內(nèi)容產(chǎn)生,用戶很難檢索到自己想要的內(nèi)容,而此時的李彥宏為了應(yīng)對該問題,開始著手對搜索結(jié)果進(jìn)行算法優(yōu)化。
李彥宏在思考如何解決搜索正確性技術(shù)時,赫然想到,自己在北大所學(xué)的科技論文索引方法。“科學(xué)論文通過索引被引用次數(shù)的多寡來確定一篇論文的好壞,超鏈就是對頁面的引用。”李彥宏回憶,“超鏈上的文字就是對所鏈接網(wǎng)頁的描述,通過這個描述可以計算出超鏈和頁面之間的相關(guān)度?!?/p>
這讓李彥宏非常高興,他立刻反復(fù)論證這一理論并收拾整頓成稿,1996年正式提出“超鏈分析”概念并發(fā)表了相關(guān)文章,1997年2月申請專利——“超鏈分析技術(shù)”(Hypertext document retrieval system and method,專利號5,920,859)。超鏈分析技術(shù)的發(fā)明,一改互聯(lián)網(wǎng)搜索雜亂無章、信息冗余的局面,使搜索效果大幅晉升。隨后被Infoseek搜索引擎的CEO看中,李彥宏正式進(jìn)入搜索引擎行業(yè)。
也就是在1998年,Infoseek被迪士尼控股,被迫轉(zhuǎn)型成了門戶網(wǎng)站。而李彥宏也在此期間發(fā)表大量關(guān)于搜索引擎技術(shù)的文章,并申請了大量相關(guān)專利有了足夠的積累,再加上谷歌的成功,李彥宏終于決定創(chuàng)業(yè),并在后來有了我們所知道的那些百度的故事。
李彥宏在發(fā)明超鏈分析技術(shù)之后,對未來的其他語種的搜索引擎做過預(yù)言,最后證明李彥宏說的非常正確。實際上當(dāng)年谷歌創(chuàng)始人佩奇和布林就受到過李彥宏超鏈分析的啟發(fā),當(dāng)年李彥宏去澳大利亞做技術(shù)前瞻分享的時候,其中谷歌的創(chuàng)始人佩奇和布林就在當(dāng)時的現(xiàn)場,后來在同一年10月份谷歌就開始上線,之后也是這一年谷歌申請了pherank的技術(shù)專利,但是美國專利商標(biāo)局認(rèn)為這個技術(shù)和李彥宏的申請的超鏈分析專利非常相似,后來在2001年的時候才給了他專利申請。所以我們也可以說谷歌搜索引擎很大程度上也借鑒了李彥宏的“超鏈分析技術(shù)”。
對于李彥宏申請的這項“超鏈分析技術(shù)”專利,美國駐華大使駱家輝曾給與過高度評價,2012年3月30日,駱家輝在交流中特別提到李彥宏的這項專利,在他看來,"這項技術(shù)專利具有象征意義,象征著知識或者智慧的進(jìn)程、創(chuàng)造,最終促成了一個新產(chǎn)業(yè)的出現(xiàn)。"
該專利首次提出了與傳統(tǒng)信息檢索系統(tǒng)不同的基于鏈接的排名方法,并奠定了當(dāng)代搜索引擎技術(shù)基礎(chǔ),而李彥宏是這項專利的唯一持有人。目前,該技術(shù)已為世界各大搜索引擎普遍采用。也正因為此,駱家輝表示:"百度不僅僅是一個公司,它是革命性的,它真正改變了人們的生活。"