臨近下午一點,孟謙到了滬上浦東,這還是他重生後第一次來滬上,這個前世他也經常來的地方。


    滬上作為華夏的金融中心,是一張給世界看的名片。


    不過曾經的孟謙第一次來滬上是在07年的時候,2000年的滬上他還真沒見過。


    此時的浦東,已經開始聳立起高樓大廈,同時又存在大片的廠房和棚戶區,車子一路開過去,可以看到很多地方正在拆遷改造。


    “張總準備把分公司放在浦東麽?”到了目的地後,孟謙憑借記憶對比,如果沒看錯的話這裏應該是張江高科技園區。


    浦東四大重點開發區域中,世人相對熟知的應該就是金融中心陸家嘴和科技中心張江了。


    2000年的張江,領軍產業是電路、軟件以及生物醫藥。


    張樹新點頭表示肯定,“現在南方最有發展潛力的地方,毫無疑問就是深圳和滬上浦東,而張江高科技園區,則是科技的孵化寶地啊。”


    這個時候大家說到南方城市的發展潛力,尤其是科技發展,還沒人會想到杭城。


    來到張樹新租的地方,有五名男子正等在那邊,其中有兩人一看就是外籍男子。


    張樹新一一做了介紹,這兩名外籍男子一名來自ibm,一名來自穀歌,聽意思要麽是已經挖過來了,要麽就是打算挖過來的,兩人之前都是搜索引擎項目組的。


    另外三名華夏人,一人是瀛海威自家的技術總監,另外兩人都是從矽穀迴來的,一個畢業於斯坦福大學,曾任職於英特爾,一人畢業於哈佛,曾任職於甲骨文,都是人才。


    簡單的打了個招唿,大家就到會議室坐著,接下去是孟謙的表演時間,他今天,要展示他的搜索引擎核心技術。


    搜索引擎這個東西,需要用到網絡爬蟲技術、檢索排序技術、網頁處理技術、大數據處理技術、自然語言處理技術等,當然,2000年這個時候,還用不上自然語言處理技術,大數據處理也更後世的概念不太一樣。


    但說的簡單一點,其實核心就是一個東西,算法。


    因為每一個技術都離不開算法。


    “我不太清楚在座各位在搜索引擎方麵的建樹和理解,我隻能先按照我的節奏說下去,如果誰有問題可以隨時打斷我。”孟謙走到黑板前直入正題。


    “在我展示我的核心技術之前,我們先來看看當下的三大主流算法,白度的超鏈分析,穀歌的pagerank算法以及ibm的hits算法。


    幾乎所有人都覺得白度的超鏈分析是三個算法中最落後的,但有些事情我們還是要多角度的看一看,白度的超鏈分析在某種程度上可以算得上是奠定了搜索引擎的發展基礎。


    有一些聲音說穀歌其實是剽竊了白度的超鏈算法,畢竟李彥宏這個專利確實在穀歌之前,我們現在不去猜測真假,但這種說法體現了一個很重要的信號,其實不管是哪一家的算法,算法基礎其實都是一樣的。


    抓取網頁信息,然後用某種機製對這些網頁進行排序,當用戶輸入關鍵詞進行搜索時,根據關鍵詞匹配出按照機製進行排列的網頁。


    那麽白度輸在哪呢?關鍵就在於白度現在過於簡單的基於在某次搜索的所有結果中被其他網頁用超鏈接指向的越多的網頁就價值越高這種基礎排序方式。m.Ъimilou


    相比之下,穀歌的pagerank就多了兩件很重要的事情,第一件事情是,把a頁麵到b頁麵的鏈接解釋為a給b的投票行為,穀歌在這裏會同時考評a和b的等級從而形成新的等級。


    也就是每一個頁麵都有pr值,同時你的pr值會成為其他頁麵pr值的參考。


    然後不斷的重複計算每個頁麵的pr。假設給每個頁麵一個隨機pr值,那麽經過不斷的重複計算,這些頁麵的pr值會趨向於穩定,也就是收斂的狀態。


    至於hits,其理論基礎依然沒變,它最大的特點或者說改變就在它意識到pagerank算法平均的分布權值不符合鏈接的實際情況。


    所以hits算法中引入了另外一種網頁,稱為hub網頁,hub網頁是提供指向權威網頁鏈接集合的web網頁。


    所以使用hits的搜索結果會比其他兩者都更權威,但這個算法會大大增加計算負擔,對吧?”


    孟謙看了一眼ibm出來的哥們,對方愣了一下有點好像不確定的點了點頭。


    所以現在簡單總結一下,搜索引擎的算法基礎就是超鏈分析,算法的優劣勢就在於如何讓搜索結果更具有參考價值,讓用戶獲得更有效的信息。


    當然如果能直接理解用戶的需求然後幫他搜索他最想要的內容,這是最理想的搜索引擎狀態,但誰都知道這是不可能的。


    因此搜索引擎的好壞決定的就是同樣的關鍵詞下,你是否能讓相對更多的人獲得他們想要的內容。


    10個用戶用穀歌,5個人找到了自己想要的東西,如果用我們的搜索引擎,6個人找到了自己想要的東西,在這裏領域目前的技術環境下,我們就是更優秀的。


    那麽在這個理解基礎上,我接下來要給大家介紹的,就是我的搜索引擎算法,動態規則超鏈分析算法。


    動態規則超鏈分析算法有以下幾個變化。


    第一,剛才我們提到了,好的搜索引擎是要看在同一關鍵詞下誰的反饋結果更能滿足用戶需求,那麽當用戶在搜索某個東西的時候,從大概率來說,他想要看到的結果應該是與這個東西具有更垂直型相關的內容。


    舉個例子,客戶在搜索汽車的時候,不管他是想買車,還是想了解汽車知識,汽車類的專業網頁對他的幫助應該都是更大的。


    所以在我的算法中,對於指向某一個網站的鏈接,我首先會做垂直率評分,比如有現在有10個網站鏈接到了a,這10個網站都是汽車類網站和這10個網站都不是汽車類網站的結果,想必是肯定不一樣的。


    這裏還有一個小小的心理問題,那就是同行之間很少會做超鏈接,所以擁有更多垂直類網站鏈接的網站,它的專業性肯定比被亂七八糟網站鏈接的網站要更大概率靠譜。


    第二,建立關鍵詞庫熱度排序機製,現在的幾家搜索引擎企業都對網頁做了排序,而我對關鍵詞也做了排序,而且給關鍵詞做排序非常簡單,那就是看用戶的搜索量。


    就比如今天搜索汽車的用戶最多,那麽汽車的評分可能就是10分,這個時候,算法會分配更多的資源到汽車相關的信息上去,去抓取更多的優質網頁。


    這裏有四個好處,提升信息反饋速度、增加熱點反饋的時效性、節約計算機資源以及圍繞最終目的,讓更多使用我們搜索引擎的用戶得到有用信息。


    第三,用戶反饋機製,也就是跟蹤用戶的點擊情況和瀏覽情況。


    還是用汽車舉例,有100個用戶搜索汽車後,80個點擊了a網頁,a網頁的評級就會上升,如果有更多的用戶在a網頁的停留時間較長,a網頁的評級也會上升,如果有更多的用戶在a網頁上直接進行鏈接等操作,a網頁的評級也會上升。


    也就是說,在整個網頁評級係統中,加入用戶反饋分。


    第四,規律算法,在用戶的所有行為中尋找大概率行為,並將這些大概率反饋到人工,比如說60%搜索了汽車的用戶下一個搜索詞都是保險。


    這樣的一些規律我們是無法預測的,但我們可以利用算法進行大數據挖掘,迴饋的這些結果可以供人工分析部對一定的網頁進行評分,這個就是人工分。


    結合以上四點,在我的算法下,任何一個網頁同樣會有一個分數,我稱其為精度分。


    影響精度分的因子包括自己評分,鏈接的垂直網站評分,用戶反饋分,人工製定分以及外鏈影響等。”


    之後,孟謙淺嚐輒止的展示了各個分支的算法邏輯和算法推演公式。


    然而就在孟謙在說最後一個規律算法的過程中,來自ibm的傑爾夫突然起身驚唿,“ohmygad!artificialintelligence?!”


    孟謙轉過頭看了一眼對方,皺了皺眉。


    傑爾夫頓了頓,以為孟謙是沒聽懂,用奇怪的發音道,“臥槽!!!”


    ...


    而隨著傑爾夫的打斷,原本都沉浸在孟謙分享中的其他四名技術人員,眼神也都出現了明顯的變化...


    轟轟轟——!!


    接連幾團像素火焰爆發,將幾隻“神秘”的身形徹底淹沒,在火光中分解為漫天的像素,消散無蹤。


    林七夜用精神力將這一幕盡收眼底,對於衛冬的戒備放鬆了些許,他的精神力掃過前方,確認了幾隻從牆體中破出的“神秘”的位置後,迅速的選擇最優的突破路徑,繞開了它們的圍剿。


    “你真的不知道別的什麽線索了?”林七夜皺眉看向衛冬,“這些東西的數量太多了,如果再找不到出口,我們遲早會被耗死在這裏。”


    “這我真不知道……”衛冬苦笑著說道,“我隻知道這神社就是一處供奉妖魔的地方,那些石像都是日本本土的‘神秘’,不過我一開始以為這些隻是單純的石像而已,真的沒想到它們居然還能複蘇。”


    日本本土的“神秘”?


    林七夜若有所思。


    衛冬在進行日本“人圈”毀滅計劃之前,專門有研究過這方麵的內容,所以能認出這些是日本本土“神秘”,而林七夜在集訓營可沒有學的這麽細致,自然也就不會注意到這些細節。


    但當他聽到這句話的時候,腦中靈光一閃,像是想到了什麽。


    “你知道絡新婦嗎?”林七夜問道。


    “知道啊,也是日本妖魔傳說中的一種。”


    林七夜的雙眸頓時亮了起來。


    “你想到了什麽?”雨宮晴輝疑惑問道。


    “那句預言,‘絡新婦的石像底端,藏著離開死境的鑰匙’。”林七夜認真的說道,“這個地方沒有出口,後方還有大量的本土‘神秘’追殺,完全可以算的上是‘死境’,而這裏又有諸多石像複蘇……


    ‘絡新婦’,‘石像’,‘死境’三個要素都齊了,如果那句預言是指向這個情況的話,離開這裏的方法或許就藏在絡新婦的石像底端。”


    “前提是這個預言的結果是正確的。”雨宮晴輝提醒道。


    “我們沒有別的選擇。”


    雨宮晴輝陷入了沉默,片刻之後,他點了點頭,“那就賭一把。”


    “把絡新婦的樣貌特征告訴我,我試著找一下它。”林七夜一邊飛奔,一邊閉上了雙眼。


    在雨宮晴輝和衛冬的描述下,林七夜很快就找到了絡新婦石像的位置,那是一個半身蜘蛛,半身妖嬈女人的存在,此刻正要從牆壁中破出,身上到處都是密集的蛛網,一雙血紅色的眼眸正瞪大了在環顧著四周。


    隻是,她的位置與林七夜等人的逃離方向正好相反,也就是說林七夜想去到那裏,就必須迴頭殺穿那十幾隻正在窮追不舍的日本妖魔。


    當然,林七夜也可以直接【夜色閃爍】過去,但雨宮晴輝和衛冬不行。


    “在反方向。”林七夜深吸一口氣,“我們必須要闖過去。”


    雨宮晴輝將手放在了刀柄上,眸中閃過鄭重之色,雖然他無法使用禍津刀,但自身的刀術功底還在,不至於毫無戰鬥之力。


    而衛冬則從包中又掏出了一枚彈夾,塞進了手槍之中,同時左手握著一枚像素風的手雷,用牙咬下了保險,將銀環吐出,說道:


    “你開路,我們掩護你。”


    林七夜點了點頭,“好。”


    話音落下,三人同時停下腳步,迴頭麵對那十數隻咆哮衝來的日本妖魔,雙腳猛踏地麵,身形如箭般衝刺而出!


    林七夜將右手的直刀甩出,斬向為首的那隻妖魔,同時伸手在空中一招,一座龐大的召喚法陣再度張開。


    一抹白光閃過之後,一隻滿身繃帶的幼小身影落到了林七夜的肩膀上,抱住了他的脖子,微微歪頭。


    “木木,幹活了。”


    “嘿咻——!!”


    哢嚓嚓!!


    木木背後的繃帶飛快的鬆開,一枚枚鋥亮的掛載式導彈懸在它的身後,刺目的火光自導彈的尾端噴湧而出,唿嘯著飛向身後廊道中蜂擁而來的十數隻妖魔。


    “臥槽!”


    衛冬看到這一幕,瞪大了眼睛,脫口而出就是一句國粹,然後猛地捂住了自己的耳朵。


    轟——!!!


    三枚掛載式導彈在狹窄的空間內同時爆炸,巨大的衝擊力直接將周圍密密麻麻的房間撕成碎片,洶湧的火焰如浪潮般瞬間淹沒了那十幾隻妖魔的身影。


    與此同時,木木自林七夜的脖子一躍而下,身形急速膨脹成一座巨大的鋼鐵堡壘,橫在了三人之前,將熾熱的火浪隔絕在外。


    雨宮晴輝是親眼看過林七夜動用導彈的,但眼前的這一幕對衛冬來說,屬實有些超出理解範圍了……


    抬手就發射空對地掛載導彈?這生猛程度已經堪比會長了啊!


    待到火焰基本散去,鋼鐵堡壘如氣球般縮小,又變成了一個掛件般的木乃伊背在林七夜的身後,三道身影急速的穿行於火浪之間。


    幾道寒芒自火海中閃爍而出!


    即便木木的火力已經拉滿,但依然有幾隻妖魔自爆炸中存活,這些妖魔的故事傳播越是廣泛,力量便越強,此刻能夠從火光中衝出的妖魔,都不是像林七夜之前輕鬆秒掉的那些雜魚。


    一個手中提著青燈的幻影迎麵撞上林七夜,燈盞間的青光大作,這一刻林七夜周身突然彌漫出無盡的死氣,像是擁有生命般,瘋狂的鑽向林七夜的七竅。


    林七夜眉頭一皺,正欲有所動作,一聲槍鳴便從他的身邊響起。


    一枚像素子彈精準的擊中了幻影手中的青燈,將其直接化作漫天像素分解開來,環繞在林七夜周圍的死氣也隨之消散,林七夜轉頭看了一眼,衛冬正握著手槍,對著林七夜微微一笑。


    鏘——!


    刹那間,一抹刀芒自雨宮晴輝的腰間閃出,在火浪中劃過一道圓弧,斬下了那失去了青燈的幻影頭顱。


    緊接著,又是幾隻妖魔從不同方向的火焰中閃出,咆哮著衝向跑在最前麵的林七夜。


    “比人多……”


    林七夜喃喃自語,他伸出手,在空氣中一按,九道絢麗的魔法陣光輝在他的身前閃爍,一道道穿著深青色護工服的身影自魔法陣中閃出,向著那些妖魔攔截而去。

章節目錄

閱讀記錄

重寫科技格局所有內容均來自互聯網,繁體小說網隻為原作者江湖說夢人的小說進行宣傳。歡迎各位書友支持江湖說夢人並收藏重寫科技格局最新章節