(ps:切掉的新書已更新過章節內容不可能放這本,沒那麽喪心病狂,隻是搜索引擎名字引用了「靈境搜索」,因為想了幾個名字都覺得沒這個合適,現在人工智能和gpt那麽熱,正好2013年是生物識別技術和神經網絡開始爆發的年頭,本來ai的劇情就是從本書大綱挪過去,不在本書展開,新書嘎了,那邊也還沒展開,所以調整迴來,但已經更新了的章節內容是絕對不會發第二次。)
——
陳宇說到這裏順手關掉了會議大屏幕的ppt,轉而看向眾人說:「ai語言大模型的建構,後麵的一大工作重點就是數據投喂,底層算法架構雖然不是基於自然語言處理nlp,但毫無疑問也受其影響,接下來的數據投喂首先是把互聯網上已有的公開數據截止2012年之前產生的存量數據信息都給我爬一遍,國內國外的都要爬。」
這等於是白嫖全人類千百年來所積累的絕大部分知識。
一位與會的工程師詢問道:「每天大約要爬取多少數據量?」
陳宇言簡意賅:「5個pb左右。」
5個pb?
眾人都是一陣驚愕,5個pb的數據量換算一下就是500多萬gb的數據量,互聯網巨頭穀歌在2008年每天處理的數據量大約是20個pb左右,相當於是其四分之一的數據處理量。
這是一項大工程,而且超級消耗算力資源,換句話說就是燒錢啊,光是網費就要一大筆開支。
陳宇轉而說道:「此外,叟狗搜索開發新版本大更新,新版本推出之後更名為靈境搜索,等到用戶完全適應習慣了,叟狗搜索這個名字就棄掉。」
新版本上線初期,叟狗搜索的名字還是會保留的,用戶若是輸入叟狗搜索引擎的時候會跳轉顯示為靈境搜索,並且要有標記這是改名後的叟狗搜索。
告訴老用戶,叟狗還是那個叟狗,名字改了而已。
現在肯定不能直接用靈境搜索這個名字,那會丟掉好多老用戶,叟狗這個名字還是需要保持一段時間的,等靈境搜索的知名度和影響力覆蓋了叟狗就可以徹底放棄這個名字。
此時此刻,旁聽的方鴻翹著個二郎腿一言不發的聽著。
陳宇繼續道:「對於新版本靈境搜索,簡而言之就是,更簡潔、更精準、更舒適。靈境gpt成熟的那天便會接入靈境搜索,這是顛覆當代搜索引擎的一大重要倚仗。」
「也許顛覆百渡乃至穀歌的可能不是靈境搜索,但毫無疑問的是,ai技術的進步必然會改變人們訪問信息的方式。」
「而我所想象的方式是,瀏覽器的搜索欄被人ai取代,在我輸入時,ai會自動完成我的想法或問題,同時給我提供最佳答桉,這個答桉可能是一個網站或產品的鏈接,ai用舊的搜索引擎後端來收集相關信息和連接,然後為我匯總。」
「這種顛覆方式就在於像是讓一個專業的研究人員來做這項工作,隻不過ai會立刻完成,而人類需要花費數分鍾乃至更久才能完成。」
用戶自己去搜索內容的時候,還得去篩選、尋找,有時候非常耗時,而如果有ai的幫助就不一樣了,直接問ai即可,它馬上秒秒鍾就給用戶提供最佳答桉。
想要達到這種效果,那就需要超級龐大的算力資源,以及ai足夠「聰明」或者說能夠更加精準的理解人類的「語言」才能提供精準的答桉。
顯而易見,首先就需要讓ai把人類千百年來積累的知識都掌握了。
先去把那些數據爬一遍再說,這是能夠針對任何用戶提出的任何問題並快速給出精準答桉的前置條件之一。
此刻,陳宇看著眾人說道:「眾所周知,搜索廣告通過關鍵
詞引流,非常精準,轉化效果高。但作為搜索廣告本身,更依賴於用戶自發的搜索行為,導致其覆蓋麵存在一定的局限性。每月的搜索量雖然有增有減,但一般都是有限的。」
「搜索頁麵的訪問量占總訪問量的多少?」陳宇說著便看向其中一位與會的負責人,他是前叟狗的員工,現在已經來到公司總部,聽到陳宇詢問他立馬迴答:「占比大約在8~11%左右。」
聞言,陳宇點了下頭便接著道:「這就意味著,當你是經營一個冷門產品的時候,或者想要獲得更多的廣告覆蓋的時候,搜索廣告可能無法給予太多的幫助,所以我們需要個性化的展示廣告。」
「如果說搜索廣告是通過用戶的搜索行為決定什麽廣告會出現,那麽個性化的展示廣告則是「猜」用戶對什麽感興趣就推薦什麽廣告。」
「個性化推薦需要新技術的支持,除此之外用戶畫像也很重要,這就需要積累豐富的用戶數據,比如用戶經常搜索什麽、偏好等因子。」
「關於個性化推薦的技術支持後頭在說,這裏先說說個性化廣告展示的位置顯示問題。」
「新版本靈境搜索分左右兩個部分的詞條,左邊的詞條顯示搜索關鍵詞內容,右邊顯示「猜」用戶喜歡的個性化展示廣告,每頁最多含有5個廣告位,不足5個的則廣告將會在每頁都展示,超過5個的則按序循環出現。」
現在的那些搜索引擎,體驗是真的一言難盡,用戶想搜索到自己想找的內容要花費很多時間。
因為強行「猜」你喜歡把展示廣告甩你一臉,而且國內的搜索引擎還不標注這是廣告,點進去一看才發現是廣告。
至於被用戶詬病吐槽的競價排名就不用說了。
新版本的靈境搜索,按照陳宇的要求,搜索廣告和展示廣告必須分開,左邊都是用戶自己搜索生產的詞條,右邊上半部分是「猜」用戶喜歡的展示廣告內容。
至於右邊下半部分留白,暫時沒有任何內容,以後在這裏新增一個熱搜榜。
毫無疑問,減少用戶搜索內容的時間成本就是用戶體驗的提升,同時能夠更精準的顯示用戶要找的內容也是如此,當然這就是核心技術問題了。
除此之外,為了提高用戶體驗,陳宇也要求對靈境搜索的廣告主的廣告內容提高限製,摒棄諸多劣質廣告,支持優質的廣告內容。
這樣肯定會少賺很多錢,好多金主就直接沒了。
改版後的靈境搜索的盈利能力可能會比原叟狗搜索要大幅下滑。
此刻,與會旁聽不語的方鴻不禁自顧自地點頭,他猜的沒有錯,陳宇果然不是一時興起要做搜索引擎。
陳宇的目光長遠,不在乎這點蠅頭小利,這一點與方鴻不謀而合,這點小小利潤他就更不在乎了。
一個更牛、體驗更好的產品賺錢能力絕對不會差,隻不過前期需要忍受不賺錢乃至虧錢的局麵,這一點量化資本沒有問題,陳宇本身就能在資本市場賺到錢。
要是還不夠,這不是還有母公司群星資本,坐在旁邊一言不發的大boss會出手。
……
——
陳宇說到這裏順手關掉了會議大屏幕的ppt,轉而看向眾人說:「ai語言大模型的建構,後麵的一大工作重點就是數據投喂,底層算法架構雖然不是基於自然語言處理nlp,但毫無疑問也受其影響,接下來的數據投喂首先是把互聯網上已有的公開數據截止2012年之前產生的存量數據信息都給我爬一遍,國內國外的都要爬。」
這等於是白嫖全人類千百年來所積累的絕大部分知識。
一位與會的工程師詢問道:「每天大約要爬取多少數據量?」
陳宇言簡意賅:「5個pb左右。」
5個pb?
眾人都是一陣驚愕,5個pb的數據量換算一下就是500多萬gb的數據量,互聯網巨頭穀歌在2008年每天處理的數據量大約是20個pb左右,相當於是其四分之一的數據處理量。
這是一項大工程,而且超級消耗算力資源,換句話說就是燒錢啊,光是網費就要一大筆開支。
陳宇轉而說道:「此外,叟狗搜索開發新版本大更新,新版本推出之後更名為靈境搜索,等到用戶完全適應習慣了,叟狗搜索這個名字就棄掉。」
新版本上線初期,叟狗搜索的名字還是會保留的,用戶若是輸入叟狗搜索引擎的時候會跳轉顯示為靈境搜索,並且要有標記這是改名後的叟狗搜索。
告訴老用戶,叟狗還是那個叟狗,名字改了而已。
現在肯定不能直接用靈境搜索這個名字,那會丟掉好多老用戶,叟狗這個名字還是需要保持一段時間的,等靈境搜索的知名度和影響力覆蓋了叟狗就可以徹底放棄這個名字。
此時此刻,旁聽的方鴻翹著個二郎腿一言不發的聽著。
陳宇繼續道:「對於新版本靈境搜索,簡而言之就是,更簡潔、更精準、更舒適。靈境gpt成熟的那天便會接入靈境搜索,這是顛覆當代搜索引擎的一大重要倚仗。」
「也許顛覆百渡乃至穀歌的可能不是靈境搜索,但毫無疑問的是,ai技術的進步必然會改變人們訪問信息的方式。」
「而我所想象的方式是,瀏覽器的搜索欄被人ai取代,在我輸入時,ai會自動完成我的想法或問題,同時給我提供最佳答桉,這個答桉可能是一個網站或產品的鏈接,ai用舊的搜索引擎後端來收集相關信息和連接,然後為我匯總。」
「這種顛覆方式就在於像是讓一個專業的研究人員來做這項工作,隻不過ai會立刻完成,而人類需要花費數分鍾乃至更久才能完成。」
用戶自己去搜索內容的時候,還得去篩選、尋找,有時候非常耗時,而如果有ai的幫助就不一樣了,直接問ai即可,它馬上秒秒鍾就給用戶提供最佳答桉。
想要達到這種效果,那就需要超級龐大的算力資源,以及ai足夠「聰明」或者說能夠更加精準的理解人類的「語言」才能提供精準的答桉。
顯而易見,首先就需要讓ai把人類千百年來積累的知識都掌握了。
先去把那些數據爬一遍再說,這是能夠針對任何用戶提出的任何問題並快速給出精準答桉的前置條件之一。
此刻,陳宇看著眾人說道:「眾所周知,搜索廣告通過關鍵
詞引流,非常精準,轉化效果高。但作為搜索廣告本身,更依賴於用戶自發的搜索行為,導致其覆蓋麵存在一定的局限性。每月的搜索量雖然有增有減,但一般都是有限的。」
「搜索頁麵的訪問量占總訪問量的多少?」陳宇說著便看向其中一位與會的負責人,他是前叟狗的員工,現在已經來到公司總部,聽到陳宇詢問他立馬迴答:「占比大約在8~11%左右。」
聞言,陳宇點了下頭便接著道:「這就意味著,當你是經營一個冷門產品的時候,或者想要獲得更多的廣告覆蓋的時候,搜索廣告可能無法給予太多的幫助,所以我們需要個性化的展示廣告。」
「如果說搜索廣告是通過用戶的搜索行為決定什麽廣告會出現,那麽個性化的展示廣告則是「猜」用戶對什麽感興趣就推薦什麽廣告。」
「個性化推薦需要新技術的支持,除此之外用戶畫像也很重要,這就需要積累豐富的用戶數據,比如用戶經常搜索什麽、偏好等因子。」
「關於個性化推薦的技術支持後頭在說,這裏先說說個性化廣告展示的位置顯示問題。」
「新版本靈境搜索分左右兩個部分的詞條,左邊的詞條顯示搜索關鍵詞內容,右邊顯示「猜」用戶喜歡的個性化展示廣告,每頁最多含有5個廣告位,不足5個的則廣告將會在每頁都展示,超過5個的則按序循環出現。」
現在的那些搜索引擎,體驗是真的一言難盡,用戶想搜索到自己想找的內容要花費很多時間。
因為強行「猜」你喜歡把展示廣告甩你一臉,而且國內的搜索引擎還不標注這是廣告,點進去一看才發現是廣告。
至於被用戶詬病吐槽的競價排名就不用說了。
新版本的靈境搜索,按照陳宇的要求,搜索廣告和展示廣告必須分開,左邊都是用戶自己搜索生產的詞條,右邊上半部分是「猜」用戶喜歡的展示廣告內容。
至於右邊下半部分留白,暫時沒有任何內容,以後在這裏新增一個熱搜榜。
毫無疑問,減少用戶搜索內容的時間成本就是用戶體驗的提升,同時能夠更精準的顯示用戶要找的內容也是如此,當然這就是核心技術問題了。
除此之外,為了提高用戶體驗,陳宇也要求對靈境搜索的廣告主的廣告內容提高限製,摒棄諸多劣質廣告,支持優質的廣告內容。
這樣肯定會少賺很多錢,好多金主就直接沒了。
改版後的靈境搜索的盈利能力可能會比原叟狗搜索要大幅下滑。
此刻,與會旁聽不語的方鴻不禁自顧自地點頭,他猜的沒有錯,陳宇果然不是一時興起要做搜索引擎。
陳宇的目光長遠,不在乎這點蠅頭小利,這一點與方鴻不謀而合,這點小小利潤他就更不在乎了。
一個更牛、體驗更好的產品賺錢能力絕對不會差,隻不過前期需要忍受不賺錢乃至虧錢的局麵,這一點量化資本沒有問題,陳宇本身就能在資本市場賺到錢。
要是還不夠,這不是還有母公司群星資本,坐在旁邊一言不發的大boss會出手。
……