128核聽起來很多,其實也就那麽迴事兒。(.)
不過是11個全誌a31soc的核心數罷了,人家畢竟是傳說中的“四核八顯12核心”!
說起來,gpu因為要在盡可能短時間內完成大量圖像渲染任務,更加重視並行計算能力,向來有配備大量並發管線的傳統。像是a31的八顯,說的就是其內部有兩顆sgx544gpu模塊,各有4個被稱為通用可拓展著色引擎us色2的渲染單元,結果本來隻是雙gpu的芯片就被奸商吹成了八顯一開始還有些遮掩,隻說是“八顯”不說“八核顯卡”,後來就徹底放開了。
而作為移動soc裏麵顯示性能最強的女idia,他們家最新的平板soc產品tegrak1,更是因此而變成了逆天的192核顯卡,似乎眼看著就要吊打桌麵顯卡了。
實際情況卻不是這樣,整個k1的熱設計功耗隻有5瓦,和桌麵顯卡暫時還沒有比較的可能,至少隻有96個cuda核心的雙敏大狂牛gt440-4gb就能將其輕鬆秒殺。
狂牛係列顯卡向來以看起來嚇人的超大顯存和不夠給力的中低端gpu而著稱於世,大顯存成了奸商欺騙消費者的利器,弱核心廉價低速dd顯存又成了硬件老鳥嘲笑廠家和小白用戶的武器。然而,隻有笑而不語的打金工作室老板才知道“好馬配好鞍,打金用狂牛”,這卡其實還是很牛的。
對於普通人來說,以gf108gpu的速度,正常情況下根本用不完4gb顯存。但是對於網遊工作室來說,這種低價大顯存顯卡簡直是為其量身定製的,他們並不在意畫質什麽的,反正為了流暢多開都是最低畫質的,這種時候這種用內存顆粒充當低速顯存的顯卡就顯得非常實用了,hold住十幾個甚至幾十個網遊客戶端毫無問題。
隻可惜,現在畢竟是免費網遊的天下,這些遊戲普遍有著經濟係統不健康道具貶值特別快的通病,以至於很多工作室選擇了轉行,改去玩計算力挖礦了。比起還需要安排小弟照看一二的網遊多開打金業務,時下流行的計算力挖礦就更加簡單了,隻要網絡和電力保持通暢,電腦開機就能給老板賺錢。
在國內最出名的兩大計算力挖礦品牌,一個是國外最流行的逼tcoin比特幣,另一個則是蜜蜂p幣,或者說蜜蜂糧票。和價格隨行就市的比特幣不同,蜜蜂p幣的價格一直保持穩中有降的趨勢,雖然賺不了大錢但也不會像比特幣那樣因為價格大起大落而倒黴賠錢,淪為炒家收割的對象。
不過無論是挖比特幣掙美元,還是跟著蜜蜂混賺點電費錢,都對計算機,尤其是gpu的計算能力有比較高的要求,尤其是比特幣挖礦,一開始都是各種中高端顯卡在挖,用到快廢就折價賣二手,很是坑了一批貪便宜半價買高端顯卡的玩家。[.超多好看小說]以狂牛一般偏弱的gpu,自然是沒有當“礦卡”的命。於是,以賣牛為生的雙敏,卒。
不管是a記的sp流處理器,還是n記的cuda通用並行計算單元,亦或是intel家xeonphi的x86核心,都不是單獨的“核”。論起結構的複雜度,完全不能和馬競的ipu相比較。畢竟前麵三者都要考慮量產成本的問題,太過複雜的電路設計會導致生產工序的冗長和低容錯率,自然是智者不為的。
實際上,馬競的ipu更像是威力加強版本的intel至強處理器。
intel下半年發布的,目前地球上最強大的量產cpu至強e5-2693擁有18個物理核心,每顆核心獨享32+32kb高速l1緩存和256kb的l2緩存,再集體共享“高達”45mb的l3緩存。
芯片設計師們當然知道馮諾依曼瓶頸,於是很早就開始給cpu配置了cache高速緩存,且一般使用sram靜態隨機存儲器,相比於內存條常用的dram動態存儲器,前者的優點是不需要設置刷新電路,讀寫速度快,缺點則是電路集成度低、成本高。
無論是高成本,還是低集成度,對於cpu來說都是要命的,因此也就不難解釋為什麽時至今日,cpu的l1/l2一二級緩存的容量依舊以kb為單位了,倒是使用dram的l3緩存,倒是可以做得大一點也不能太大,畢竟芯片麵積上每一毫米都是珍貴的。
當代u皇2699全部三-級緩存加起來也隻有50mb的容量,對於應用程序來說自然是不夠用的,當沒有在緩存中找到數據,係統還是得去內存甚至更慢的硬盤當中去搜尋,自然進一步拖慢了速度。
而這些問題對於馬競來說,基本上都不是問題了。第一代ipu芯片的具體型號是128-16/16,指的自然是128顆運算核心,每顆都被分配了16mb一級緩存,然後再集體共享2gb三-級緩存,即核均16mb。
之所以能夠做到這一點,一來是某人掌握黑科技,可以熟練地製造碳基芯片,唯一的問題就是“人工生產”導致產量太低,二來也是因為ipu的設計思路是全新的,不論是cpu還是gpu,以及動物神經係統,都是其參考借鑒的對象。比如顯卡領域目前研發熱點的hbm高帶寬顯存技術就被馬競借鑒了去。
既然基於內存都3d堆棧了,處理器部分更加不能繼續平麵化。實際上馬競在3d晶體管方麵比intel和三星還要激進,畢竟人家要考慮工藝實現問題,而馬競卻可以隨便開腦洞,失敗也不過是浪費幾天時間罷了。
和動物們的神經係統相比,ipu128個自帶“記憶”能力的計算核心並不算多,但是也基本夠用了。馬競之前有測試過不同數量的方案,總得來說核心越少、“內存”越少效果越差,反之則約好。不過隨著核心數的堆砌,以及“內存”的擴容,晶體管數目迅速增加,相應的芯片的厚度、麵積和發熱量也要增加,最終隻能折衷選擇了128-16/16這個方案。
人類大腦皮層平均厚度不到3毫米,但布滿褶皺溝迴,全部展開後總麵積高達2200平方厘米,其中據估計含有約140億個神經細胞。並且人的腦細胞數量每天還在減少,同樣據估計每天有10萬腦細胞陣亡,並且不會得到補充。好在“生物腦計算機”的自我糾錯能力可比電子計算機強多了,死亡的腦細胞會被其他細胞迅速代替,通常不會動不動給你一個藍屏死機。
顯然,神經元之間的複數連接起到了非常強大的冗餘備份能力,而且大腦作為一個活係統,雖然神經元很難增生,但卻可以建立新的突觸連接,以自動適應各種不同情況,通常說的腦子越用越靈便是這種情況,患者腦部的自發變化同樣也算。當然要是過度用腦,或者病情發展太快太嚴重,超過了大腦的自主調節範圍,還是會出現各種問題的。
馬競在設計ipu的立體晶體管構架時,就有在刻意模仿動物神經網絡,一來借助立體架構增加晶體管密度,二來也有構建芯片內“神經網絡”的意思。
這個網絡還非常簡單粗糙,根本不能和各大巨頭們研究人工智能時搭建的計算機神經網絡相比擬,不過馬競卻非常看好它的發展,畢竟芯片內通訊的速度和能耗都要優於計算機間通過網線進行通訊。
尤其是用於一些“簡單”場合時,效果比大型係統還要好。現在蜂園裏麵亂跑的動物們,已經可以做到“雙兔傍地走,安能辨我是假真”的地步,蜜蜂客服中心人工客服崗位也不增反減。至於其他的人工智能應用同樣有上佳表現,無論是語音識別合成、語義識別、機器翻譯,還是圖像識別合成、模糊計算、ai模擬等等方麵都有hold得住。
不過產量和能耗都很讓馬競蛋疼,一方麵產量太低隻能自用,另一方麵因為晶體管數量太多,整體的能耗也有些大,暫時還不能放到移動設備裏麵去。馬競倒不是急著把ipu塞進人造動物體內,跑去進而寵物搶市場,他真正在意的是把ipu用在下一代pt2以及小馬電動車、飛馬飛行器上麵去。
遊戲機當然是需要大量人工智能以及人機交互技術的,作為智能交通設備的後兩者同樣也需要更加機靈的腦子。不過可惜,現在的鋰離子電池容量不夠給力,把功耗超過100瓦的ipu裝進去以後續航會變得很坑爹。
前麵提到的地上最強cpu,至強e5-2693集成了約57億晶體管,核心麵積662毫米,熱設計功耗(tdp)為145瓦。
tdp是一個安全值,芯片廠家用此表示自家芯片最大發熱程度,從而給其他關聯廠商進行參考,避免散熱器不給力係統過熱乃至融化變形等意外的發生。所以tdp通常比芯片本身的最大功耗還要大一些,而如今主流芯片大多搭載有降頻節能技術,實際運行功耗可能隻有tdp的三分之一甚至更低。
因為碳管尺寸隻有不到5納米左右的緣故,馬競在ipu裏麵足足塞了大約200億個晶體管,不過即便如此每個核心單元平均的晶體管數目也才隻有一億六千萬,別說和intelx86cpu相比,就算是和arm移動處理器相比,也都是處在比較低的水平。比如最新的蘋果芯a8作為雙核cpu加四核gpu的組合,卻擁有20億晶體管數量,平均每個核心擁有超過3億晶體管。
當然這種比較實在過於粗略,現實中的手機處理器因為是soc的關係,不但要集成cpu、gpu以及很占地方的sram緩存,還要騰出很大麵積給諸如dsp、isp之類的專業處理器,用在cpugpu上的麵積其實頗為有限,整體來說核均晶體管數量自然不能像桌麵cpu一樣堆得那麽猛。
而且晶體管越多,必然的發熱也會越多。即便已經用上了電阻更小的碳晶體管,但先進材料帶來的功耗優勢還是被超大的晶體管數量給拉平了,這也是為什麽隻做到128核的一個原因。
繞是如此,當魏偉終於見到了期待已久的ipu,還是忍不住驚訝地反複問了句有沒有拿錯?
因為馬競拿給他的ipu,並不是他之前想象的一塊芯片,而是一塊帶有pci-e金手指的拓展卡簡單來說,就是一塊長得非常非常像高端顯卡的這麽一塊板磚。
占據ai卡絕大部分厚度的其實是鋁鎂合金製作的水冷散熱係統,不但內裏芯片被蓋住看不見,就連板載內存/閃存也看不見盡管已經有了總計高達4gb的芯片內內存,但是唯恐不夠用的馬競還是在板子上麵堆了8gb的dd內存和128gb的閃存芯片。
雖然全金屬外殼顯得頗有科技感和未來感,但是架不住顯卡廠商早這麽幹了,這塊ai卡的外觀又過分像顯卡,以至於魏偉拿在手裏看了幾下也索然無味將其棄之一旁了。
主要還是之前期待值刷得太高了,見到平平無奇的實物,自然難免有些失望。
當然,這也跟他不是卡巴基佬有關係,不然的話這會肯定會拉著跑分、拆機、拍照,然後拿去發帖爆料了。
是以,放下ai卡以後,他立即轉移了興趣,問起了另外一個話題:“這次總算要三馬齊聚了吧?”
“應該吧,”馬競無所謂地說道:“這有什麽好期待的,作為資深三季王我們就是去打醬油的。”手機用戶請訪問m.
不過是11個全誌a31soc的核心數罷了,人家畢竟是傳說中的“四核八顯12核心”!
說起來,gpu因為要在盡可能短時間內完成大量圖像渲染任務,更加重視並行計算能力,向來有配備大量並發管線的傳統。像是a31的八顯,說的就是其內部有兩顆sgx544gpu模塊,各有4個被稱為通用可拓展著色引擎us色2的渲染單元,結果本來隻是雙gpu的芯片就被奸商吹成了八顯一開始還有些遮掩,隻說是“八顯”不說“八核顯卡”,後來就徹底放開了。
而作為移動soc裏麵顯示性能最強的女idia,他們家最新的平板soc產品tegrak1,更是因此而變成了逆天的192核顯卡,似乎眼看著就要吊打桌麵顯卡了。
實際情況卻不是這樣,整個k1的熱設計功耗隻有5瓦,和桌麵顯卡暫時還沒有比較的可能,至少隻有96個cuda核心的雙敏大狂牛gt440-4gb就能將其輕鬆秒殺。
狂牛係列顯卡向來以看起來嚇人的超大顯存和不夠給力的中低端gpu而著稱於世,大顯存成了奸商欺騙消費者的利器,弱核心廉價低速dd顯存又成了硬件老鳥嘲笑廠家和小白用戶的武器。然而,隻有笑而不語的打金工作室老板才知道“好馬配好鞍,打金用狂牛”,這卡其實還是很牛的。
對於普通人來說,以gf108gpu的速度,正常情況下根本用不完4gb顯存。但是對於網遊工作室來說,這種低價大顯存顯卡簡直是為其量身定製的,他們並不在意畫質什麽的,反正為了流暢多開都是最低畫質的,這種時候這種用內存顆粒充當低速顯存的顯卡就顯得非常實用了,hold住十幾個甚至幾十個網遊客戶端毫無問題。
隻可惜,現在畢竟是免費網遊的天下,這些遊戲普遍有著經濟係統不健康道具貶值特別快的通病,以至於很多工作室選擇了轉行,改去玩計算力挖礦了。比起還需要安排小弟照看一二的網遊多開打金業務,時下流行的計算力挖礦就更加簡單了,隻要網絡和電力保持通暢,電腦開機就能給老板賺錢。
在國內最出名的兩大計算力挖礦品牌,一個是國外最流行的逼tcoin比特幣,另一個則是蜜蜂p幣,或者說蜜蜂糧票。和價格隨行就市的比特幣不同,蜜蜂p幣的價格一直保持穩中有降的趨勢,雖然賺不了大錢但也不會像比特幣那樣因為價格大起大落而倒黴賠錢,淪為炒家收割的對象。
不過無論是挖比特幣掙美元,還是跟著蜜蜂混賺點電費錢,都對計算機,尤其是gpu的計算能力有比較高的要求,尤其是比特幣挖礦,一開始都是各種中高端顯卡在挖,用到快廢就折價賣二手,很是坑了一批貪便宜半價買高端顯卡的玩家。[.超多好看小說]以狂牛一般偏弱的gpu,自然是沒有當“礦卡”的命。於是,以賣牛為生的雙敏,卒。
不管是a記的sp流處理器,還是n記的cuda通用並行計算單元,亦或是intel家xeonphi的x86核心,都不是單獨的“核”。論起結構的複雜度,完全不能和馬競的ipu相比較。畢竟前麵三者都要考慮量產成本的問題,太過複雜的電路設計會導致生產工序的冗長和低容錯率,自然是智者不為的。
實際上,馬競的ipu更像是威力加強版本的intel至強處理器。
intel下半年發布的,目前地球上最強大的量產cpu至強e5-2693擁有18個物理核心,每顆核心獨享32+32kb高速l1緩存和256kb的l2緩存,再集體共享“高達”45mb的l3緩存。
芯片設計師們當然知道馮諾依曼瓶頸,於是很早就開始給cpu配置了cache高速緩存,且一般使用sram靜態隨機存儲器,相比於內存條常用的dram動態存儲器,前者的優點是不需要設置刷新電路,讀寫速度快,缺點則是電路集成度低、成本高。
無論是高成本,還是低集成度,對於cpu來說都是要命的,因此也就不難解釋為什麽時至今日,cpu的l1/l2一二級緩存的容量依舊以kb為單位了,倒是使用dram的l3緩存,倒是可以做得大一點也不能太大,畢竟芯片麵積上每一毫米都是珍貴的。
當代u皇2699全部三-級緩存加起來也隻有50mb的容量,對於應用程序來說自然是不夠用的,當沒有在緩存中找到數據,係統還是得去內存甚至更慢的硬盤當中去搜尋,自然進一步拖慢了速度。
而這些問題對於馬競來說,基本上都不是問題了。第一代ipu芯片的具體型號是128-16/16,指的自然是128顆運算核心,每顆都被分配了16mb一級緩存,然後再集體共享2gb三-級緩存,即核均16mb。
之所以能夠做到這一點,一來是某人掌握黑科技,可以熟練地製造碳基芯片,唯一的問題就是“人工生產”導致產量太低,二來也是因為ipu的設計思路是全新的,不論是cpu還是gpu,以及動物神經係統,都是其參考借鑒的對象。比如顯卡領域目前研發熱點的hbm高帶寬顯存技術就被馬競借鑒了去。
既然基於內存都3d堆棧了,處理器部分更加不能繼續平麵化。實際上馬競在3d晶體管方麵比intel和三星還要激進,畢竟人家要考慮工藝實現問題,而馬競卻可以隨便開腦洞,失敗也不過是浪費幾天時間罷了。
和動物們的神經係統相比,ipu128個自帶“記憶”能力的計算核心並不算多,但是也基本夠用了。馬競之前有測試過不同數量的方案,總得來說核心越少、“內存”越少效果越差,反之則約好。不過隨著核心數的堆砌,以及“內存”的擴容,晶體管數目迅速增加,相應的芯片的厚度、麵積和發熱量也要增加,最終隻能折衷選擇了128-16/16這個方案。
人類大腦皮層平均厚度不到3毫米,但布滿褶皺溝迴,全部展開後總麵積高達2200平方厘米,其中據估計含有約140億個神經細胞。並且人的腦細胞數量每天還在減少,同樣據估計每天有10萬腦細胞陣亡,並且不會得到補充。好在“生物腦計算機”的自我糾錯能力可比電子計算機強多了,死亡的腦細胞會被其他細胞迅速代替,通常不會動不動給你一個藍屏死機。
顯然,神經元之間的複數連接起到了非常強大的冗餘備份能力,而且大腦作為一個活係統,雖然神經元很難增生,但卻可以建立新的突觸連接,以自動適應各種不同情況,通常說的腦子越用越靈便是這種情況,患者腦部的自發變化同樣也算。當然要是過度用腦,或者病情發展太快太嚴重,超過了大腦的自主調節範圍,還是會出現各種問題的。
馬競在設計ipu的立體晶體管構架時,就有在刻意模仿動物神經網絡,一來借助立體架構增加晶體管密度,二來也有構建芯片內“神經網絡”的意思。
這個網絡還非常簡單粗糙,根本不能和各大巨頭們研究人工智能時搭建的計算機神經網絡相比擬,不過馬競卻非常看好它的發展,畢竟芯片內通訊的速度和能耗都要優於計算機間通過網線進行通訊。
尤其是用於一些“簡單”場合時,效果比大型係統還要好。現在蜂園裏麵亂跑的動物們,已經可以做到“雙兔傍地走,安能辨我是假真”的地步,蜜蜂客服中心人工客服崗位也不增反減。至於其他的人工智能應用同樣有上佳表現,無論是語音識別合成、語義識別、機器翻譯,還是圖像識別合成、模糊計算、ai模擬等等方麵都有hold得住。
不過產量和能耗都很讓馬競蛋疼,一方麵產量太低隻能自用,另一方麵因為晶體管數量太多,整體的能耗也有些大,暫時還不能放到移動設備裏麵去。馬競倒不是急著把ipu塞進人造動物體內,跑去進而寵物搶市場,他真正在意的是把ipu用在下一代pt2以及小馬電動車、飛馬飛行器上麵去。
遊戲機當然是需要大量人工智能以及人機交互技術的,作為智能交通設備的後兩者同樣也需要更加機靈的腦子。不過可惜,現在的鋰離子電池容量不夠給力,把功耗超過100瓦的ipu裝進去以後續航會變得很坑爹。
前麵提到的地上最強cpu,至強e5-2693集成了約57億晶體管,核心麵積662毫米,熱設計功耗(tdp)為145瓦。
tdp是一個安全值,芯片廠家用此表示自家芯片最大發熱程度,從而給其他關聯廠商進行參考,避免散熱器不給力係統過熱乃至融化變形等意外的發生。所以tdp通常比芯片本身的最大功耗還要大一些,而如今主流芯片大多搭載有降頻節能技術,實際運行功耗可能隻有tdp的三分之一甚至更低。
因為碳管尺寸隻有不到5納米左右的緣故,馬競在ipu裏麵足足塞了大約200億個晶體管,不過即便如此每個核心單元平均的晶體管數目也才隻有一億六千萬,別說和intelx86cpu相比,就算是和arm移動處理器相比,也都是處在比較低的水平。比如最新的蘋果芯a8作為雙核cpu加四核gpu的組合,卻擁有20億晶體管數量,平均每個核心擁有超過3億晶體管。
當然這種比較實在過於粗略,現實中的手機處理器因為是soc的關係,不但要集成cpu、gpu以及很占地方的sram緩存,還要騰出很大麵積給諸如dsp、isp之類的專業處理器,用在cpugpu上的麵積其實頗為有限,整體來說核均晶體管數量自然不能像桌麵cpu一樣堆得那麽猛。
而且晶體管越多,必然的發熱也會越多。即便已經用上了電阻更小的碳晶體管,但先進材料帶來的功耗優勢還是被超大的晶體管數量給拉平了,這也是為什麽隻做到128核的一個原因。
繞是如此,當魏偉終於見到了期待已久的ipu,還是忍不住驚訝地反複問了句有沒有拿錯?
因為馬競拿給他的ipu,並不是他之前想象的一塊芯片,而是一塊帶有pci-e金手指的拓展卡簡單來說,就是一塊長得非常非常像高端顯卡的這麽一塊板磚。
占據ai卡絕大部分厚度的其實是鋁鎂合金製作的水冷散熱係統,不但內裏芯片被蓋住看不見,就連板載內存/閃存也看不見盡管已經有了總計高達4gb的芯片內內存,但是唯恐不夠用的馬競還是在板子上麵堆了8gb的dd內存和128gb的閃存芯片。
雖然全金屬外殼顯得頗有科技感和未來感,但是架不住顯卡廠商早這麽幹了,這塊ai卡的外觀又過分像顯卡,以至於魏偉拿在手裏看了幾下也索然無味將其棄之一旁了。
主要還是之前期待值刷得太高了,見到平平無奇的實物,自然難免有些失望。
當然,這也跟他不是卡巴基佬有關係,不然的話這會肯定會拉著跑分、拆機、拍照,然後拿去發帖爆料了。
是以,放下ai卡以後,他立即轉移了興趣,問起了另外一個話題:“這次總算要三馬齊聚了吧?”
“應該吧,”馬競無所謂地說道:“這有什麽好期待的,作為資深三季王我們就是去打醬油的。”手機用戶請訪問m.