午夜视频在线网站,日韩视频精品在线,中文字幕精品一区二区三区在线,在线播放精品,1024你懂我懂的旧版人,欧美日韩一级黄色片,一区二区三区在线观看视频

分享

【企業(yè)之道】中國(guó)在xPU領(lǐng)域有多少勝算?(上篇)——產(chǎn)業(yè)研究系列之七

 藍(lán)海思享匯 2020-11-17

文/李方

xPU又是什么鬼?
你聽(tīng)說(shuō)過(guò)CxO么?
就是企業(yè)里各種高管職位
CEO COO CTO CMO CFO 
......
好吧
CPU GPU TPU NPU IPU……
就是各種芯片的稱謂
筆者在年初“產(chǎn)業(yè)研究系列”頭篇
《中國(guó)芯之痛何時(shí)解?(&
就談到芯片
可以把這篇看作是那篇的姊妹篇吧

那篇主要說(shuō)到
中國(guó)企業(yè)在5G芯片方面
有了崛起的機(jī)會(huì)
那這篇就要討論
中國(guó)企業(yè)在AI芯片領(lǐng)域
有沒(méi)有機(jī)會(huì)?

要想談清楚AI芯片
就不得不從通用芯片說(shuō)起
據(jù)說(shuō)每過(guò)18天
芯片領(lǐng)域就會(huì)多出一個(gè)xPU
直到26個(gè)字母被用完
當(dāng)26個(gè)字母用完后
還會(huì)出現(xiàn)xxPU、xxxPU……
先不管那么多
目前xPU領(lǐng)域
主要是各種AI芯片的競(jìng)爭(zhēng)
我們先選取競(jìng)爭(zhēng)最激烈的
幾個(gè)AI芯片來(lái)談
 
我們找出瓜眾們?cè)诖祟I(lǐng)域最關(guān)心的幾個(gè)問(wèn)題來(lái)談:
  • 集成電路芯片演變歷史概述

  • 目前幾種主要AI芯片介紹GPU TPU NPU IPU

  • 寒武紀(jì)芯片是中國(guó)AI芯片的希望所在嗎?

  • 中國(guó)在AI芯片領(lǐng)域整體發(fā)展態(tài)勢(shì)



集成電路芯片演變歷史概述


要把這段歷史說(shuō)清楚
還得從世界上第一臺(tái)電子計(jì)算機(jī)說(shuō)起
1946年
世界上第一臺(tái)電子計(jì)算機(jī)ENIAC
在美國(guó)誕生
這個(gè)龐然大物重達(dá)30余噸
占地170平方米
由18000只電子管
組成核心計(jì)算單元
當(dāng)然它的功能
比現(xiàn)在一個(gè)最普通的手機(jī)
差得很遠(yuǎn)
但不要忘了
這是世界上第一次
用機(jī)器代替人來(lái)計(jì)算
1951年
世界上第一臺(tái)商用計(jì)算機(jī)投入實(shí)用
這臺(tái)通用自動(dòng)計(jì)算機(jī)
交付給了美國(guó)人口調(diào)查局使用
1955年
“晶體管之父”肖克利離開了貝爾實(shí)驗(yàn)室
回到硅谷圣克拉拉
建立了自己的公司
這是世界上第一個(gè)
真正研發(fā)半導(dǎo)體的公司
肖克利實(shí)驗(yàn)室
為硅谷引來(lái)了大批技術(shù)人員
使硅谷取代了美國(guó)東部
成為了美國(guó)半導(dǎo)體(芯片)產(chǎn)業(yè)中心
1957年
克雷(Crey,1923-2005)
設(shè)計(jì)了全晶體管超級(jí)計(jì)算機(jī)
之后的20年
主流計(jì)算機(jī)
都是以晶體管集成電路為核心組成的
所以克雷被譽(yù)為超級(jí)計(jì)算機(jī)之父
 
1957年10月1日
Robert Noyce 
率領(lǐng)著“8叛逆”
離開了肖克利實(shí)驗(yàn)室
創(chuàng)建了著名的
“仙童半導(dǎo)體”公司
這是硅谷歷史上
一個(gè)里程碑事件

1959年
仙童半導(dǎo)體
首次以晶體管集成電路技術(shù)
在商業(yè)上大力推廣
之后若干年
一大批著名芯片廠商
像Intel、AMD、美國(guó)國(guó)家半導(dǎo)體等
都是由仙童半導(dǎo)體出來(lái)的人創(chuàng)立的

1962年
世界上第一塊
基于硅片的集成電路制造成功
這是劃時(shí)代的歷史事件
計(jì)算機(jī)芯片進(jìn)入了
硅芯片時(shí)代

1966年
美國(guó)貝爾實(shí)驗(yàn)室
使用完善的硅外延平面工藝
制造出第一塊
公認(rèn)的大規(guī)模集成電路
 
1968年
Robert Noyce放棄了他創(chuàng)立的
仙童半導(dǎo)體
與Gordon Moore(提出摩爾定律的)
一起創(chuàng)立了Intel
1970年
Intel推出第一片DRAM存儲(chǔ)器

1971年
Intel推出SRAM和EPROM
但此時(shí)
日本的硅芯片產(chǎn)業(yè)突然崛起
同樣也能大規(guī)模生產(chǎn)DRAM等存儲(chǔ)器
并且成本比Intel的有居大優(yōu)勢(shì)
日本芯片產(chǎn)業(yè)的崛起
給Intel造成了巨大壓力
Intel頻臨破產(chǎn)
此時(shí)就發(fā)生了那段最經(jīng)典的
Intel轉(zhuǎn)型的歷史故事
一天
兩位Intel領(lǐng)導(dǎo)人
董事長(zhǎng)摩爾、總裁格魯夫
在一起討論經(jīng)營(yíng)困境
面對(duì)已經(jīng)被對(duì)手逼到死角的絕境
二人也是面面相覷
......
格魯夫突然問(wèn)摩爾:
“摩爾,如果我們下了臺(tái),
你認(rèn)為新進(jìn)來(lái)這個(gè)家伙
會(huì)采取什么行動(dòng)?” 
摩爾猶豫了一下,
說(shuō):
“他會(huì)完全放棄存儲(chǔ)器的生意?!?nbsp;
格魯夫目不轉(zhuǎn)睛地盯著摩爾:
“既然這樣,
你我為什么不走出這扇門,
然后再進(jìn)來(lái)
自己動(dòng)手這樣干呢?”
隨后他們作出了重大決策:
放棄存儲(chǔ)器業(yè)務(wù)
開始研發(fā)微處理器!
很快
他們就研發(fā)出來(lái)第一款
基于硅集成電路的微處理器4004
當(dāng)然
面對(duì)只有二進(jìn)制4位的微處理器
Intel也不知道有用沒(méi)用
能否改變他們要關(guān)門的命運(yùn)
反正已經(jīng)走出了這一步
不走肯定是死
走出來(lái)沒(méi)準(zhǔn)有一線生機(jī)

1972年
Intel又推出了8008微處理器
這款微處理器從4位擴(kuò)展到了8位
性能有了明顯改善
可是業(yè)界幾乎沒(méi)人認(rèn)為
這種芯片可以用于計(jì)算機(jī)的
中央處理器
最多可以用于工業(yè)控制設(shè)備
(如數(shù)控機(jī)床)的處理器
而拼死一戰(zhàn)的Intel并沒(méi)有止步
堅(jiān)持做出了
8088
8086
這兩塊芯片
正式開啟了以微處理器
為計(jì)算機(jī)中央處理器的時(shí)代
當(dāng)然
并不是所有人都能看清
微處理器的劃時(shí)代意義
只有個(gè)別具有良好計(jì)算機(jī)基礎(chǔ)的
同時(shí)具有產(chǎn)業(yè)洞察力的人
才能看懂這點(diǎn)
蓋茨與喬布斯

就是當(dāng)時(shí)全世界
不超過(guò)10個(gè)人中的兩個(gè)
這兩個(gè)從中學(xué)時(shí)代
就可以用機(jī)器語(yǔ)言編程的
電腦天才看到了
微處理器的應(yīng)用前景
他們認(rèn)為
這個(gè)小芯片必將改變世界的未來(lái)!
然后就開始動(dòng)手了。
蓋茨與他創(chuàng)業(yè)伙伴保羅
基于8088
開發(fā)出來(lái)第一款
微操作系統(tǒng)DOS

1980年
IBM用8088和DOS
制造出了世界第一臺(tái)
微計(jì)算機(jī)IBM PC

而同年
喬布斯與他創(chuàng)業(yè)伙伴沃滋
基于摩托羅拉芯片6502(與8088類似)
開發(fā)出了第一臺(tái)
實(shí)用的蘋果電腦Apple II

Intel繼8086之后
相繼開發(fā)出
286 386 486 奔騰
……
微處理器從
8位
16位
奔騰4前32位
奔騰5后64位
完全滿足了大型計(jì)算機(jī)的需要
從此x86處理器體系
成為了計(jì)算機(jī)CPU的標(biāo)配
 
從以上芯片產(chǎn)業(yè)歷史發(fā)展的介紹
我們看到
經(jīng)過(guò)50多年的發(fā)展
芯片產(chǎn)業(yè)發(fā)生了
翻天地覆的變化
計(jì)算機(jī)產(chǎn)業(yè)
也發(fā)生了同樣巨大的變化
從最原始的電子管
到晶體管
再到集成電路
體積越來(lái)越小
功能越來(lái)越強(qiáng)大
并且為后面
全球芯片業(yè)的發(fā)展
打下了良好的基礎(chǔ)

目前幾種主要AI芯片介紹GPU TPU NPU IPU


前面講述了
計(jì)算機(jī)處理器芯片的
發(fā)展歷史
我們了解到:
計(jì)算機(jī)中央處理單元
從電子管到晶體管
最后到硅晶圓集成電路
最終主流計(jì)算機(jī)CPU(中央處理器)
均定位在x86芯片上
此類芯片
以Intel、AMD公司為主
占領(lǐng)了計(jì)算機(jī)CPU
90%以上的市場(chǎng)
而其他廠商
如摩托羅拉、IBM、DEC等
也曾經(jīng)做過(guò)非x86芯片
但都沒(méi)有形成主流
最后都慢慢退出了市場(chǎng)
但無(wú)論是x86
或非x86體系芯片
在計(jì)算機(jī)體系結(jié)構(gòu)上
都屬于馮·諾依曼體系結(jié)構(gòu)
馮·諾依曼體系結(jié)構(gòu)
是1946年
由美籍匈牙利科學(xué)家
馮·諾伊曼提出的
簡(jiǎn)單地說(shuō)
就是將運(yùn)算程序與數(shù)據(jù)
均放在存儲(chǔ)器中
然后依一系列控制指令
使程序按照一定順序執(zhí)行
最后輸出運(yùn)算結(jié)果
再說(shuō)的通俗一點(diǎn)就是:
無(wú)論多復(fù)雜的運(yùn)算公式
最終都能拆解成數(shù)值的加減法
然后以二進(jìn)制的加減法
進(jìn)行運(yùn)算

這樣
就能將復(fù)雜的運(yùn)算
用機(jī)器自動(dòng)完成
大大提高了效率和質(zhì)量
最初
計(jì)算機(jī)率先使用在核武器研制
及航空航天領(lǐng)域
就是解決那些領(lǐng)域
繁瑣龐雜的計(jì)算工作的
可是隨著計(jì)算機(jī)技術(shù)的發(fā)展
越來(lái)越多的領(lǐng)域
需要由計(jì)算機(jī)來(lái)參與解決問(wèn)題
而馮·諾依曼體系結(jié)構(gòu)的計(jì)算機(jī)
最擅長(zhǎng)的就是科學(xué)計(jì)算
無(wú)論多么復(fù)雜的問(wèn)題
只要你能把它分解成某種“算法”
計(jì)算機(jī)就能通過(guò)運(yùn)算
得到滿意的結(jié)果

隨著計(jì)算機(jī)應(yīng)用領(lǐng)域
不斷擴(kuò)展
人們發(fā)現(xiàn)
馮·諾依曼體系
越來(lái)越難以適應(yīng)
更復(fù)雜的應(yīng)用領(lǐng)域了
或者說(shuō)
有些可以解決復(fù)雜領(lǐng)域的需求
但是效率變得很低很不合理
特別在人工智能領(lǐng)域
尤為突出

人工智能的核心訴求
試圖模仿人腦
來(lái)解決各種復(fù)雜的問(wèn)題
可是人們發(fā)現(xiàn)
馮·諾依曼體系
對(duì)于人腦來(lái)說(shuō)
就是個(gè)小兒科
太多的問(wèn)題
不是以馮·諾依曼體系的邏輯
來(lái)處理的

舉個(gè)例子
筆者在英國(guó)的博士論文課題是
“地圖的自動(dòng)概括”
這是個(gè)典型的
人工智能課題!
傳統(tǒng)的“地圖概括”
是由有經(jīng)驗(yàn)的工程師來(lái)完成的
在地圖從大比例尺
到小比例尺到轉(zhuǎn)換過(guò)程中
很多問(wèn)題要人來(lái)判斷:
原來(lái)一堆單個(gè)房屋
要以什么規(guī)則
合并成建筑塊?
其他各種地物
以什么規(guī)則決定
刪除?
合并?
夸張?
等處理?
人在處理這些問(wèn)題時(shí)
憑看到的實(shí)際情況
與工作經(jīng)驗(yàn)
馬上就改過(guò)來(lái)了
可是面對(duì)這些問(wèn)題
馮·諾依曼體系計(jì)算機(jī)
基本是“傻”掉了!

盡管筆者使用了當(dāng)時(shí)最先進(jìn)的
Prolog語(yǔ)言
C語(yǔ)言
Oracle數(shù)據(jù)庫(kù)等
也是勉強(qiáng)解決了部分問(wèn)題
不能全部解決問(wèn)題
歸根到底
馮·諾依曼計(jì)算機(jī)體系
就不是為解決這類問(wèn)題而生的
隨著人工智能時(shí)代越來(lái)越近
越來(lái)越現(xiàn)實(shí)
馮·諾依曼體系結(jié)構(gòu)
顯然是力不從心了
落實(shí)到計(jì)算機(jī)大腦——芯片
就必須要設(shè)計(jì)出全新的
系統(tǒng)結(jié)構(gòu)
從此
各種類型的、更適合AI領(lǐng)域的芯片
應(yīng)運(yùn)而生
在此我們主要介紹幾種AI芯片
GPU TPU NPU IPU
 
GPU全稱為
Graphics Processing Unit
中文為圖形處理器
就如它的名字一樣
GPU最初是用在
個(gè)人電腦
工作站
游戲機(jī)
和一些移動(dòng)設(shè)備
如平板電腦、智能手機(jī)等)
上運(yùn)行繪圖運(yùn)算工作的
微處理器
為什么GPU
特別擅長(zhǎng)處理圖像數(shù)據(jù)呢?
這是因?yàn)閳D像上的
每一個(gè)像素點(diǎn)
都有被處理的需要
而且每個(gè)像素點(diǎn)
處理的過(guò)程和方式
都十分相似
也就成了GPU的天然溫床
GPU簡(jiǎn)單架構(gòu)如下圖所示:
從架構(gòu)圖
我們就能很明顯的看出
GPU的構(gòu)成相對(duì)簡(jiǎn)單
有數(shù)量眾多的計(jì)算單元
和超長(zhǎng)的流水線
特別適合處理大量的
類型統(tǒng)一的數(shù)據(jù)
但GPU無(wú)法單獨(dú)工作
必須由CPU進(jìn)行控制調(diào)用才能工作
CPU可單獨(dú)作用
處理復(fù)雜的邏輯運(yùn)算
和不同的數(shù)據(jù)類型
但當(dāng)需要大量的
處理類型統(tǒng)一的數(shù)據(jù)時(shí)
則可調(diào)用GPU進(jìn)行并行計(jì)算
雖然GPU
是為了圖像處理而生的
但是通過(guò)前面的介紹可以發(fā)現(xiàn)
它在結(jié)構(gòu)上
并沒(méi)有專門為圖像服務(wù)的部件
只是對(duì)CPU的結(jié)構(gòu)
進(jìn)行了優(yōu)化與調(diào)整
所以現(xiàn)在
GPU不僅可以在圖像處理領(lǐng)域
顯身手
它還被用來(lái)科學(xué)計(jì)算
密碼破解
數(shù)值分析
海量數(shù)據(jù)處理
(筆者的地圖概括處理)
金融分析等
需要大規(guī)模并行計(jì)算的領(lǐng)域
所以GPU也可以認(rèn)為是
一種較通用的芯片
 
TPU全稱為
Tensor Processing Unit,
張量處理器
就是谷歌專門
為加速深層神經(jīng)網(wǎng)絡(luò)運(yùn)算能力
而研發(fā)的一款芯片
其實(shí)也是一款A(yù)SIC
圖:谷歌第二代TPU
TPU與同期的
CPU和GPU相比
可以提供15-30倍的性能提升
以及30-80倍的
效率(性能/瓦特)提升
初代的TPU只能做推理
要依靠Google云
來(lái)實(shí)時(shí)收集數(shù)據(jù)
并產(chǎn)生結(jié)果
而訓(xùn)練過(guò)程
還需要額外的資源
而第二代TPU
既可以用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)
又可以用于推理
圖:TPU芯片布局圖
TPU在芯片上
使用了高達(dá)24MB的
局部?jī)?nèi)存
6MB的累加器內(nèi)存
以及用于
與主控處理器進(jìn)行對(duì)接的內(nèi)存
總共占芯片面積的37%
(圖中藍(lán)色部分)
到目前為止
TPU其實(shí)已經(jīng)干了很多事情了
例如
機(jī)器學(xué)習(xí)人工智能系統(tǒng)
RankBrain
它是用來(lái)幫助Google
處理搜索結(jié)果
并為用戶提供更加相關(guān)搜索結(jié)果的
還有街景Street View
用來(lái)提高地圖
與導(dǎo)航的準(zhǔn)確性的
當(dāng)然還有下圍棋的
計(jì)算機(jī)程序AlphaGo
 
NPU
Neural network Processing Unit
即神經(jīng)網(wǎng)絡(luò)處理器
顧名思義
這家伙是想用電路
模擬人類的神經(jīng)元
和突觸結(jié)構(gòu)啊
怎么模仿?
那就得先來(lái)看看
人類的神經(jīng)結(jié)構(gòu)
生物的神經(jīng)網(wǎng)絡(luò)
由若干人工神經(jīng)元結(jié)點(diǎn)
互聯(lián)而成
神經(jīng)元之間
通過(guò)突觸兩兩連接
突觸記錄了
神經(jīng)元之間的聯(lián)系
如果想用電路
模仿人類的神經(jīng)元
就得把每個(gè)神經(jīng)元
抽象為一個(gè)激勵(lì)函數(shù)
該函數(shù)的輸入
由與其相連的
神經(jīng)元的輸出
以及連接神經(jīng)元的突觸
共同決定
為了表達(dá)特定的知識(shí)
使用者通常需要
(通過(guò)某些特定的算法)
調(diào)整人工神經(jīng)網(wǎng)絡(luò)中
突觸的取值
網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)等
該過(guò)程稱為“學(xué)習(xí)”

神經(jīng)網(wǎng)絡(luò)中
存儲(chǔ)和處理是一體化的
都是通過(guò)突觸權(quán)重來(lái)體現(xiàn)
而馮·諾伊曼結(jié)構(gòu)中
存儲(chǔ)和處理是分離的
分別由存儲(chǔ)器
和運(yùn)算器來(lái)實(shí)現(xiàn)
二者之間存在巨大的差異
當(dāng)用現(xiàn)有的
基于馮·諾伊曼結(jié)構(gòu)的
經(jīng)典計(jì)算機(jī)
(如X86處理器和英偉達(dá)GPU)
來(lái)跑神經(jīng)網(wǎng)絡(luò)應(yīng)用時(shí)
就不可避免地
受到存儲(chǔ)和處理
分離式結(jié)構(gòu)的制約
因而影響效率
這也就是
專門針對(duì)人工智能的
專業(yè)芯片能夠?qū)鹘y(tǒng)芯片
有一定先天優(yōu)勢(shì)的原因之一
NPU的典型代表有
國(guó)內(nèi)的寒武紀(jì)芯片
和IBM的TrueNorth
 
IPU
Intelligence Processing Unit
是一種為AI計(jì)算而生的
革命性架構(gòu)
IPU處理器
是迄今為止
最復(fù)雜的處理器芯片
它在一個(gè)16納米芯片上
有幾乎240億個(gè)晶體管
每個(gè)芯片
提供125 teraFLOPS運(yùn)算能力
一個(gè)標(biāo)準(zhǔn)4U機(jī)箱中
可以插入8張卡
卡間通過(guò)IPU鏈路互連
8張卡上的IPU
可以作為一個(gè)處理器元件工作
提供兩個(gè)petaFLOPS的運(yùn)算能力
與芯片在CPU和GPU中的
存在形式不同
它為機(jī)器智能
提供了更高效的
處理平臺(tái)
這個(gè)產(chǎn)品將用于
云計(jì)算服務(wù)器
也極有可能
用于自動(dòng)駕駛汽車
目前在IPU方面領(lǐng)先的是
英國(guó)Graphcore公司

Graphcore公司
于2016年創(chuàng)立
如今該公司在倫敦
劍橋
臺(tái)灣
北京
Palo Alto
Oslo
都設(shè)有辦公室
員工人數(shù)
將在2019年底達(dá)到400人
首款I(lǐng)PU
也已經(jīng)于19年底推出了
Graphcore專家認(rèn)為:
“我們接觸過(guò)的
所有創(chuàng)新者都說(shuō)
使用GPU
正在阻礙他們創(chuàng)新
如果仔細(xì)看一下
他們正在研究的模型類型
你會(huì)發(fā)現(xiàn)
他們主要研究卷積神經(jīng)網(wǎng)絡(luò)
遞歸神經(jīng)網(wǎng)絡(luò)
和其他類型的結(jié)構(gòu)
例如
強(qiáng)化學(xué)習(xí)
并不能很好地映射到GPU
這也正是
我們將IPU推向市場(chǎng)的
主要原因”
Graphcore的IPU里面
有1216個(gè)核
我們稱之為Tile
每個(gè)Tile里都有
計(jì)算單元和內(nèi)存
由于同時(shí)有
上千個(gè)處理器工作
所以單個(gè)IPU的存儲(chǔ)帶寬
能達(dá)到45TB
比性能最快的HBM
提升了50倍以上
在相同算力下
功耗也降低了一半

Graphcore專家總結(jié)
IPU與其它的AI芯片相比
有三個(gè)比較核心的區(qū)別
第一
處理器核的架構(gòu)不同
IPU是MIMD架構(gòu)
第二
IPU的模型在處理器內(nèi)
     第三
大規(guī)模并行
IPU核之間的通信效率
也非常高
 
總結(jié)幾種AI芯片
GPU
是最早開發(fā)出來(lái)的
圖形處理芯片
要與CPU配合使用
在一定程度上
解決了并行處理問(wèn)題
TPU與NPU
開始從原理上
模擬人腦神經(jīng)網(wǎng)絡(luò)系統(tǒng)
真正進(jìn)入
人工智能應(yīng)用領(lǐng)域
IPU是最新的
專門為人工智能服務(wù)的
AI芯片
由于它內(nèi)部強(qiáng)大的
并行處理能力
相信在未來(lái)
人工智能領(lǐng)域
將大放異彩
另外我們也相信
隨著人工智能領(lǐng)域的
快速發(fā)展
越來(lái)越強(qiáng)大的新型AI芯片
還會(huì)繼續(xù)涌現(xiàn)
 
(未完待續(xù))

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多