2020年,應(yīng)屆畢業(yè)的蔣倩成了一名算法工程師,因?yàn)楣ぷ鞯脑?,蔣倩接觸到了剛剛開源的昇思MindSpore。 和許多開發(fā)者一樣,蔣倩對(duì)人工智能和開源社區(qū)充滿了好奇心,一邊在社區(qū)中學(xué)習(xí)深度學(xué)習(xí)的算法原理,一邊和別人分享自己的算法模型和技術(shù)教程。用他自己的話來說:“就像是一個(gè)升級(jí)打怪的過程,一開始自己也是一知半解,后來參加集訓(xùn)營(yíng)、在社群中和大家交流,目前已經(jīng)貢獻(xiàn)了多個(gè)算法模型?!?/span> 現(xiàn)在的蔣倩有了一個(gè)新身份,既是自己公司的“技術(shù)大?!保彩菚N思MindSpore社區(qū)認(rèn)證的“布道師”。像蔣倩這樣優(yōu)秀的認(rèn)證開發(fā)者,昇思MindSpore社區(qū)里已經(jīng)有300多位,其中不少人屬于小白到大神的進(jìn)階式提升,他們?cè)谏鐓^(qū)中不斷學(xué)習(xí)成長(zhǎng)的過程,形象地勾勒了昇思MindSpore在過去兩年中的價(jià)值和意義。 借助MindSpore TechDay的機(jī)會(huì),我們不妨將目光聚集到開源的另一面,即一個(gè)開源社區(qū)和開發(fā)者們的成長(zhǎng)歷程。 01 產(chǎn)業(yè)導(dǎo)向的進(jìn)化 在昇思MindSpore正式開源前,AI框架已經(jīng)流行了一段時(shí)間,經(jīng)歷了Caffe、Theano代表的淺層框架,到TensorFlow、PyTorch代表的通用框架的過渡。可這些框架并不能很好地適應(yīng)工業(yè)需求,要么為了性能犧牲了易用性,要么為了靈活調(diào)試而犧牲了性能,無法同時(shí)滿足易開發(fā)、高效執(zhí)行的要求。 相較于那些學(xué)術(shù)性質(zhì)的框架,昇思MindSpore有著鮮明的產(chǎn)業(yè)導(dǎo)向。在華為的AI戰(zhàn)略布局中, Atlas系列硬件、異構(gòu)計(jì)算架構(gòu)CANN、全場(chǎng)景AI框架昇思MindSpore、昇騰應(yīng)用使能MindX以及AI應(yīng)用使能ModelArts等共同構(gòu)成了相對(duì)完善的昇騰AI基礎(chǔ)軟硬件平臺(tái),其中昇思MindSpore可以在云、邊、端等不同環(huán)境下進(jìn)行開發(fā)部署,瞄準(zhǔn)的是科研創(chuàng)新和產(chǎn)業(yè)應(yīng)用。 蔣倩就是因?yàn)轫?xiàng)目落地的需求,嘗試了海內(nèi)外的多個(gè)AI框架后,最終和昇思MindSpore結(jié)下了不解之緣。所以不同于市面上的其他框架,昇思MindSpore的進(jìn)化過程呈現(xiàn)出了兩個(gè)典型特征: 一是立足于實(shí)際場(chǎng)景的落地應(yīng)用。 昇思MindSpore在1.0版中就達(dá)到了生產(chǎn)商用的標(biāo)準(zhǔn),開發(fā)者可以放心部署在實(shí)際的生產(chǎn)場(chǎng)景中;開源一周年時(shí)推出的面向入門級(jí)開發(fā)者的新工具 TinyMS,被不少開發(fā)者形容為“無痛上手極好用”;不久前更新的昇思MindSpore 1.6版本中,針對(duì)開發(fā)效率進(jìn)行了進(jìn)一步改進(jìn),控制流性能得到提升并支持副作用訓(xùn)練。 二是將大模型作為開發(fā)的新范式。 大模型是連接技術(shù)生態(tài)和商業(yè)生態(tài)的橋梁,也是科研創(chuàng)新走向產(chǎn)業(yè)應(yīng)用的重要樞紐,昇思MindSpore相繼支持了鵬程.盤古、紫東.太初等千億級(jí)參數(shù)的大模型,目的正是使能大模型的訓(xùn)練開發(fā),推動(dòng)大模型在不同行業(yè)進(jìn)行應(yīng)用落地,進(jìn)而串聯(lián)起產(chǎn)業(yè)鏈上下游的開發(fā)者,打通AI的產(chǎn)業(yè)化路徑。 基于這樣的產(chǎn)業(yè)布局,昇思MindSpore的不少特性被開發(fā)者點(diǎn)贊,諸如自動(dòng)并行、二階優(yōu)化、動(dòng)靜態(tài)圖結(jié)合、全場(chǎng)景部署、全棧協(xié)同加速等等,同時(shí)也讓昇思MindSpore在市場(chǎng)上迅速站穩(wěn)了腳跟。截止到2021年底,昇思MindSpore已經(jīng)支持300多個(gè)網(wǎng)絡(luò)模型,涵蓋CV、NLP、推薦等主流模型,服務(wù)了超過5000家企業(yè),并在醫(yī)療、交通、金融、制造、能源等領(lǐng)域進(jìn)行了商業(yè)化應(yīng)用。 如果說兩年前的昇思MindSpore還是一個(gè)新生的嬰兒,目前已經(jīng)步入到了風(fēng)華正茂的青年時(shí)代,在飛速前進(jìn)的時(shí)代步履下,正在扮演許多行業(yè)、許多企業(yè)、許多開發(fā)者奔向人工智能康莊大道的“同行者”。 02 與開發(fā)者共成長(zhǎng) 開源社區(qū)和開發(fā)者的關(guān)系,就像是大海和河流。在談及開源文化的時(shí)候,被提到最多的詞匯就是貢獻(xiàn)。但中國(guó)還是一個(gè)開源文化貧瘠的市場(chǎng),“拿來主義”曾經(jīng)是很多開發(fā)者對(duì)開源的理解,想要在國(guó)內(nèi)迅速構(gòu)建起有生命力的開源社區(qū),勢(shì)必要?jiǎng)?chuàng)造出一套適合中國(guó)市場(chǎng)現(xiàn)狀的新秩序和新文化。 昇思MindSpore奉行的原則是“開發(fā)者第一”,打個(gè)比方:就是讓開發(fā)者站在“巨人”的肩膀上成為“巨人”。于是昇思MindSpore社區(qū)意在營(yíng)造一種共生的環(huán)境,和開發(fā)者一起進(jìn)行創(chuàng)新創(chuàng)造,一起學(xué)習(xí)成長(zhǎng)。 在多個(gè)開源社區(qū)中注冊(cè)過賬號(hào)的蔣倩,將昇思MindSpore社區(qū)看作是學(xué)習(xí)型社區(qū),并盛贊社區(qū)所提供的“保姆式”服務(wù): “首先需要點(diǎn)贊的是昇思MindSpore的低門檻,里面的很多工具降低了我們學(xué)習(xí)AI的技術(shù)要求,比如TinyMS提供了WEB UI 項(xiàng)目容器化快速部署,不需要代碼就能在web界面體驗(yàn)圖像識(shí)別,上傳待推理的圖片即可返回模型推理結(jié)果,目前已經(jīng)支持LeNet5 數(shù)字識(shí)別、CycleGan 風(fēng)格遷移、目標(biāo)檢測(cè)等多種任務(wù)。” “然后讓人印象深刻的是社區(qū)的運(yùn)營(yíng),可以在B站、公眾號(hào)等渠道看一些技術(shù)內(nèi)容,通過社群和其他開發(fā)者聊天,官方還舉辦了很多針對(duì)開發(fā)者的活動(dòng),我就參加過集訓(xùn)營(yíng)和開源創(chuàng)新實(shí)踐課,這些活動(dòng)并未過多占用我的時(shí)間,卻在短時(shí)間里學(xué)到了很多東西,有很大的成長(zhǎng)和收獲。” 除了蔣倩提到的技術(shù)創(chuàng)新和運(yùn)營(yíng)活動(dòng),“保姆式”服務(wù)的內(nèi)涵還體現(xiàn)在面向社區(qū)開發(fā)者的認(rèn)證體系。 早在2020年5月份,昇思MindSpore就發(fā)布了國(guó)內(nèi)首個(gè)AI開源社區(qū)的認(rèn)證開發(fā)者體系,2021年沉淀出了相對(duì)完善的“英雄進(jìn)階體系”,與后來諸多社區(qū)認(rèn)證相比,昇思的開發(fā)者認(rèn)證規(guī)模大、分層細(xì)(包括優(yōu)秀開發(fā)者、資深開發(fā)者、布道師和資深布道師4大級(jí)8子類)、透明高(B站有大量答辯錄屏),為開源開發(fā)者打通了一條極具AI特色的從0到1的成長(zhǎng)路徑。 昇思MindSpore的利他主義精神,換來的不僅僅是開發(fā)者的成長(zhǎng),也為自身在開源世界博得了一席之地:昇思MindSpore的總下載量超過140萬次、擁有4000多位核心貢獻(xiàn)者、2021年就發(fā)表了300多篇基于昇思MindSpore的AI論文……同時(shí)越來越多的開發(fā)者正在加入昇思MindSpore,用一磚一瓦砌出中國(guó)的開源文化,傳播人工智能的技術(shù)火種。 03 詮釋開源的力量 開源世界里流傳著一句著名的格言:社區(qū)重于代碼。對(duì)于這句話的含義,坊間有著不同角度的解釋,華為計(jì)算開源業(yè)務(wù)總經(jīng)理堵俊平也表達(dá)過自己的理解:“通過開源社區(qū),開發(fā)者接觸到新場(chǎng)景、新技術(shù),并把這個(gè)技術(shù)使用經(jīng)驗(yàn)反饋回社區(qū),發(fā)生一些化學(xué)反應(yīng),產(chǎn)生創(chuàng)新的機(jī)會(huì)?!?/span> 為了踐行這樣的理念,昇思MindSpore建立了一整套運(yùn)營(yíng)和管理機(jī)制,涉及泛內(nèi)容平臺(tái)、開發(fā)者活動(dòng)、開發(fā)者社群、社區(qū)治理、生態(tài)合作、基礎(chǔ)設(shè)施等內(nèi)容,試圖打造一個(gè)有競(jìng)爭(zhēng)力的開源社區(qū),讓AI更好地普惠大眾。 昇思MindSpore社區(qū)比很多老牌社區(qū)年輕了許多,但這并不妨礙小孢子(昇思MindSpore開發(fā)者的昵稱)們?cè)忈岄_源的力量。 MSG Women In Tech沙龍是昇思MindSpore社區(qū)社群活動(dòng)特色的一個(gè)縮影,通過為科技從業(yè)女性提供一個(gè)多元包容的討論窗口,推動(dòng)有關(guān)科技與開源多樣性的有益討論,而這些討論并非空談——它們?cè)谥T多女性開發(fā)者的努力下,真正落地成為了開源共享的方案。比如AI和加密藝術(shù)家宋婷在活動(dòng)中接觸到了昇思MindSpore,通過對(duì)世界保護(hù)非物質(zhì)文化遺產(chǎn)——扎染的圖案進(jìn)行訓(xùn)練,能夠基于GAN模型生成新的扎染圖案,以一種數(shù)字化的方式讓云南少數(shù)民族的傳統(tǒng)文化在時(shí)光流逝中不被磨滅。 山水自然保護(hù)中心自2011年開始在野外開展紅外相機(jī)調(diào)查與長(zhǎng)期監(jiān)測(cè),積累了大量紅外相機(jī)數(shù)據(jù),但照片的處理、識(shí)別和分析卻要靠肉眼進(jìn)行。在和昇思MindSpore社區(qū)溝通后,達(dá)成了開展野外場(chǎng)景下紅外相機(jī)照片 AI 物種識(shí)別模型訓(xùn)練的合作,紅外相機(jī)拍攝的照片交給AI模型進(jìn)行初步的識(shí)別和篩選,再由志愿者對(duì)識(shí)別結(jié)果進(jìn)行檢查和修正,極大地提升了照片的識(shí)別速度。 同樣有說服力的,是“開源之夏”對(duì)一些開發(fā)者的專訪,其中武漢大學(xué)的博士研究生謝晴興在采訪中表示:“興趣很重要,只有熱愛才能讓自己一直堅(jiān)持下去。根據(jù)自己的興趣選擇一個(gè)適合自己開源項(xiàng)目,然后持之以恒地做下去?!?/span> 或許這就是昇思MindSpore社區(qū)想要的結(jié)果,開源社區(qū)的重心或許從來都不是代碼,而是激起開發(fā)者的熱情和熱愛,做一件讓自己快樂、有意義、有價(jià)值的事。 目前昇思MindSpore社區(qū)已經(jīng)是國(guó)內(nèi)第一熱度的AI開源社區(qū),官網(wǎng)訪問量超過6300萬次,在碼云開源項(xiàng)目中綜合排名第一。這些數(shù)字遠(yuǎn)不足以概括開源社區(qū)的價(jià)值,很多開發(fā)者在昇思MindSpore社區(qū)找到了志同道合的人,找到了他們熱愛的事情,然后用自己的擅長(zhǎng)方式“改變世界”。 04 關(guān)于TechDay 如果你也想和昇思MindSpore一起成長(zhǎng),千萬不要錯(cuò)過下面的重要信息: 3月26日和27日,昇思MindSpore社區(qū)將舉辦首屆MindSporeTechDay活動(dòng),屆時(shí)將有MindSpore1.6版本、TinyMS V0.3版本的重磅更新,以及一大批開發(fā)者現(xiàn)身講述自己的成長(zhǎng)故事和職場(chǎng)經(jīng)驗(yàn),還有李永樂、稚暉君等“大咖”登臺(tái)互動(dòng),去年讓人眼前一亮的AI開源吐槽大會(huì)也將迎來第二屆…… 這是一場(chǎng)關(guān)于“成長(zhǎng)”的線性敘事,以上不過是故事的第一個(gè)章節(jié)。如果你也是一位有理想的開發(fā)者,或許可以選擇和昇思MindSpore一起成長(zhǎng),書寫屬于你的故事和篇章,一同用腦力和體力點(diǎn)燃中國(guó)AI的星星之火。 主理人 | 張賀飛(Alter) 前媒體人、公關(guān),現(xiàn)專職科技自媒體 虎嗅、鈦媒體、36kr、創(chuàng)業(yè)邦、福布斯中國(guó)等專欄作者 轉(zhuǎn)載、商務(wù)、開白以及讀者交流,請(qǐng)聯(lián)系個(gè)人微信「imhefei」 |
|