過去幾年,不管是在硬件、軟件還是互聯(lián)網(wǎng)行業(yè),創(chuàng)新乏力都是一個(gè)普遍的印象。 這當(dāng)然不是說就沒有創(chuàng)新了,但必須承認(rèn)的是,智能手機(jī)和移動(dòng)互聯(lián)網(wǎng)已經(jīng)發(fā)展了這么多年,產(chǎn)品和服務(wù)形態(tài)大多成熟,各個(gè)生態(tài)位也基本都擠滿了巨頭和中小公司,只有少數(shù)創(chuàng)業(yè)公司和新應(yīng)用還能在行業(yè)、市場(chǎng)的邊緣給出讓人眼前一亮的創(chuàng)新。 但 2023——過去這一年的與眾不同之處在于,生成式 AI 的浪潮來了。從去年年底推出的 ChatGPT 開始,這一輪的人工智能浪潮不僅席卷了科技行業(yè)自身,也讓各國(guó)政府、不同行業(yè)以及普羅大眾都卷入到這場(chǎng)浪潮之中。 由此,全球范圍都掀起了一輪新的 AI 創(chuàng)業(yè)潮,以及各種 AI 原生應(yīng)用的爆發(fā),除了 ChatGPT、Claude、谷歌 Bard 和百度文心一言等聊天機(jī)器人,我們還能看到從 Perplexity AI 原生搜索引擎到妙鴨相機(jī),再到 HeyGen 和 Pika。 回望 2023 年,我們不應(yīng)該錯(cuò)過它們。 一、妙鴨相機(jī):AI 寫真的「第一次接觸」圖/ App Store 通過上傳約 20 張照片,就能制作自己的數(shù)字分身,并生成專業(yè)質(zhì)感的寫真照片,妙鴨相機(jī)從發(fā)布開始就表現(xiàn)出了與一眾互聯(lián)網(wǎng)大廠生成式 AI 產(chǎn)品的不同,盡管這是由優(yōu)酷旗下團(tuán)隊(duì)打造的一款產(chǎn)品。 不僅如此,妙鴨相機(jī)也沒有選擇面向 C 端用戶「免費(fèi)」的模式,而是設(shè)置了 9.9 元的付費(fèi)門檻。但即便如此,妙鴨相機(jī)依舊憑借更高效、獨(dú)特的體驗(yàn)以及極高的「出片率」成為了大量年輕人的新寵,連帶服務(wù)器也經(jīng)常被擠爆。對(duì)此,雷科技在《在爆火的妙鴨相機(jī)上,我看到了 AI 應(yīng)用的「流量密碼」》一文也有更深入的體驗(yàn)和看法。 盡管妙鴨相機(jī)的「爆火」來得快、去得也快,但毫無疑問,妙鴨相機(jī)給了不少生成式 AI 應(yīng)用一些啟示和反思。 二、Perplexity,生于大模型的搜索引擎圖/ Perplexity 作為一款新生的 AI 對(duì)話搜索引擎,Perplexity 其實(shí)最早在 2022 年 12 月就發(fā)布了,開始是采用 OpenAI 的 GPT-3 大模型作為「動(dòng)力」,后面隨著 ChatGPT 在全球范圍的爆火,也將模型升級(jí)到了 GPT-3.5 和 GPT-4(付費(fèi)專享)。此外,Perplexity 在 2023 年做了大量產(chǎn)品層面和模型應(yīng)用層面的探索和升級(jí),這也是為什么在這篇文章中將其歸為「2023 年 AI 新應(yīng)用」的原因。 事實(shí)上,經(jīng)過過去這一年的多次迭代,Perplexity 和雷科技最初關(guān)注到它的時(shí)候已經(jīng)有了很大的不同(文章可見《ChatGPT 成為“X 因素”,百度再度掀起搜索大戰(zhàn)?》),不僅外觀、功能大變樣,整個(gè)產(chǎn)品形態(tài)也更加成熟、好用。同時(shí),在提供 GPT-3.5/4、Claude2、Llama 2、Gemini Pro 等主流模型之外,Perplexity 其實(shí)也在持續(xù)更新自主訓(xùn)練的大模型。 而在 2023 年 10 月最新一輪的融資中,Perplexity 的估值也來到了 5 億美元。 三、Chirper:AI 們的專屬微博,硅基時(shí)代的社會(huì)實(shí)驗(yàn)圖/Chirper 毋庸置疑,社交領(lǐng)域一直都是每一次技術(shù)革命的焦點(diǎn)之一,比如 Web 2.0 后出現(xiàn)的一大堆社交平臺(tái),在移動(dòng)互聯(lián)網(wǎng)后又有大量新興社交平臺(tái)的出現(xiàn)。從這個(gè)角度來看,Chirper 至少代表了硅基智能時(shí)代的一種嘗試。 Chirper 是一個(gè)專門為 AI 設(shè)計(jì)的社交平臺(tái),不過僅限 AI 發(fā)布內(nèi)容,人類禁止發(fā)言,相當(dāng)于是一個(gè) AI 們的新浪微博。盡管人類無法發(fā)言、只能看著 AI 聊天機(jī)器人在其中發(fā)布動(dòng)態(tài)、評(píng)論、分享、互動(dòng),但還是可以自己「捏人」——設(shè)置 AI 聊天機(jī)器人的名字、性格、興趣、語言風(fēng)格等來參與到社區(qū)之中。就連馬斯克、Sam Altman(OpenAI CEO)等也被一度吸引至此。 而 Chirper 的「捏人」過程,實(shí)際相當(dāng)于一個(gè)固定的提示詞前綴,AI 看到其他內(nèi)容,是提示詞的主體。所以當(dāng)前綴和主體被傳到大模型進(jìn)行推理輸出后,就有了 AI 的發(fā)帖內(nèi)容和回復(fù)。 四、HeyGen,讓霉霉?jié)h語八級(jí)的視頻「魔法」圖/ HeyGen 就在去年 11 月左右,網(wǎng)上突然開始流行一些視頻,比如歌手 Taylor Swift 操著一口流利普通話,視頻卡點(diǎn)之準(zhǔn)確,音色之相似,甚至是口型都完全能對(duì)上,騙得不少直呼「臥槽」。不僅如此,我們還能看到說著一口地道中文的特朗普、憨豆先生以及說著英語的蔡明。 而這些視頻都用了同一款 AI 視頻工具——HeyGen。HeyGen 是國(guó)內(nèi)的一家創(chuàng)新企業(yè)(詩(shī)云科技)旗下的產(chǎn)品,他們希望通過開發(fā)一款視覺引擎,將視頻制作從傳統(tǒng)的基于拍攝的方式轉(zhuǎn)變?yōu)?AI 生成的形式。 不過 Heygen 能做的其實(shí)不止 AI 跨語言配音。應(yīng)該說,Heygen 是一個(gè)功能全面、效果很好的 AI 虛擬人應(yīng)用,以 AI Avatar(虛擬人形象)和 Voice Clone(聲音克?。﹥纱蠹夹g(shù)作為基礎(chǔ),可以適用于虛擬主播、一鍵換衣等各種場(chǎng)景。 五、Pika:兩個(gè)華人女孩創(chuàng)造的視頻生成 AI圖/ Pika 不同于 HeyGen 剛開始就定位于商業(yè)工具,最新火出圈的 Pika 代表了一種 AI 視頻生成公司,盡管距離技術(shù)成熟還有一段明顯的距離,但在人機(jī)協(xié)同創(chuàng)作的背后,擁有無限的可能。而 Pika,也是目前這一賽道最驚艷的初創(chuàng)項(xiàng)目。 雖然前有 Runway 宣布升級(jí) Gen-2,帶來了更長(zhǎng)的生成視頻長(zhǎng)度,但就視頻生成質(zhì)量而言,Pika 的生成質(zhì)量遠(yuǎn)高于 Gen-2。文本生成視頻最大的問題在于動(dòng)畫生成的清晰和連貫性,Gen-2 只能在微小動(dòng)作上保證視頻的穩(wěn)定性,一旦動(dòng)作幅度加大就會(huì)產(chǎn)生不同程度的變形,但 Pika 目前就展示出了非常連貫的動(dòng)畫效果。 此外,Pika 的兩位女性華人創(chuàng)始人也引起了大量的關(guān)注,但實(shí)際上很多人并不知道,Pika 的投資人可以說齊聚了 AI 圈的半壁江山,包括 OpenAI 創(chuàng)始成員 Karpathy、前 Github CEO Nat Friedman、Quora 創(chuàng)始人 Adam D'Angelo、Perplexity CEO 等,由此可見 Pika 得到的認(rèn)可。 六、podcast.ai,采訪了「喬布斯」的 AI 播客第一期節(jié)目封面,圖/ podcast.ai 作為一種內(nèi)容形式,這幾年播客早就成為了全球范圍的新趨勢(shì),包括 Spotify、Youtube Music、QQ 音樂等音樂平臺(tái)都陸續(xù)內(nèi)置了播客功能。但在 2023 年 10 月,一檔完全由 AI 生成的播客節(jié)目 podcast.ai 登場(chǎng),第一期就是采訪 AI 生成的蘋果公司創(chuàng)始人史蒂夫·喬布斯。 podcast.ai 通過喬布斯的傳記和收集網(wǎng)絡(luò)上關(guān)于他的所有錄音,用 Play.ht 的語言模型大量訓(xùn)練,最終生成了假 Joe Rogan 采訪喬布斯的播客內(nèi)容。Play.ht 認(rèn)為,未來所有內(nèi)容創(chuàng)作都將由人工智能生成,但由人類指導(dǎo),「最具創(chuàng)造性的工作將取決于人類將他們想要的創(chuàng)作表達(dá)到模型中的能力?!?/strong> 寫在最后2023 年,我們見證了生成式 AI 技術(shù)在多個(gè)領(lǐng)域的突破和創(chuàng)新,從音樂制作到動(dòng)畫,再到播客制作,AI 不僅展現(xiàn)了其技術(shù)的成熟度,也揭示了未來可能的發(fā)展方向。 隨著技術(shù)的不斷進(jìn)步,我們也期待 AI 將在未來的各個(gè)領(lǐng)域中扮演更加重要的角色。而我相信,在未來的一年以及更長(zhǎng)的時(shí)間緯度下,不斷涌現(xiàn)出的 AI 新應(yīng)用在將新技術(shù)擴(kuò)散到更廣泛的用戶群體,也將改變大多數(shù)人的生活。
|
|