午夜视频在线网站,日韩视频精品在线,中文字幕精品一区二区三区在线,在线播放精品,1024你懂我懂的旧版人,欧美日韩一级黄色片,一区二区三区在线观看视频

分享

人工智能像人類一樣思考,有的學(xué)生卻放棄思考

 骷髏館 2024-10-09
超級(jí)人工智能變得越來(lái)越像人,而現(xiàn)在的教育卻讓很多學(xué)生放棄思考和追問(wèn)。
最近,Open AI發(fā)布新一代大模型“o1”,它可以像人類一樣深度,具備復(fù)雜推理能力。當(dāng)處理數(shù)學(xué)、物理、化學(xué)等復(fù)雜問(wèn)題時(shí),“o1”的表現(xiàn)甚至和該領(lǐng)域的博士生不相上下。
如果說(shuō)之前的Chatgpt像一個(gè)文科生,在文字識(shí)別、處理和生成等方面表現(xiàn)突出;“o1”模型就像一個(gè)理科學(xué)霸,在國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽資格考試中,模型正確解決了83%的問(wèn)題,相比之下GPT-4o僅能解決13%的問(wèn)題。

圖片

圖片
探究“o1”的工作原理,我發(fā)現(xiàn)人工智能的學(xué)習(xí)方式,對(duì)于學(xué)生的學(xué)習(xí)也有很大啟示:
1、自我學(xué)習(xí)
模型通過(guò)自我對(duì)弈強(qiáng)化學(xué)習(xí)(Reinforcement Learning),類似AlphaGo自學(xué)圍棋的過(guò)程,左右互搏,自我推演,通過(guò)自我對(duì)抗提升解決問(wèn)題的能力。
這種方法類似于人類通過(guò)不斷嘗試和糾錯(cuò)來(lái)掌握新技能。犯錯(cuò)是必然的,快速犯錯(cuò),快速改錯(cuò),從而快速找到正確答案。
機(jī)器在這方面比人類更強(qiáng)大,因?yàn)闄C(jī)器沒(méi)有內(nèi)耗和糾結(jié),犯錯(cuò)之后不會(huì)懊惱和自責(zé),而是立即調(diào)整策略,投入下一個(gè)挑戰(zhàn)。
2、思維鏈條
通過(guò)內(nèi)置的思維鏈(Chain of Thought, CoT)進(jìn)行推導(dǎo),并將其推理過(guò)程外化,使模型的決策過(guò)程更為透明。
思維鏈就像人類處理復(fù)雜問(wèn)題的思路,把一個(gè)問(wèn)題分解成一系列子問(wèn)題,然后逐個(gè)解決這些子問(wèn)題,從而得出最終答案。
數(shù)理化等理科為什么難學(xué)?因?yàn)樗季S鏈條長(zhǎng),情況復(fù)雜多變。學(xué)會(huì)把問(wèn)題拆解,把大問(wèn)題拆解成小問(wèn)題,然后分而治之,各個(gè)擊破。
3、推理標(biāo)記
模型引入65536個(gè)推理標(biāo)記(Reasoning Tokens),有助于模型在對(duì)話環(huán)境中進(jìn)行深層思考。
我的理解是:在進(jìn)行深度推理時(shí),通過(guò)一些關(guān)鍵節(jié)點(diǎn)的路標(biāo),指引推理方向,選擇不同的邏輯路徑。
理科學(xué)習(xí)最難的是思路,尤其是面對(duì)復(fù)雜問(wèn)題。如果你能夠形成一套相對(duì)固定的解題流程,頭腦中有相關(guān)知識(shí)的基本框架,你碰到任何一道新題時(shí),就有多種選擇,就有更多的解題思路。
此外,o1模型使用專門的訓(xùn)練數(shù)據(jù)集,包含了大量復(fù)雜問(wèn)題和對(duì)應(yīng)的解題步驟。換句話說(shuō),模型做了大量的相關(guān)練習(xí),也沒(méi)少“刷題”。
我一直關(guān)注人工智能技術(shù)的進(jìn)化,我發(fā)現(xiàn)機(jī)器學(xué)習(xí)的路徑是照搬人類、模仿人類、超越人類,機(jī)器變得越來(lái)越智能。反觀當(dāng)前的教育環(huán)境,還在強(qiáng)調(diào)學(xué)生死記硬背,而不是培養(yǎng)批判性思維和創(chuàng)新能力。填鴨式的教學(xué)方法只會(huì)讓學(xué)生越來(lái)越討厭學(xué)習(xí)、討厭思考。
學(xué)習(xí)不是逼不得已的任務(wù),是人類必須具備的能力。終身學(xué)習(xí),持續(xù)進(jìn)化,與人工智能共生,這才是出路。
提高學(xué)習(xí)能力,才能面向未來(lái)。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多