隨著人工智能大模型的不斷發(fā)展,如何讓其在“難”的問題上深入思考,而不是對(duì)所有問題“想個(gè)不停”?記者5月29日從中國(guó)科學(xué)院自動(dòng)化研究所獲悉,該所聯(lián)合鵬城實(shí)驗(yàn)室提出了一種高效推理策略AutoThink,可讓大模型實(shí)現(xiàn)自主切換思考模式,避免“過度思考”。
“當(dāng)前,越來(lái)越多的大模型開始具備‘深度思考能力’。”中國(guó)科學(xué)院自動(dòng)化研究所研究員張啟超說(shuō),模型在回答問題之前要先生成一整段包含反復(fù)自我反思、自我驗(yàn)證的推理過程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復(fù)雜問題的能力,但同時(shí)也帶來(lái)了“過度思考”的問題,即在處理簡(jiǎn)單任務(wù)時(shí)也會(huì)生成冗余的思考過程。
“比如使用者對(duì)大模型提問‘2+3等于幾’,大模型可能會(huì)從自然數(shù)定義講起,列出加法交換律,甚至反復(fù)確認(rèn),最后才輸出答案是5。”張啟超說(shuō),這種不必要的“過度思考”現(xiàn)象在推理模型中廣泛存在。
針對(duì)這一問題,AutoThink可賦予推理模型根據(jù)題目難度自主切換思考模式的能力,即通過所設(shè)計(jì)的提示詞和多階段強(qiáng)化學(xué)習(xí),引導(dǎo)其自主決定是否進(jìn)行深度思考。
張啟超介紹,AutoThink提供了一種簡(jiǎn)單而有效的推理新范式——通過省略號(hào)提示配合三階段強(qiáng)化學(xué)習(xí),引導(dǎo)大模型不再“逢題必深思熟慮”,而是根據(jù)問題難度自主決定“是否思考”“思考多少”。在多個(gè)數(shù)學(xué)數(shù)據(jù)集上,AutoThink實(shí)現(xiàn)了準(zhǔn)確率與效率平衡,既提升性能又節(jié)省算力,展示出較強(qiáng)的適應(yīng)性和實(shí)用性。
據(jù)悉,AutoThink已集成于一站式智能科研平臺(tái)ScienceOne,并將用于訓(xùn)練ScienceOne的基座大模型S1-Base。研發(fā)團(tuán)隊(duì)表示,讓大模型“更聰明地思考、更簡(jiǎn)潔地表達(dá)”,是未來(lái)科學(xué)基礎(chǔ)大模型演進(jìn)的重要方向。
隨著人工智能大模型的不斷發(fā)展,如何讓其在“難”的問題上深入思考,而不是對(duì)所有問題“想個(gè)不停”?記者5月29日從中國(guó)科學(xué)院自動(dòng)化研究所獲悉,該所聯(lián)合鵬城實(shí)驗(yàn)室提出了一種高效推理策略AutoThink,可讓大模型實(shí)現(xiàn)自主切換思考模式,避免“過度思考”。
“當(dāng)前,越來(lái)越多的大模型開始具備‘深度思考能力’。”中國(guó)科學(xué)院自動(dòng)化研究所研究員張啟超說(shuō),模型在回答問題之前要先生成一整段包含反復(fù)自我反思、自我驗(yàn)證的推理過程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復(fù)雜問題的能力,但同時(shí)也帶來(lái)了“過度思考”的問題,即在處理簡(jiǎn)單任務(wù)時(shí)也會(huì)生成冗余的思考過程。
“比如使用者對(duì)大模型提問‘2+3等于幾’,大模型可能會(huì)從自然數(shù)定義講起,列出加法交換律,甚至反復(fù)確認(rèn),最后才輸出答案是5。”張啟超說(shuō),這種不必要的“過度思考”現(xiàn)象在推理模型中廣泛存在。
針對(duì)這一問題,AutoThink可賦予推理模型根據(jù)題目難度自主切換思考模式的能力,即通過所設(shè)計(jì)的提示詞和多階段強(qiáng)化學(xué)習(xí),引導(dǎo)其自主決定是否進(jìn)行深度思考。
張啟超介紹,AutoThink提供了一種簡(jiǎn)單而有效的推理新范式——通過省略號(hào)提示配合三階段強(qiáng)化學(xué)習(xí),引導(dǎo)大模型不再“逢題必深思熟慮”,而是根據(jù)問題難度自主決定“是否思考”“思考多少”。在多個(gè)數(shù)學(xué)數(shù)據(jù)集上,AutoThink實(shí)現(xiàn)了準(zhǔn)確率與效率平衡,既提升性能又節(jié)省算力,展示出較強(qiáng)的適應(yīng)性和實(shí)用性。
據(jù)悉,AutoThink已集成于一站式智能科研平臺(tái)ScienceOne,并將用于訓(xùn)練ScienceOne的基座大模型S1-Base。研發(fā)團(tuán)隊(duì)表示,讓大模型“更聰明地思考、更簡(jiǎn)潔地表達(dá)”,是未來(lái)科學(xué)基礎(chǔ)大模型演進(jìn)的重要方向。
本文鏈接:http://www.9978217.cn/v-146-957.html我國(guó)科學(xué)家提出高效推理策略 可避免大模型“過度思考”
相關(guān)文章:
哲理的人生語(yǔ)句摘錄07-05
創(chuàng)新實(shí)驗(yàn)心得體會(huì)05-26
大賽邀請(qǐng)函11-30
在工廠實(shí)習(xí)的學(xué)習(xí)心得09-29
軍訓(xùn)感想09-12
抓娃娃-五年級(jí)敘事作文03-13
二十年后回故鄉(xiāng)話題作文03-10
我有一片晴天作文01-07
四季的童話作文12-05
2024年江西醫(yī)師資格考試醫(yī)學(xué)綜合考試考生須知(8月16日-18日舉行考試)08-14
2024年江蘇中級(jí)經(jīng)濟(jì)師報(bào)名時(shí)間:8月15日-9月6日08-05
教育心理學(xué)試題及答案專升本11-30
中國(guó)共青團(tuán)的入團(tuán)申請(qǐng)書11-26
90大壽典禮的半臺(tái)詞07-25