久久综合中文字幕无码掳,这里是精品中文字幕,精品久久久噜噜噜久久久

世界百事通！GPT-3、ChatGPT和GPT-4，一起做腦筋急轉(zhuǎn)彎

2023-06-27 09:18:30 來源：夕小瑤科技說?

一個(gè)烙餅煎一面一分鐘，兩個(gè)烙餅煎兩面幾分鐘？

讓你來回答，是不是一不小心就掉到溝里了？如果讓大語言模型來做這種腦筋急轉(zhuǎn)彎會(huì)怎樣呢？研究發(fā)現(xiàn)，模型越大，回答就越可能掉到溝里，即使是擁有千億參數(shù)的大模型也不能幸免。但是ChatGPT卻能很好回答這些問題。讓我們一起來看看吧。

腦筋急轉(zhuǎn)彎

(相關(guān)資料圖)

作者采用了CRT數(shù)據(jù)作為腦筋急轉(zhuǎn)彎的測試數(shù)據(jù)。該數(shù)據(jù)在心理學(xué)領(lǐng)域，廣泛地被用于衡量人類的思維習(xí)慣，判斷是否習(xí)慣于直覺思維。

腦筋急轉(zhuǎn)彎數(shù)據(jù)示例

如上圖所示，作者探索了3種CRT數(shù)據(jù)和1種語言邏輯陷阱。例如：

CRT-1：蘋果和梨花了1塊1，蘋果比梨貴1塊，問梨花了多少錢？直覺答案：0.1塊 = 1.1-1，正確答案：0.05塊。

CRT-2：5個(gè)人種5棵樹花5分鐘，10個(gè)人種10棵樹花多少分鐘？直覺答案：10分鐘，正確答案：5分鐘。

CRT-3：培養(yǎng)皿中的細(xì)菌每分鐘擴(kuò)增一倍面積，48分鐘可以填滿，問填滿一半要多久？直覺答案：24分鐘，正確答案：47分鐘。

語言邏輯陷阱：剛上小學(xué)的小紅去參加高考，她會(huì)考幾科？直覺答案6科，正確答案：小學(xué)生不參加高考。

模型表現(xiàn)

模型表現(xiàn)如下圖所示，可以看到模型較小時(shí)，隨著模型增大，模型回答正確答案和直覺答案的比例在提高，回答無關(guān)答案的比例在下降。

但隨著模型進(jìn)一步增大，無關(guān)答案比例進(jìn)一步下降，直覺答案比例進(jìn)一步上升，正確答案比例卻不升反降。包括BLOOM、LLAMA、GPT-3在內(nèi)的大語言模型明顯掉入腦筋急轉(zhuǎn)彎的陷阱。即使是經(jīng)過指令調(diào)整與RLHF的text davinci-002/003也未能幸免。

不同模型表現(xiàn)對比

而在上圖中，經(jīng)過指令調(diào)整的ChatGPT與GPT-4，一下子正確答案的比例就高了許多。究竟是什么魔法使得ChatGPT的腦筋會(huì)轉(zhuǎn)彎呢？我們不得而知。

下圖具體對比了GPT-3、ChatGPT，GPT-4在幾類不同的腦筋急轉(zhuǎn)彎的表現(xiàn)，可以更加凸顯上述現(xiàn)象。

不同腦筋急轉(zhuǎn)彎類型上的模型表現(xiàn)對比

如果改換輸入形式會(huì)怎樣？下圖上為問答的形式，和上面的實(shí)驗(yàn)相同。下圖中、下分別為多選、續(xù)寫的形式?？梢钥吹?，修改提問形式之后，正確率略有上升，但整體差別不大。

下圖顯示，通過少監(jiān)督展示學(xué)習(xí)，GPT-3的正確率會(huì)有所上升。但即使展示到40個(gè)左右的樣本，準(zhǔn)確率和無監(jiān)督的ChatGPT相比仍有差距，更不用說GPT-4了。

結(jié)論

這篇論文針對很有意思的一類問題，發(fā)現(xiàn)了大語言模型的一個(gè)很有意思的現(xiàn)象。作者也嘗試了多種方法，但無論是改變提問形式還是增加監(jiān)督數(shù)據(jù)，GPT-3在腦筋急轉(zhuǎn)彎上的表現(xiàn)仍然難以達(dá)到ChatGPT的水平。究竟ChatGPT使用了怎樣的魔法讓模型的腦筋會(huì)轉(zhuǎn)彎呢？

標(biāo)簽：

上一篇：港股午評：恒指跌0.14%，恒生科技指數(shù)漲0.28% 全球簡訊

上一篇：最后一頁

資訊

或?yàn)椤皩I(yè)攝影套裝”新配色：小米13 Ultra新搭檔即將公布|天天日報(bào)
全球速遞！不到6折：舒蕾山茶花洗發(fā)水39.9元2瓶x600ml抄底
世界新動(dòng)態(tài)：園中芍藥——靜待花開終有時(shí)
今日熱門!GPT產(chǎn)業(yè)聯(lián)盟成立在即
廣德市優(yōu)化鄉(xiāng)村公交打通群眾“連心橋”
非遺 | 安徽開展第七批省級(jí)非遺傳承人推薦申報(bào)_焦點(diǎn)快報(bào)
韓國將為芯片產(chǎn)業(yè)新設(shè)3000億韓元基金三星電子SK海力士承諾注資
湖南省2022年度100項(xiàng)重點(diǎn)工業(yè)新產(chǎn)品發(fā)布暨“創(chuàng)新全覆蓋賦智深度行”活動(dòng)在長啟動(dòng)-全球新要聞
小米新筆記本 i7只賣4699元世界聚焦
資訊推薦:魔笛續(xù)約&京多安加盟，下賽季皇薩中場對決，誰能搶占先機(jī)？

熱點(diǎn)

天天最資訊丨眾安百萬醫(yī)療好不好？有哪些產(chǎn)品？
搜狐汽車全球快訊 | 富士康于鄭州注冊成立新事業(yè)發(fā)展集團(tuán) 含新能源汽車業(yè)務(wù) 看點(diǎn)
?[路演]恒工精密：未來業(yè)績增長亮點(diǎn)聚焦5萬噸鑄造產(chǎn)能與機(jī)加工件產(chǎn)能大幅提升|每日觀察
由風(fēng)語筑等組成的聯(lián)合體中標(biāo)總金額合計(jì)約為18180萬元
桂冠電力近22億投建光伏風(fēng)電發(fā)電項(xiàng)目進(jìn)一步提高新能源裝機(jī)占比
楊浦這場專場招聘會(huì)，為退役軍人和軍屬拓寬求職之路-每日看點(diǎn)

我们每天将为您更新无码免费_婷婷中文字幕视频在线_yy6080无码av午夜福利免费_91精品国产免费久久久久久无码_黄片在线免费播放

世界百事通！GPT-3、ChatGPT和GPT-4，一起做腦筋急轉(zhuǎn)彎

資訊

熱點(diǎn)

天天最資訊丨眾安百萬醫(yī)療好不好？有哪些產(chǎn)品？

搜狐汽車全球快訊 | 富士康于鄭州注冊成立新事業(yè)發(fā)展集團(tuán) 含新能源汽車業(yè)務(wù) 看點(diǎn)

?[路演]恒工精密：未來業(yè)績增長亮點(diǎn)聚焦5萬噸鑄造產(chǎn)能與機(jī)加工件產(chǎn)能大幅提升|每日觀察

由風(fēng)語筑等組成的聯(lián)合體中標(biāo)總金額合計(jì)約為18180萬元

桂冠電力近22億投建光伏風(fēng)電發(fā)電項(xiàng)目進(jìn)一步提高新能源裝機(jī)占比

楊浦這場專場招聘會(huì)，為退役軍人和軍屬拓寬求職之路-每日看點(diǎn)

關(guān)注

23072期大樂透曬票，選擇快樂，需要勇氣???????-世界簡訊

小米汽車14.99萬起售？小米回應(yīng)：假消息，小愛同學(xué)闖禍了

當(dāng)前聚焦：特色產(chǎn)業(yè)煥新生為鄉(xiāng)村振興注入新動(dòng)能

九毛九（09922.HK）：6月26日南向資金增持262.9萬股天天日報(bào)

拆遷非居住房屋的補(bǔ)償標(biāo)準(zhǔn)是什么？征地拆遷如何補(bǔ)償？-觀點(diǎn)

亞太實(shí)業(yè)：控股股東、實(shí)際控制人正在籌劃投票權(quán)委托事項(xiàng) 27日起停牌新視野

聚焦

話題

我们每天将为您更新无码免费_婷婷中文字幕视频在线_yy6080无码av午夜福利免费_91精品国产免费久久久久久无码_黄片在线免费播放

世界百事通！GPT-3、ChatGPT和GPT-4，一起做腦筋急轉(zhuǎn)彎

資訊

熱點(diǎn)

天天最資訊丨眾安百萬醫(yī)療好不好？有哪些產(chǎn)品？

搜狐汽車全球快訊 | 富士康于鄭州注冊成立新事業(yè)發(fā)展集團(tuán) 含新能源汽車業(yè)務(wù) 看點(diǎn)

?[路演]恒工精密：未來業(yè)績增長亮點(diǎn)聚焦5萬噸鑄造產(chǎn)能與機(jī)加工件產(chǎn)能大幅提升|每日觀察

由風(fēng)語筑等組成的聯(lián)合體中標(biāo)總金額合計(jì)約為18180萬元

桂冠電力近22億投建光伏風(fēng)電發(fā)電項(xiàng)目 進(jìn)一步提高新能源裝機(jī)占比

楊浦這場專場招聘會(huì)，為退役軍人和軍屬拓寬求職之路-每日看點(diǎn)

關(guān)注

23072期大樂透曬票，選擇快樂，需要勇氣???????-世界簡訊

小米汽車14.99萬起售？小米回應(yīng)：假消息，小愛同學(xué)闖禍了

當(dāng)前聚焦：特色產(chǎn)業(yè)煥新生 為鄉(xiāng)村振興注入新動(dòng)能

九毛九（09922.HK）：6月26日南向資金增持262.9萬股 天天日報(bào)

拆遷非居住房屋的補(bǔ)償標(biāo)準(zhǔn)是什么？征地拆遷如何補(bǔ)償？-觀點(diǎn)

亞太實(shí)業(yè)：控股股東、實(shí)際控制人正在籌劃投票權(quán)委托事項(xiàng) 27日起停牌 新視野

聚焦

話題

世界百事通！GPT-3、ChatGPT和GPT-4，一起做腦筋急轉(zhuǎn)彎

天天最資訊丨眾安百萬醫(yī)療好不好？有哪些產(chǎn)品？

桂冠電力近22億投建光伏風(fēng)電發(fā)電項(xiàng)目進(jìn)一步提高新能源裝機(jī)占比

楊浦這場專場招聘會(huì)，為退役軍人和軍屬拓寬求職之路-每日看點(diǎn)

23072期大樂透曬票，選擇快樂，需要勇氣???????-世界簡訊

小米汽車14.99萬起售？小米回應(yīng)：假消息，小愛同學(xué)闖禍了

當(dāng)前聚焦：特色產(chǎn)業(yè)煥新生為鄉(xiāng)村振興注入新動(dòng)能

九毛九（09922.HK）：6月26日南向資金增持262.9萬股天天日報(bào)

拆遷非居住房屋的補(bǔ)償標(biāo)準(zhǔn)是什么？征地拆遷如何補(bǔ)償？-觀點(diǎn)

亞太實(shí)業(yè)：控股股東、實(shí)際控制人正在籌劃投票權(quán)委托事項(xiàng) 27日起停牌新視野