亚洲开心激情网_亚洲欧美另类综合偷拍 _国产性天天综合网_欧美日韩午夜在线

五大模型解高考數(shù)學(xué):阿里通義千問、360智腦10題全錯得0分;訊飛星火答對一半|當(dāng)前要聞
時間:2023-06-08 22:46:39  來源:搜狐科技  
1
聽新聞

一年一度高考季,高考試題是大眾關(guān)注的焦點,也成為了AI能力的試金石。AI大模型數(shù)學(xué)功底到底如何?比人類“聰明”嗎?搜狐科技使用五款A(yù)I大模型對2023高考上海數(shù)學(xué)試卷進行了同題測試。

在測試中,搜狐科技選取了高考試卷前10道填空題,讓百度文心一言、阿里通義千問、科大訊飛星火認知大模型、360智腦、ChatGPT進行回答。


(資料圖片僅供參考)

測試結(jié)果顯示,這五款大模型在答數(shù)學(xué)題的能力上差異顯著。

最“聰明”的訊飛星火答對了5題,正確率50%。百度文心一言和ChatGPT“緊跟其后”,答對了4題,正確率為40%。

360智腦和通義千問則“全軍覆沒”,一道題也沒答對,交了白卷。

值得一提的是,昨天搜狐科技也用五款大語言模型產(chǎn)品,對高考作文全國卷(甲)進行了測試,并邀請了5位語文名師打分。

打分結(jié)果顯示,ChatGPT高考作文得分最高,文心一言、訊飛星火得分稍低,但跟ChatGPT處于同一水平。360智腦和通義千問得分最低。

雖然語文作文題和數(shù)學(xué)計算題,對大模型能力考察的維度并不盡相同。但巧合的是,不擅長寫作文的360智腦和通義千問,似乎也不擅長做數(shù)學(xué)題。

通過這兩次高考題測試,也能從側(cè)面反應(yīng)出各家大模型的能力確實是“參差不齊”。如果ChatGPT、文心一言、訊飛星火是“學(xué)霸”,那么360智腦和通義千問則是妥妥的“學(xué)渣”。

附測試中使用的高考數(shù)學(xué)題題目:

1.不等式|x-2|<1的解集為__

2.a=(2,3),b=(-1,2),則a·b=__

3.首項為3,公比為2的等比數(shù)列的前六項和S6=__

4.tanA=3,tan2A=__

5.f(x)={2^xx>0;1,x≤0}的值域為__

6.復(fù)數(shù)z=1-i,則|1+iz|=__

7.圓的方程x^2+y^2-4y-m=0的面積為π,則m=__

8.三角形的三邊長為a=4,b=5,c=6,則sinA=__

9.某地一年四個季度的GDP(億元),第一季度GDP為232,第四季度GDP為241,且四個季度的GDP逐季度增長,中位數(shù)、平均數(shù)相等。則該地一年的GDP為__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0,正數(shù)k的最大值為__

責(zé)任編輯:

關(guān)鍵詞:

主站蜘蛛池模板: 亚洲av综合色区| 一区二区三区在线视频看| 亚洲v日韩v综合v精品v| 国产欧美亚洲日本| 久久国产精品视频在线观看| 欧美一区二区三区精品电影| 欧美一区二区视频在线播放| 亚洲国产欧洲综合997久久| 久久五月天色综合| 亚洲自拍中文字幕| 国产伦精品免费视频| 欧美精品在线播放| 午夜精品免费视频| 国产欧美在线播放| 久久综合电影一区| 国产精品美女在线播放| 欧美激情久久久久| 日韩中文字幕精品| 91久久国产综合久久91精品网站| 欧美二区三区在线| 天堂资源在线亚洲视频| 国产精品日韩欧美综合| 久久久精品在线视频| 日韩精品资源| 宅男在线精品国产免费观看 | 国产精品麻豆va在线播放| 性高潮久久久久久久久| 国产福利久久| 国产精品日韩专区| 久久99精品久久久久久久青青日本 | 国产成人中文字幕| 国产欧美中文字幕| 国产区精品视频| 韩国视频理论视频久久| 久久久久久久久亚洲| 欧美二区在线看| 亚洲伊人久久综合| 中文字幕日韩精品一区二区| av观看久久| 91久久国产精品| 亚洲一区二区三区在线观看视频|