每日經(jīng)濟新聞 2025-03-26 11:10:26
每經(jīng)編輯 段煉
3月26日凌晨,騰訊元寶迎來重大升級,同時接入兩大模型:深度思考模型“騰訊混元T1”正式版,和DeepSeek V3-0324最新版。
升級后,元寶的能力全面增強,在編程、數(shù)學(xué)推理和長文本處理等場景中的表現(xiàn)更加出色。
其中,混元T1正式版,基于新一代快思考模型Turbo S底座升級,是一款能秒回、吐字快、擅長超長文處理的強推理模型,創(chuàng)新采用混合Mamba架構(gòu),性能保持業(yè)界領(lǐng)先,適合處理學(xué)術(shù)論文、策劃方案、長篇內(nèi)容等各類深度思考任務(wù);
元寶部署的DeepSeek V3最新版,則擅長快速生成,一句話指令就能寫代碼,更強的前端開發(fā)能力,實現(xiàn)網(wǎng)站和App開發(fā)。解數(shù)學(xué)題、文本創(chuàng)作的表現(xiàn)也較前代更快更準(zhǔn),能勝任各類高頻使用場景。
值得一提的是,騰訊元寶是最早一批接入 DeepSeek V3-0324版本的AI應(yīng)用,從模型開源到上線僅用1天。
目前,騰訊元寶的“混元+DeepSeek”雙模型均支持深度思考和秒出答案。近期,元寶持續(xù)高頻更新,35天迭代30個版本,不斷上線實用功能。所有能力均免費開放、不限次數(shù),覆蓋更多工作、學(xué)習(xí)和生活場景。
騰訊表示,騰訊元寶將繼續(xù)堅持雙模,始終為用戶提供更好的、更先進(jìn)的模型,并第一時間部署,為大家打造“好用的 AI”。
此前,3月21日深夜,騰訊宣布推出自研深度思考模型混元T1正式版,并同步在騰訊云官網(wǎng)上線。
據(jù)騰訊介紹,混元T1正式版通過大規(guī)模強化學(xué)習(xí),并結(jié)合數(shù)學(xué)、邏輯推理、科學(xué)和代碼等理科難題的專項優(yōu)化,推理能力得到進(jìn)一步提升。與此前已上線騰訊元寶的混元T1-preview模型相比,綜合效果也有了明顯提升。
在一些常見的基準(zhǔn)測試上,比如大語言模型評估增強數(shù)據(jù)集MMLU-PRO中,混元T1的評分僅次于OpenAI-o1,優(yōu)于DeepSeek-R1。
在評估邏輯推理能力的DROP F1測試中,混元T1的評分也優(yōu)于DeepSeek-R1和OpenAI-o1。不過在數(shù)學(xué)和代碼能力測試中,混元T1的評分都低于DeepSeek-R1。在中文語言理解能力方面,混元T1與DeepSeek-R1的評分齊平。
整體來看,混元T1正式版的成績已經(jīng)達(dá)到了業(yè)界領(lǐng)先推理模型的水平。但騰訊官方此次并未披露混元T1的參數(shù)量級,所以并不清楚其是用多少訓(xùn)練數(shù)據(jù)實現(xiàn)這一性能。
編輯|段煉?蓋源源
校對|劉思琦
封面圖片:視覺中國
每日經(jīng)濟新聞綜合自每經(jīng)網(wǎng)、騰訊云、21世紀(jì)經(jīng)濟報道、公開資料等
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP