新榜訊 4 月 10 日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)重磅開源首個(gè)多語(yǔ)言類 SWE 數(shù)據(jù)集——Multi-SWE-bench。該數(shù)據(jù)集能夠用于評(píng)估并增強(qiáng)大模型“自動(dòng)修 Bug”的能力。在 SWE-bench 的基礎(chǔ)之上,Multi-SWE-bench 開創(chuàng)性地涵蓋了除 Python 之外的 7 種主流編程語(yǔ)言,成為名副其實(shí)面向“全棧工程”的評(píng)測(cè)基準(zhǔn)。其數(shù)據(jù)全部源自 GitHub issue,歷經(jīng)近一年時(shí)間精心構(gòu)建,旨在盡可能精準(zhǔn)地測(cè)評(píng)及提升大模型高階編程的智能水平。
掃描二維碼
手機(jī)瀏覽
字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)正式開源首個(gè)多語(yǔ)言類SWE數(shù)據(jù)集
分享文章鏈接
上一篇

周鴻祎:企業(yè)落地AI不要追求宏大敘事 要敏捷迭代 小步快跑
新榜訊 2025 中國(guó)移動(dòng)云智算大會(huì)上,360 創(chuàng)始人周鴻祎指出,企業(yè)無(wú)需構(gòu)建繁雜的 AI 戰(zhàn)略,不必企圖憑借一個(gè)大模型來(lái)化解企業(yè)的全部問(wèn)題,而應(yīng)精選場(chǎng)景,讓一個(gè)模型應(yīng)對(duì)一個(gè)問(wèn)題。
下一篇
抖音:攔截下架違規(guī)微短劇476部
新榜訊 4 月 10 日,抖音安全中心出臺(tái)《抖音關(guān)于打擊違規(guī)微短劇的公告》。

相似推薦

豆包大模型團(tuán)隊(duì)開源基準(zhǔn)測(cè)試集SuperGPQA
新榜訊 3 月 4 日,豆包大模型團(tuán)隊(duì)于近日開源SuperGPQA。
跳動(dòng).jpeg)
字節(jié)跳動(dòng)豆包小范圍測(cè)試深度思考模型,接入的不是DeepSeek
新榜訊 字節(jié)跳動(dòng)旗下的 AI 助手豆包正在開展小范圍的深度思考模型測(cè)試,所接入的并非 DeepSeek 模型。
跳動(dòng).jpeg)
字節(jié)豆包大模型團(tuán)隊(duì)提出稀疏模型架構(gòu)UltraMem
新榜訊 2 月 12 日消息,據(jù)字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)透露,其 Foundation 團(tuán)隊(duì)于近期推出 UltraMem,這是一種能將計(jì)算和參數(shù)解耦的稀疏模型架構(gòu),在確保模型效果的基礎(chǔ)上成功化解了推理的訪存難題。
上一篇

周鴻祎:企業(yè)落地AI不要追求宏大敘事 要敏捷迭代 小步快跑
新榜訊 2025 中國(guó)移動(dòng)云智算大會(huì)上,360 創(chuàng)始人周鴻祎指出,企業(yè)無(wú)需構(gòu)建繁雜的 AI 戰(zhàn)略,不必企圖憑借一個(gè)大模型來(lái)化解企業(yè)的全部問(wèn)題,而應(yīng)精選場(chǎng)景,讓一個(gè)模型應(yīng)對(duì)一個(gè)問(wèn)題。
下一篇

抖音:攔截下架違規(guī)微短劇476部
新榜訊 4 月 10 日,抖音安全中心出臺(tái)《抖音關(guān)于打擊違規(guī)微短劇的公告》。