禁18免费视频久久久久久久久,一本一道高清无码中午字幕,国产美女一级特黄网站大全,中文字幕诱惑无码视频,暖暖视频手机在线观看,60后老熟妇乱子伦视频,337p日本中国大胆欧美人术艺术

重磅!“大模型可信能力評測排行榜”全國首發(fā)
2024-09-29 21:55
來源: 南方網(wǎng)
人工智能朗讀:

重磅!“大模型可信能力評測排行榜”全國首發(fā)

近日,“大灣區(qū)生成式人工智能安全發(fā)展聯(lián)合實驗室”全國首發(fā)“大模型可信能力評測排行榜”,阿里巴巴“Qwen2-72b”、百度“Ernie-4.0”等一批知名企業(yè)的大模型上榜。

國內(nèi)首家落地對標(biāo)《人工智能安全治理框架》1.0版評測體系

日前,全國網(wǎng)絡(luò)安全標(biāo)準(zhǔn)化技術(shù)委員會在國家網(wǎng)絡(luò)安全宣傳周主論壇上正式發(fā)布了《人工智能安全治理框架》1.0版(簡稱《框架》)。這一框架不僅是一項技術(shù)性文件,更是對全球人工智能治理的新實踐,意在為中國及全球AI技術(shù)的安全、可靠和可持續(xù)發(fā)展提供指引。

“大灣區(qū)生成式人工智能安全發(fā)展聯(lián)合實驗室”(簡稱“聯(lián)合實驗室”)根據(jù)《框架》“包容審慎、確保安全,風(fēng)險導(dǎo)向、敏捷治理,技管結(jié)合、協(xié)同應(yīng)對,開放合作、共治共享”的原則以及技術(shù)和治理兩方面的防范措施,研究制定了國內(nèi)首款對標(biāo)《框架》的大模型安全可信及量化評級測評體系。該評測體系結(jié)合《生成式人工智能服務(wù)管理暫行辦法》和《生成式人工智能服務(wù)安全基本要求》,重點對標(biāo)《框架》,從價值對齊、安全可控和能力可靠三個主要方向和13個細(xì)分維度,對模型的生成內(nèi)容及行為進(jìn)行全面評估。

全國率先發(fā)布“大模型可信能力評測排行榜”

“聯(lián)合實驗室”選取了國內(nèi)外22個最新大模型作為評測對象,包括17個國內(nèi)模型和5個國外模型(華為、騰訊作為“聯(lián)合實驗室”聯(lián)合建設(shè)單位,其模型不參與評測),按照13個維度的評測體系進(jìn)行了全面客觀評測,評測數(shù)據(jù)集超過3.4萬條數(shù)據(jù),支持中文和英文兩種語言,最終形成了“大模型可信能力評測排行榜”。

國內(nèi)大模型可信評測榜單

國外大模型可信評測榜單

評測結(jié)果顯示,國內(nèi)大模型在可信能力評測中展現(xiàn)了較強(qiáng)的競爭力,頂尖模型在各可信維度上的差距較小,其中88.2%的模型在整體13個可信維度中達(dá)到了10A及以上水平。整體來看,國內(nèi)大模型在可信能力上表現(xiàn)突出,尤其在價值對齊和安全可控方面,反映出國內(nèi)技術(shù)的穩(wěn)步提升以及對政策和法規(guī)的高度適應(yīng)性。例如,在價值對齊的五個維度中,17個模型中的16個至少達(dá)到了4A水平(94.1%),但僅有4個模型達(dá)到了5A水平(23.5%),表明仍有進(jìn)一步優(yōu)化的空間。在安全可控維度的四個分項中,3個模型達(dá)到3A,其余14個達(dá)4A,占比82.4%。

然而,評測結(jié)果也揭示了一些不足,尤其是在能力可靠性的四個維度上,模型評級從1A到4A不等,僅有29.4%的模型達(dá)到了4A。這主要是由基座模型能力的差異引起的,表明模型在基礎(chǔ)能力、一致性和穩(wěn)定性方面仍有提升空間。此外,開源大模型Llama-3.1在價值對齊、安全可控等可信能力方面與領(lǐng)先的閉源大模型相比,仍存在顯著差距,需要進(jìn)一步優(yōu)化。

價值對齊評測結(jié)果

安全可控評測結(jié)果

能力可靠評測結(jié)果

“大灣區(qū)生成式人工智能安全發(fā)展聯(lián)合實驗室”介紹

“大灣區(qū)生成式人工智能安全發(fā)展聯(lián)合實驗室”由中共廣東省委網(wǎng)信辦和國家互聯(lián)網(wǎng)應(yīng)急中心廣東分中心聯(lián)合牽頭發(fā)起,華為公司、騰訊公司、中山大學(xué)、廣州市委網(wǎng)信辦、深圳市委網(wǎng)信辦、東莞市委網(wǎng)信辦以及深圳河套發(fā)展署共同參與建設(shè)?!奥?lián)合實驗室”致力于人工智能潛在風(fēng)險的評測研判、前瞻預(yù)防和約束引導(dǎo)研究,為人工智能可靠、可控、安全發(fā)展探索治理范式,積極服務(wù)生成式人工智能創(chuàng)新發(fā)展,有力支撐人工智能時代的網(wǎng)絡(luò)綜合治理體系建設(shè),共同促進(jìn)人工智能“以人為本、向善而行”,努力以高水平的安全助力數(shù)字經(jīng)濟(jì)更高質(zhì)量發(fā)展。

[編輯:單銘捷]