首個生成式 AI 安全指導(dǎo)性文件來了,你讀懂了嗎?
10 月 11 日,全國信息安全標準化技術(shù)委員會官網(wǎng)發(fā)布《生成式人工智能服務(wù)安全基本要求》(征求意見稿),面向社會公開征求意見。
公告原文:https://www.tc260.org.cn/front/postDetail.html?id=20231011143225
這是國內(nèi)首個專門面向生成式 AI 安全領(lǐng)域的規(guī)范意見稿,也是對 7 月網(wǎng)信辦等七部門推出的《生成式人工智能服務(wù)管理暫行辦法》的支撐。
征求意見稿首次提出生成式 AI 服務(wù)提供者需遵循的安全基本要求,涉及語料安全、模型安全、安全措施、安全評估等方面。
下文介紹了該文件部分要點。
要求:提供者不應(yīng)使用未經(jīng)主管部門備案的基礎(chǔ)模型進行研發(fā)。在訓(xùn)練過程中,應(yīng)將生成內(nèi)容安全性作為評價生成結(jié)果優(yōu)劣的主要考慮指標之一。
在每次對話中,應(yīng)對使用者輸入信息進行安全性檢測,引導(dǎo)模型生成積極正向內(nèi)容。
《要求》提出,建立語料來源黑名單,不得使用黑名單來源的數(shù)據(jù)進行訓(xùn)練。應(yīng)對各來源語料進行安全評估,單一來源語料內(nèi)容含違法不良信息超 5% 應(yīng)將其加入黑名單。
應(yīng)使用包含個人信息的語料時,獲得對應(yīng)個人信息主體的授權(quán)同意,或滿足其他合法使用該個人信息的條件。
應(yīng)使用包含人臉等生物特征信息的語料時,獲得對應(yīng)個人信息主體的書面授權(quán)同意,或滿足其他合法使用該生物特征信息的條件。
在訓(xùn)練過程中,應(yīng)將生成內(nèi)容安全性作為評價生成結(jié)果優(yōu)劣的主要考慮指標之一。
全文:https://www.tc260.org.cn/upload/2023-10-11/1697008495851003865.pdf