61页|2023前沿大模型的风险、安全与治理报告

2024-03-18 AI

前沿大模型实验室目前普遍假设Scaling Laws仍有效,模型能力在未来几年内仍存在数量级进步的空间。

ChatGPT后,我们需要认真对待在未来十年内出现通用人工智能(AGl)的可能性,即人工智能系统将在许多关键领域超越人类。底线思维要求凡事从最坏处准备,努力争取最好的结果,预判和防范人工智能风险未雨绸缪的好处大于虚惊一场的坏处。

前沿大模型的滥用风险迫在眉睫,可能成为生物安全风险的推动者和新型网络犯罪的工具。

推动建立风险等级测试评估体系,分类分级管理,例如建立针对训练高风险前沿大模型的许可制度。促进开源安全标准或替代方案的讨论,未来如果对更强的前沿大模型开源,可能有更严重的扩散和滥用风险。

Al安全研究有四大抓手:对齐、鲁棒性、监测和系统性安全,应构建多层次的安全保障,可借鉴网络安全纵深防御(Defense-in-Depth)策略。主流的RLHF对齐方法存在根本局限,难以拓展到更高级的系统,面向超级智能的对齐问题需要更好的技术途径。

目前中文大模型的安全评测大多限于对输出文本的评测,逼近GPT-4性能的模型应进行生物研发、网络攻击、自主行动等危险能力评测。

三位图灵奖和中外多位顶尖Al专家的首次政策建议共识,呼吁研发机构和政府分配至少1/3的人工智能研发资金用于安全和伦理。

技术治理、行业自律、政府监管和国际治理缺一不可,人工智能风险复杂多变,需要各方共同应对。

推动前沿大模型实验室和企业落地最佳实践,包括部署前风险评估、危险能力评测、第三方模型审核、模型使用的安全限制和红队测试。负责任扩展策略(RSP)是一个应对Al潜在灾难性风险的务实立场和选择,尽管暂停或放慢前沿Al研发在未来依然是一个严肃的政策选择。

来源:安远AI

关于我们

我们是一家专注于分享国内外各类行业研究报告/专题热点行业报告/白皮书/蓝皮书/年度报告等各类优质研究报告分享平台。所有报告来源于国内外数百家机构,包含传统行业、金融娱乐、互联网+、新兴行业、医疗大健康等专题研究.....目前已累积收集近80000+份行业报告,涉及众多大板块,多个细分领域。

内容涵盖但不限于(市面上有的基本都有):

1、互联网运营、新媒体、短视频、抖音快手小红书等等;

2、房地产、金融、券商、保险、私募等;

3、新技术(5G)、金融科技、区块链、人工智能类;

4、电子商务、市场营销、运营管理、麦肯锡、德勤等;

5、快消品、餐饮、教育、医疗、化妆品、旅游酒店、出行类等;

免责声明:

本平台只做内容的收集及分享,报告版权归原撰写发布机构所有,由圣香智库社群通过公开合法渠道获得,如涉及侵权,请联系我们删除;如对报告内容存疑,请与撰写、发布机构联系。


欢迎加入圣香智库,下载所有精华报告。

1、请用微信扫描左侧二维码;
2、知识星球用于圣香所有报告分享平台,加入后即可下载;
3、加入后免费提问、免费下载所有报告,无任何限制;
4、越早加入福利越多。