61页|2023前沿大模型的风险、安全与治理报告-圣香智库

61页|2023前沿大模型的风险、安全与治理报告

2024-03-18 AI

前沿大模型实验室目前普遍假设Scaling Laws仍有效，模型能力在未来几年内仍存在数量级进步的空间。

ChatGPT后，我们需要认真对待在未来十年内出现通用人工智能(AGl)的可能性，即人工智能系统将在许多关键领域超越人类。底线思维要求凡事从最坏处准备，努力争取最好的结果，预判和防范人工智能风险“未雨绸缪”的好处大于“虚惊一场”的坏处。

前沿大模型的滥用风险迫在眉睫，可能成为生物安全风险的推动者和新型网络犯罪的工具。

推动建立风险等级测试评估体系，分类分级管理，例如建立针对训练高风险前沿大模型的许可制度。促进开源安全标准或替代方案的讨论，未来如果对更强的前沿大模型开源，可能有更严重的扩散和滥用风险。

Al安全研究有四大抓手：对齐、鲁棒性、监测和系统性安全，应构建多层次的安全保障，可借鉴网络安全纵深防御(Defense-in-Depth)策略。主流的RLHF对齐方法存在根本局限，难以拓展到更高级的系统，面向超级智能的对齐问题需要更好的技术途径。

目前中文大模型的安全评测大多限于对输出文本的评测，逼近GPT-4性能的模型应进行生物研发、网络攻击、自主行动等危险能力评测。

三位图灵奖和中外多位顶尖Al专家的首次政策建议共识，呼吁研发机构和政府分配至少1/3的人工智能研发资金用于安全和伦理。

技术治理、行业自律、政府监管和国际治理缺一不可，人工智能风险复杂多变，需要各方共同应对。

推动前沿大模型实验室和企业落地最佳实践，包括部署前风险评估、危险能力评测、第三方模型审核、模型使用的安全限制和红队测试。负责任扩展策略(RSP)是一个应对Al潜在灾难性风险的务实立场和选择，尽管暂停或放慢前沿Al研发在未来依然是一个严肃的政策选择。

来源：安远AI

关于我们

我们是一家专注于分享国内外各类行业研究报告/专题热点行业报告/白皮书/蓝皮书/年度报告等各类优质研究报告分享平台。所有报告来源于国内外数百家机构，包含传统行业、金融娱乐、互联网+、新兴行业、医疗大健康等专题研究.....目前已累积收集近80000+份行业报告，涉及众多大板块，多个细分领域。

内容涵盖但不限于（市面上有的基本都有）：

1、互联网运营、新媒体、短视频、抖音快手小红书等等；

2、房地产、金融、券商、保险、私募等；

3、新技术（5G）、金融科技、区块链、人工智能类；

4、电子商务、市场营销、运营管理、麦肯锡、德勤等；

5、快消品、餐饮、教育、医疗、化妆品、旅游酒店、出行类等；

免责声明：

本平台只做内容的收集及分享，报告版权归原撰写发布机构所有，由圣香智库社群通过公开合法渠道获得，如涉及侵权，请联系我们删除；如对报告内容存疑，请与撰写、发布机构联系。

1、请用微信扫描左侧二维码；
2、知识星球用于圣香所有报告分享平台，加入后即可下载；
3、加入后免费提问、免费下载所有报告，无任何限制；
4、越早加入福利越多。

返回列表 >

近期发表

圣香智库官方微信公众号