《2024中国大模型发展要素洞察报告:语料、算力、电力研究》由亿欧智库发布,大模型产业发展的关键要素。大模型的发展依赖于语料数据、算力和电力这三大基础支撑,它们共同决定了大模型的性能、效率和应用范围。
在算力方面,算力对于大模型开发的重要性,指出算力需求的快速增长与供应相对不足之间的差距,即“算力剪刀差”,在中国数字经济和高科技行业中尤为突出。中国的数据生产量预计在2026年将达到56.16ZB,但仅有8.9%的数据被妥善保存,剩下91%的数据无法进行高效利用。了算力发展的痛点,包括算力生态发展不全面、东西部算力基础发展不均衡、自主核心技术存在短板以及算力发展碎片化等问题。
语料要素方面,报告定义了语料数据,并高质量语料在提升模型能力方面的重要性。高质量语料预计将在2028年用尽,而常规语料数据存在诸多痛点,如数据价值难以体现、数据充满偏见等。普通语料数据可以通过标注、合成等手段转化为高质量语料,但这一过程面临多维度的挑战。
能源要素方面,报告新能源的定义和发展,指出人工智能能源需求的暴增,以及新能源供电需要储能技术来减少弃电。新能源发电+储能解决方案虽然可以缓解AI发展带来的能源需求增速,但也带来了成本提升、维护难等痛点。
来源:亿欧智库
