《2024全球人工智能简史》一书人工智能的发展历程,从19世纪的起源讲起,展现了人工智能如何从早期的概念发展成为当今影响深远的技术。书中特别大型语言模型(LLM)的重要性,这些模型人工神经网络,通过自监督学习在海量数据上训练,能够生成自然语言或代码来解决实际问题。从米歇尔·布雷亚尔的语义概念到费迪南·德·索绪尔的语言学研究,再到沃伦·麦卡洛克和沃尔特·皮茨的人工神经网络模型,以及艾伦·图灵在计算机科学和人工智能领域的开创性工作,书中详细推动人工智能发展的关键人物和事件。
书中还自然语言处理(NLP)的起源和发展,包括早期的机器翻译项目、规则的模型、以及ELIZA和SHRDLU等开创性程序。时间的推移,研究人员开始采用统计模型来分析文本,如隐马尔可夫模型(HMM)和条件随机场(CRF),这些模型提高了语言处理的灵活性。进入21世纪,深度学习模型如循环神经网络(RNN)、长短期记忆网络(LSTM)和门控循环单元(GRU)的出现,进一步推动了自然语言处理的发展。
书中图形处理单元(GPU)的诞生极大地加速了深度学习模型的发展,使得处理大型文本数据集和复杂计算成为可能。词嵌入技术的出现,如约书亚·本希奥的神经语言模型和谷歌的Word2Vec,显著改善了语言理解和单词间语义关系的建模。Seq2Seq模型和Transformer架构的引入,尤其是后者使用的自注意力机制,为自然语言处理带来了重大突破。
书中还提到了生成式人工智能(GenAI)的崛起,这是一种能够生成文本、图像、音频等多种内容的人工智能技术。自20世纪60年代聊天机器人的出现到2014年生成对抗网络(GAN)的引入,再到Transformer模型的发展,GenAI技术不断进步,为内容创作、代码编写、新药设计等领域带来了新的可能性。
在研究与开发方面,全球AI专利授权数量在2023年达到了37.8万件,同比增长507.1%,显示出人工智能领域的快速发展。中国在全球AI专利数量上处于领先地位,2022年AI专利数量占全球的61.13%。全球基础模型数量自2021年开始大幅增长,开源模型占据主导地位。
书中还人工智能在商业领域的应用,指出2023年全球人工智能市场规模高达5381亿美元,预计到2032年将超过2.5万亿美元。人工智能工具的普及速度前所未有,2024年上半年,近七成北美洲用户每周使用人工智能工具。尽管企业主对应用人工智能仍存在疑虑,但超八成用户认为AI可以为其工作带来正面影响,愈七成用户认为AI可以带来新的工作机会。
来源:Fastdata极数
