2024年的深度行业分析研究报告指出,交互型多模态大模型作为一种新兴技术,正逐渐成为人工智能发展的重要方向。这类模型通过整合文本、音频、图像、视频等多种模态的输入输出,能够实现接近人类的复杂情境理解和反应。以OpenAI的GPT-4o为代表的交互型多模态大模型,不仅具备原生多模态、快速响应、情感表达和记忆等特性,还大幅降低了成本,使得大模型的应用更加广泛。
报告分析了交互型多模态大模型在教育、编程、医疗健康、办公、游戏和情感陪伴等多个领域的应用前景。例如,在教育领域,大模型能够提供个性化教学和语言学习支持;在医疗健康领域,大模型有助于提高诊断效率和患者护理质量;在办公场景中,大模型可以作为会议助手,提升工作效率。
此外,报告还探讨了交互型多模态大模型在具身智能领域的应用,如人形机器人、智能座舱和智能家居等。这些应用展示了大模型在物理世界中与人类互动的潜力,以及在提供个性化服务方面的价值。
报告预测,随着技术的不断进步,交互型多模态大模型将深度集成于端侧设备,如智能手机和PC,从而提升用户体验并创造新的工作和创作方式。商业模式方面,大模型可能会作为聊天助手APP、基础模型接入各类应用,甚至成为超级入口,与终端OS深度融合,为用户提供一站式的智能服务。报告最后梳理了相关标的,包括交互型多模态大模型提供商、数字智能和具身智能应用开发商以及算力供应商等。
