41页|中国智能媒体创新发展报告2022-2023

2024-03-19 传媒娱乐

伴随计算机技术与人工智能技术的研发突破,新一轮的发展热点也逐步显现,CHATGPT的爆火带来的是整体大模型行业的齐头并进,从自然语言模型到深度机器学习,大模型技术推动着新一轮的Al技术的发展。通用Al能力的广泛应用也使得大模型技术日趋成熟,同时掌握尖端大模型技术的水平高低也成为了国力竞争的衡量参考之一。

基于多模态内容语义理解技术模型构建一种基于多模态信息融合的语义理解模型,为多模态数据生成多知识维度的语义标签。该系统包括两个子模型:多模态分类标签模型(VCT)和多模态语义标签模型(VST),分别为视频生成分类标签和语义标签。

多模态分类标签是预测topic的类别,由于一级、二级类别合并后并不多,因此采用组合的方式进行文本分类。整体模型思路为一个两阶段框架,如下图所示,第一阶段是多模态特征编码,第二阶段包括多模态特征融合和分类器。

预训练大模型是目前深度学习领域的一个重要趋势,它通常涉及使用大量数据对大型神经网络进行预训练,以学习一种普遍适用的知识表示。此类模型一般分为两个阶段进行训练:预训练阶段和微调阶段。

预训练阶段:在这个阶段,模型会在大量无标签数据上进行训练,例如整个互联网上的文本。这个过程被称为无监督学习,因为模型只需预测输入数据的某些方面,而不需要任何人工标签。在这个过程中,模型会学习到丰富的数据表示,例如单词、短语、句子的含义和它们如何组合在一起。

微调阶段:在这个阶段,预训练过的模型会在特定任务的有标签数据上进行进一步训练。例如,如果我们要训练一个新闻分类器,我们就可以在具有新闻类别标签的新闻文章数据上进行微调。在微调过程中,模型会学习到如何将在预训练阶段学到的知识应用到特定任务上。

来源:新媒体研究院&新浪AI媒体研究院

关于我们

我们是一家专注于分享国内外各类行业研究报告/专题热点行业报告/白皮书/蓝皮书/年度报告等各类优质研究报告分享平台。所有报告来源于国内外数百家机构,包含传统行业、金融娱乐、互联网+、新兴行业、医疗大健康等专题研究.....目前已累积收集近80000+份行业报告,涉及众多大板块,多个细分领域。

内容涵盖但不限于(市面上有的基本都有):

1、互联网运营、新媒体、短视频、抖音快手小红书等等;

2、房地产、金融、券商、保险、私募等;

3、新技术(5G)、金融科技、区块链、人工智能类;

4、电子商务、市场营销、运营管理、麦肯锡、德勤等;

5、快消品、餐饮、教育、医疗、化妆品、旅游酒店、出行类等;

免责声明:

本平台只做内容的收集及分享,报告版权归原撰写发布机构所有,由圣香智库社群通过公开合法渠道获得,如涉及侵权,请联系我们删除;如对报告内容存疑,请与撰写、发布机构联系。


欢迎加入圣香智库,下载所有精华报告。

1、请用微信扫描左侧二维码;
2、知识星球用于圣香所有报告分享平台,加入后即可下载;
3、加入后免费提问、免费下载所有报告,无任何限制;
4、越早加入福利越多。