2024年AI大模型技术变迁情况回溯(19页) pdf下载 免费-www.cqhaiergw.com
摩登7机器人
CHUANGZE ROBOT
当前位置:首页 > 新闻资讯 > ai智能 > 2024年AI大模型技术变迁情况回溯:技术演进方向,推动机器人场景应用落地,AI应用商业化

2024年AI大模型技术变迁情况回溯:技术演进方向,推动机器人场景应用落地,AI应用商业化

来源:中国移动智慧家庭运营中心     编辑:摩登7   时间:2025/1/2   主题:其他 [加盟]

2024 年大模型技术快速演进,相较于 2023 年的大小模型之 争,技术的进步方向逐步向应用落地方向倾斜,降低端侧模型 部署门槛,缩短模型推理时延,提升模型交互能力,大模型的 发展迎来了新的变化。本文将从技术视角梳理 2024 年以来大模 型各个L域发生的变化,以行业L先实践为佐证,提出大模型技术演进方向。语言大模型发展迎来新范式,通过强化学习优 化内部思维链策略,以提升复杂逻辑推理能力。多模态大模型架构正向端到端演进,决策准确性和灵敏度提升推动机器人场景应用落地。在视频生成L域,DiTs 架构的可扩展性优势显现, 推动 AI应用商业化。在硬件部署方面,模型压缩、安全控制等 技术正降低部署门槛。在智能体实践方面,垂类大模型开始在 智能终端环境应用。在合成数据策略方面,自我奖励语言模型 生成合成数据,试图打破数据瓶颈。

一、语言大模型的新范式:强化学习优化思维链

规模定律的延伸

在2024年之前,语言大模型的“规模定律”已经得到了业界的广泛认可。模型参数的扩展、数据集质量的提升以及人工微调,使得语言模型展现出了前所未有的泛化能力和通用能力。然而,2024年的技术进步,将这一定律延伸至后训练阶段。

OpenAI的o1推理大模型

今年9月,OpenAI公开发布的o1推理大模型,通过强化学习优化模型内部思维链推理逻辑步骤,模拟人的思考过程,加深对问题的理解程度,从而提升处理复杂推理任务的能力。这一技术突破,标志着语言大模型的发展迎来了新范式。

强化学习的威力

通过强化学习,模型学会了精炼思维链并优化所用策略,识别并纠正错误,将复杂步骤分解为更简单的部分,并在当前方法无效时尝试不同的途径。这一过程显著提升了模型的推理能力,在多个G难度推理基准测试中,o1的表现超越了人类专家和GPT-4o,展示了其强大的推理能力和专业知识。

二、多模态大模型:端到端架构的演进

跨模态到端到端的转变

过去,多模态大模型多采用基于语言模型为主干的跨模态架构,通过模态特定的编码器转化为统一的向量表示后再输入语言模型。但这样的架构带来了任务响应时间长、模态间交互细节损失的问题。

端到端架构的优势

2024年以来,以GPT-4o、Gemini为代表的多模态大模型开始使用端到端支持多种模态统一输入输出的模型架构。这一架构通过简化模型的输入接口,减少模态间的信息损失,提升了模型处理即时任务的响应时间。

英伟达的GR00T项目

在2024GTC大会上,英伟达发布了人形机器人项目GR00T,基于控制、执行和决策三个层级分层实现模型的端到端训练学习,通过合并反向反馈得到准确输出结果,大幅提升了机器人处理复杂任务的精度、G效性以及灵活性。

三、视频生成L域的突破:DiTs架构的可扩展性

DiTs架构的优势

2024年以来,国内外科技大厂发布的视频生成模型多以DiTs为基础,基于Transformer架构的扩散模型在视频生成任务中可扩展性优势凸显。相较于原先的U-Net卷积网络架构,Transformer骨干架构可以提供基于参数规模和训练数据量提升而带来更优越的性能。

OpenAI的Sora视频生成模型

OpenAI发布的视频生成模型Sora基于DiTs架构,在生成视频的像素稳定性、前后逻辑连续性以及信息丢失等方面有大幅提升。Sora在数据处理和视频标注L域做了创新,基于视频编码器将样本空间数据进行时间空间维度压缩和Patch化处理,再通过相应解码器实现隐空间向视频像素空间的映射,以训练新的视频压缩网络实现长视频生成的能力。

Meta Movie Gen视频生成模型

Meta Movie Gen视频生成模型发布,其在原先视频生成模型架构的基础上,叠加了一个13B参数转换器模型Meta Gen Audio,通过数百万个小时的音频参考数据的对比总结,Meta Gen Audio可准确匹配声音和画面之间的对应关系,根据不同情绪和环境的提示词,找到与画面出色契合的音乐。

四、硬件部署实践:端云结合架构的创新

苹果的Apple Intelligence

苹果在2024年6月发布的Apple Intelligence为大模型硬件部署实践提供了很好的指引。Apple Intelligence采用端云结合方案,分别在设备端和服务器端部署大小语言模型(AFM-on-device和AFM-server),不同应用可以通过统一的语义索引、意图检测等工具调用AFM模型。

量化压缩叠加适配器架构

为保障在端侧设备上运行模型同时避免精度上损失,苹果创新推出量化压缩叠加适配器的架构,一方面采用量化压缩的方法降低模型大小,同时通过LoRA适配器来恢复量化模型的精度。

Responsible AI原则

苹果制定了Responsible AI原则,包括用户赋能、代表、谨慎设计、隐私保护四大原则,被整合到基础模型开发的每一个环节中,包括数据的收集与处理、模型训练、模型评估、用户反馈等。

LLM-in-a-flash技术

苹果研发了LLM-in-a-flash技术,让大模型可以不受限于DRAM的限制,在推理时将参数加载至闪存中来辅助完成计算,分担存储压力,从而降低端侧设备部署大模型门槛。


附件:2024年AI大模型技术变迁情况回溯:技术演进方向,推动机器人场景应用落地,AI应用商业化






超拟人大模型的情绪价值体验:八大安全场景对大模型进行针对性升级

针对八大安全场景(政治敏感、犯罪违法、心理健康、 歧视/偏见、伦理道德等)对大模型进行针对性升级。使模型具备基本的安全性,能够在遇到安全问题时给予正确的回复策略

教育大模型:AI赋能智能教育,塑造未来学习新生态,分为通用大模型教育应用和教育专有大模型

教育大模型是基于人工智能技术和海量教育数据构建的深度学习模型,可分为通用大模型教育应用和教育专有大模型,2019 - 2024年市场规模增长,预计2025 - 2028年继续增长

中国AI+营销趋势洞察与企业落地建议:成本有效的实现规模化扩张,提升用户体验和满意度

企业数字营销部门应积J拥抱这一趋势,将 AI 技术深度融入到营销工作流程中,实现营销的智能化,自动化和个性化;企业可以为每个消费提供更加准确的产品推荐和服务

2024AI教育硬件全景报告:市场规模将达到165亿元,2028有望接近900亿

AI学习机、AI词典笔、AI听力宝成为消费级AI教育硬件的三大主流品类;C端产品以其庞大的市场规模和增长潜力,成为了市场的主力军,市场规模将达到165亿元,到2028年,这一数字有望接近900亿

端侧智能行业-人工智能重要应用产品落地爆发在即,落地场景包括 AI PC、AI 手机、AI 可穿戴设备、AI 智能家居、AI 智能汽车、AI 工业设备

端侧智能是在终端设备一侧进行智能化处理和决策,其优势包括增效,降本,个性化等,把握生成式 AI 同终端产品深度结合的创新浪潮,在端侧智能方面保持开放生态

2024年中国生成式AI行业月度观察报告技术深化L域融合持续增长的AI市场:文心一言月度UV突破2000万,移动端豆包MAU已达2700万

Web端行业应用UV超过1.5亿次,移动端全行业独立应用渗透率已超过20%,MAU超过7000万,数据不仅展示了AI应用的广泛普及,也预示着AI技术正逐步成为人们生活的一部分

2024年AI Agent实施的明路应用实践报告-三个核心能力进行任务规划和问题拆解,场景的智能化解决方案

低运营成本已成为企业用户落地大模型的首要目标,这些场景的智能化解决方案,无一例外地指向了 AI Agent,为企业用户提供落地 AI Agent 项目时的策略指导和实践洞见

科研智能(AI4R&D) 人工智能驱动的研发新范式:描绘生态全景,为制定产业政策、指导项目布局提供参考

旨在描绘科研智能L域的生态全景,为政府部门制定产业政策、指导项目布局提供参考,为研究机构、科技企业把握 技术方向、开拓应用场景提供借鉴,加速该L域的技术创新和应用 实践,为我国在该L域抢占发展先机提供助力

2024AIGC创新应用洞察报告:市场规模达到360.6亿美金,增长率达到46.5%

MoE与思维链助力大模型技术路线破局:MoE模型提升效果显著,拥有人类“慢思考”的特质

MoE 框架是对 Transformer 架构的优化,在 NLP、CV、语音识别以及机器人等L域表现出色;基于“思维链”的创新推理模式,学会人类“慢思考”

中国文娱行业人工智能行业应用发展图谱:市场规模将达到1.21万亿,侧重IP版权交易与多元化开发

市场规模将达到1.21万亿,且增速拉回20%增长通道;3D在游戏行业美术成本当中大致占比超过50%比重,美术生产力仍然具备可观的提升空间

在线教育龙头多邻国启示录商业模式珠玉在前AI技术助力突破国内在线教育星辰大海,市场规模已达到1665.5亿美元

在线教育市场规模已达到1665.5亿美元,其中在线语言学习应用的收入更是达到了10.87亿美元,探索AI技术如何助力国内在线教育市场突破重围
资料获取
ai智能
== 资讯 ==
2024年AI大模型技术变迁情况回溯:技
智能迎宾机器人关键技术:运控算法
仿人形机器人产业链空间广阔,未来或达到万
2024具身智能科技前沿热点:智能灵巧操
2024年企业AI大模型应用落地白皮书-
2024年AI大模型赋能智能座舱研究报告
Graph AI:大模型浪潮下的图计算白
2024年AI大模型对我国劳动力市场潜在
2024年中国人工智能系列白皮书-元宇宙
2024年中国人工智能系列白皮书-体育人
深圳市打造人工智能先锋城市的若干措施[深
2024年人形机器人新质生产力商业化十大
2024年人形机器人新质生产力创新十大榜
2024年人形机器人新质生产力上市企业十
2024年人形机器人新质生产力关键技术十
== 机器人推荐 ==
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)


            智能服务机器人                   
版权所有 摩登7智能机器人集团股份有限公司 中国运营中心:上海 科技园8号楼5层 中国生产中心:山东日照解放路71号
销售1:4006-935-088 销售2:4006-937-088 客服电话: 4008-128-728