视频大模型迎来Sora时刻,生产力工具蓄势待发。自Sora发布以来,国内外已有十多家公司发布或更新视频生成模型。
客观对比:与Sora差距缩小,抢占用户或为未来主线。国内外之间的差距正在逐步缩小,视频时长、分辨率等基础功能具有复
制性,未来竞争或向抢占用户、提升粘性等方向迁移,从而需要保障生成质量更G的可用视频,使得视频一致性更G、文本指
令遵循更准确、物理真实模拟能力更强。
主观对比:视频质量提升显著,离物理世界模拟器仍有距离。文生视频L域,视频画面普遍清晰,而在动作幅度与物理还原度
方面差异较大,我国Vidu、清影或已处于视频生成大模型D一梯队,生成时间相对其他模型倍数减少,且在动作幅度、物理还
原度等复杂任务完成性较好;图生视频L域,整体效果优于文生视频,国内与国外差距进一步缩小。
视频大模型具备商用潜力,下游应用正在储能。未来随着用户习惯的培育以及算力基础设施的完善,视频大模型的或者办公、
广告、电影、游戏等多L域具有广阔的前景。
算法、算力、数据三要素,视频大模型通往AGI的必经之路。
算法:视频生成模型算法主要由基于SD逐帧生成和基于时空Patches两种范式构成,是效率与效益的比拼。前者模型更容易训练,
而视频内容一致性要差一些,长视频训练存在困难;后者训练成本更G,但是生成视频的长度与一致性更容易得到保障。
算力:以Sora为例,一定条件下测算,Sora训练算力需求是GPT-4的4.5倍,而推理算力需求接近GPT-4的400倍。
数据:G质量数据是模型能力的保障,而用户数量或为开启模型迭代“数据飞轮”的关键。
投资建议:建议关注(1)视频大模型厂商:科大讯飞、商汤、云从科技、格灵深瞳、拓尔思、昆仑万维等。(2)算力:海光
信息、寒武纪、景嘉微、中科曙光、浪潮信息、工业富联、神州数码、拓维信息、四川长虹等。(3)接入大模型的应用标的:
金山办公、万兴科技、福昕软件、虹软科技、彩讯股份、焦点科技、润达医疗、金证股份、泛微网络、金蝶国际等。
附件:视频大模型奇点时刻加速到来-视频大模型迎来Sora时刻

在这份白皮书里分 UHF、HF、LF 几个主要的频段对 RFID 无源物联网产业进行详细的市场分析以及数据呈现,并且对每个频段的产业链玩家以及主要应用L域进行了多面分析
上半年,B2C 网络零售额增长13.6%,占网络零售额比重为84.3%;C2C 网络零售额 下降5.4%,占网络零售额比重为15.7%;网络零售平台店铺数量约2559.7万家,增长2.8%
餐饮配送、酒店配送、商用清洁机器人是市场出货量前三产品;餐饮配送机器人以连锁、中G端酒店为主要市场,关注“多机协
数字经济核心产业增加值占GDP比重10%左右。累计建成62家“灯塔工厂”,占总数的40%。连续11年成为D一大网络零售市场
报告涵盖了多个L域,包括G性能计算、人工智能、机器人技术、基因计算、数字交互引擎、脑机接口、沉浸式媒体、星地直连通信、eVTOL(电动垂直起降飞行器)、虚拟电厂等
白皮书分为五个主要部分,涵盖了产业大模型的发展、应用、评价标准、中国实践案例以及未来的展望与挑战;探讨产业大模型的发展前景,为我国人工智能产业的发展贡献力量
使用自然语言推理目标场景,实现在给定初始场景和目标场景的情况下即可学习执行复杂的操作任务,机器人的语义指令集的拓展提供了新的参考思路
要立足场景正向设计产品从场景出发解决问题;续航能力将是制约人形机器人应用和发展的又一个重要因素;需要做到万元级别的成本才有可能大面积进入家庭
服务机器人的市场规模在2019年后快速增长,预计到2025年CAGR将达到近65%;人形机器人会是未来公共服务机器人主要形态,软件升级引L硬件发展
商业模式创新,打造一体化服务,持续拓展下游细分赛道;业务模式创新,多场景融合,实现实现一个服务机器人可以完成在多场景下完成工作
新科技的出现可能会对传统服务机器人厂商造成 一些冲击;优秀毕业生行业是软件和信息服务可能会导致人才供给不足等风险;行业内公司经营模式相似度过G
收入和研发费用的比例均超过了5%;国产机器人推广应用面临新场景拓展慢的挑战;代理商分销的方式可以有效的帮助服务机器人厂商也会造成市场的恶意竞价