2025 年,AI 领域发展迅猛,DeepSeek 爆火成为焦点。前经纬创投合伙人庄明浩的 74 页 PPT,为剖析这一现象提供了d特视角。
DeepSeek 成功源于开源策略。2025 年一季度,DeepSeek-V3 模型以 MIT 协议公开训练代码和模型权重,打破大厂技术垄断。其 557 万美元的训练成本不到 GPT-4 的十分之一,推理成本降至每百万 token 0.14 美元,大幅拉低行业门槛,使 AI 服务未来或按需取用,加速技术普及。
技术上,DeepSeek 带来重要转变。以往无脑堆参数提升模型性能,而它用 320 亿参数实现 4000 亿参数模型效果。借助混合专家系统(MoE)和稀疏激活技术,处理任务时只激活部分 “专家模块”,节省算力且提升效率。若该技术普及,依赖烧钱堆参数的团队将面临挑战,促进行业技术创新。
硬件方面,AI 领域博弈激烈。英伟达 H200 和谷歌 TPU v5 能效差距达 3.7 倍,专用 AI 芯片迭代超传统显卡。但能源问题更受关注,微软重启核电站,显示训练大模型耗电量惊人。未来,获取便宜稳定电力供应或成 AI 公司核心竞争力。
实际应用中,AI 已在多领域崭露头角。AlphaFold4 开源版蛋白质预测精度达 1.2 埃,影响生物研究,实验室或调整方向。金融领域,摩根大通 AI 系统风险评估比人类准 97%,基金经理工作将有变化。多模态方面,能处理多数据的 AI 系统成熟后,工业机器人应用场景将拓宽。
地缘政治对 AI 发展影响直接。ASML 新一代光刻机使 3nm 芯片自主生产有望,利好ZG AI。华为升腾芯片效率达 92%,绕过 CUDA 生态路线初见成效。中文语料信息密度优势被证实,或推动 NLP 技术出现 “中文路线” 分支。
展望 2025 年,AI 有两大趋势。一是神经符号系统融合,或让 AI 具备逻辑推理能力;二是量子计算实用化,或重新定义算法优化边界。但现实问题也不容忽视,预计明年四季度八成网络内容或由 AI 生成,分辨真假信息将成新课题。
DeepSeek 爆火是 2025 年 AI 发展的缩影。在多因素交织下,AI 领域快速变革。摩登7需关注动态,应对挑战,抓住机遇,推动 AI 技术更好发展。
![]() |
智能服务机器人 |