浙商证券:近期国产大模型密集发布 规模化应用拉动推理需求

zhongshanradio 2026-02-12 1 0

智通财经APP获悉,浙商证券发布研报称,近期国产大模型密集发布,DeepSeek新模型进行灰度测试,拥有1M(100万tokens)的上下文处理能力(此前最多128K);GLM-5于智谱官网上线,主打编程与智能体提升。当前Agent可用性日渐增强,大模型从聊天转向协作,多模态方面,Seedance2.0可大幅降低视频创作门槛与成本。早期大模型主要token开销来自于对话与图片生成,随着Agent以及视频生产走向大规模应用,大模型推理算力消耗或将快速提升。

浙商证券主要观点如下:

春节前后国产模型密集发布,AI军备竞赛开启

近期国产大模型密集发布:DeepSeek新模型进行灰度测试,拥有1M(100万tokens)的上下文处理能力(此前最多128K);GLM-5于智谱官网上线,主打编程与智能体提升, *** 编程测试结果位列全球之一,领先Claude 2月发布的最新模型Claude Opus 4.6;MiniMax新模型MiniMax M2.5已在海外MiniMax Agent产品进行内测;字节发布Seedance 2.0,大幅降低视频创作门槛与成本,有望重构视频创作产业;阿里Qwen-Image-2.0发布,图像生产再进化。此外,Qwen 3.5发布可期,字节除视频模型Seedance 2.0、图像模型Seedream 5.0外,还计划于2月发布新款大语言模型。

模型进步加速Agent与多模态应用落地

Agent可用性日渐增强,大模型从聊天转向协作。Claude Opus 4.5已能连续自主编程5小时。2024-2025年以来,AI编码智能体可处理任务时长每4个月翻倍,而2019-2024年增速仅为任务时长每7个月翻一倍。OpenClaw定位为个人AI *** ,拥有自我进化,学习新技能的能力,应用案例包括自动化处理邮件、阅读文档、编写代码、发布社交媒体内容及撰写报告等工作。多模态方面,Seedance2.0支持视频、音频、文本模态的多种组合输入,生成的视频运镜、分镜效果优秀,细节逼真,可大幅降低视频创作门槛与成本。

规模化应用拉动推理需求,看好AI Infra

早期大模型主要token开销来自于对话与图片生成,随着Agent以及视频生产走向大规模应用,大模型推理算力消耗或将快速提升。对于Agent执行,大模型需要反复进行多种思考、浏览多个网页,相较于对话场景的tokens消耗量大幅提升。同时,网页的浏览量增长带动 *** 浏览量增长,CDN服务可分摊内容方的源服务器压力、降低 *** 流量成本,有望受益于流量增长。

视频创作方面,生成一个5秒钟720P视频,可灵约4元人民币,Seedance约2.3元人民币,侧面反映算力开销较大,但相较于人工 *** 而言成本优势显著。AI在视频创作渗透率提升,同样有望带动算力需求。

相关标的

MiniMax-WP(00100)、智谱(02513)、云赛智联(600602.SH)、优刻得-W(688158.SH)、首都在线(300846.SZ)、青云科技-U(688316.SH)、网宿科技(300017.SZ)、南兴股份(002757.SZ)等。

风险提示

商业化落地不及预期、模型发布不及预期、竞争风险、政策不确定性。