中山广播电视台-浙商证券：近期国产大模型密集发布规模化应用拉动推理需求

智通财经APP获悉，浙商证券发布研报称，近期国产大模型密集发布，DeepSeek新模型进行灰度测试，拥有1M(100万tokens)的上下文处理能力(此前最多128K)；GLM-5于智谱官网上线，主打编程与智能体提升。当前Agent可用性日渐增强，大模型从聊天转向协作，多模态方面，Seedance2.0可大幅降低视频创作门槛与成本。早期大模型主要token开销来自于对话与图片生成，随着Agent以及视频生产走向大规模应用，大模型推理算力消耗或将快速提升。

浙商证券主要观点如下：

春节前后国产模型密集发布，AI军备竞赛开启

近期国产大模型密集发布：DeepSeek新模型进行灰度测试，拥有1M(100万tokens)的上下文处理能力(此前最多128K)；GLM-5于智谱官网上线，主打编程与智能体提升， *** 编程测试结果位列全球之一，领先Claude 2月发布的最新模型Claude Opus 4.6；MiniMax新模型MiniMax M2.5已在海外MiniMax Agent产品进行内测；字节发布Seedance 2.0，大幅降低视频创作门槛与成本，有望重构视频创作产业；阿里Qwen-Image-2.0发布，图像生产再进化。此外，Qwen 3.5发布可期，字节除视频模型Seedance 2.0、图像模型Seedream 5.0外，还计划于2月发布新款大语言模型。

模型进步加速Agent与多模态应用落地

Agent可用性日渐增强，大模型从聊天转向协作。Claude Opus 4.5已能连续自主编程5小时。2024-2025年以来，AI编码智能体可处理任务时长每4个月翻倍，而2019-2024年增速仅为任务时长每7个月翻一倍。OpenClaw定位为个人AI *** ，拥有自我进化，学习新技能的能力，应用案例包括自动化处理邮件、阅读文档、编写代码、发布社交媒体内容及撰写报告等工作。多模态方面，Seedance2.0支持视频、音频、文本模态的多种组合输入，生成的视频运镜、分镜效果优秀，细节逼真，可大幅降低视频创作门槛与成本。

规模化应用拉动推理需求，看好AI Infra

早期大模型主要token开销来自于对话与图片生成，随着Agent以及视频生产走向大规模应用，大模型推理算力消耗或将快速提升。对于Agent执行，大模型需要反复进行多种思考、浏览多个网页，相较于对话场景的tokens消耗量大幅提升。同时，网页的浏览量增长带动 *** 浏览量增长，CDN服务可分摊内容方的源服务器压力、降低 *** 流量成本，有望受益于流量增长。

视频创作方面，生成一个5秒钟720P视频，可灵约4元人民币，Seedance约2.3元人民币，侧面反映算力开销较大，但相较于人工 *** 而言成本优势显著。AI在视频创作渗透率提升，同样有望带动算力需求。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

浙商证券：近期国产大模型密集发布规模化应用拉动推理需求

相关推荐：

网站分类

catalog