随想279 DeepSeek降价带来的“洗牌”
<![CDATA[
今天港股不开盘,可以验证的内容少了很多,包括规范券商的跨境经营行动,包括DS降价对其他大模型的影响。
前者周末各大论坛里讨论了个热火朝天,几个主要涉及的券商持仓规模、持仓品种、多空博弈都有分析,只可惜今天不能通过具体走势验证下各种推测;后者相对讨论得少些,这次DS降价的是其主力模型,DeepSeek-V4-Pro,在Agentic Coding评测中已达开源模型最佳水平,在数学、STEM、竞赛型代码测评中超越所有开源模型,仅稍逊于几个顶尖的闭源模型。
永久降价之后,V4-Pro的价格极具竞争力,每百万Tokens输入(缓存命中)0.025元,输入(缓存未命中)3元,输出6元,创全球大模型价格新低,成本仅有国际同级别模型的不到1/10;除了降价以外,DeepSeek也提供了更轻量的V4 Flash,它速度快、成本低,适合对成本敏感的开发场景,在openrouter的模型ranking里,V4 Flash也超过了此前霸榜的的hy3 preview,登顶用量第一。
看了下相关报道,DS此次降价的底气,是通过核心技术创新降低了服务成本,一是采用了稀疏注意力架构,使其V4-Pro版的单Token算力仅为前代V3.2的27%,KV缓存也降至10%,大幅提高了效率;二是算力的突破,随着华为昇腾950芯片的大规模部署,DS突破了以往高端算力不足的瓶颈,充足的算力资源为服务提速和降价提供了物质基础,使其API并发能力提升至默认500,可满足绝大多数应用场景。
这次降价,充分显示了DS的“野心”,以更具竞争力的姿态吸引全球的开发者,用价格优势换取用户规模和生态的繁荣。而作为国内“最好用”的大模型之一,DS主力大模型的降价对整个行业和硬件产业链都会产生影响,大模型的竞争已经从单纯的模型能力比拼,转向了模型、芯片、工程系统和商业组织的综合体系竞争。
AI市场正分裂为两条路径,一条是像Anthropic那样,以高价值的企业合同为基础;另一条则是DS所追求的,依靠技术极致优化带来的规模效应,未来的市场上可能容不下所有玩家,无法在成本或价值上建立壁垒的都将不同程度地面临挑战。
而DS的进一步降价,也是依托在昇腾950超节点的规模化部署上,这也有力证明了中国AI产业正朝着“国产算力 + 国产大模型”的闭环生态迈进。
流水不争先,争的是滔滔不绝。
@今日话题 @雪球创作者中心 $中国巨石(SH600176)$
本话题在雪球有34条讨论,点击查看。
雪球是一个投资者的社交网络,聪明的投资者都在这里。
点击下载雪球手机客户端 http://xueqiu.com/xz]]>
#随想279 #DeepSeek降价带来的洗牌