最强开源模型 DeepSeek V4 发布，1M上下文，运行成本大降 – 小众软件

DeepSeek V4 终于发布了，带来了 1M 上下文，代码能力明显提升，推理进入第一梯队，但知识类能力仍落后于头部闭源模型。

最重要的是：「DeepSeek-V4 开创了一种全新的注意力机制，在 token 维度进行压缩，结合 DSA 稀疏注意力（DeepSeek Sparse Attention），实现了全球领先的长上下文能力，并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始，1M（一百万）上下文将是 DeepSeek 所有官方服务的标配。」

算力需求比 V3.2 降低 3～10 倍

右侧显示，单 token 计算量（FLOPs）对比：

V4-Pro 比 V3.2 降低 3.7 倍
V4-Flash 比 V3.2 降低 9.8 倍

也就是说，同样的显卡和显存，可以处理更多的请求了（利好大模型提供商）

与同行对比

指标	GPT-5.4	Claude Opus 4.6	Gemini 3.1 Pro	DeepSeek V4 Pro-Max
MMLU-Pro	87.5	89.1	91.0	87.5
SimpleQA	45.3	46.2	75.6	57.9
GPQA Diamond	93.0	91.3	94.3	90.1
HLE	39.8	40.0	44.4	37.7
LiveCodeBench	–	88.8	91.7	93.5
Codeforces	3168	–	3052	3206
Apex Shortlist	78.1	85.9	89.1	90.2

另外，今天更新了 GPT-5.5，也是同一天啊，ChatGPT 中已经可用。

降价了吗？

降了，也没降：

模型	输入（缓存命中）	输入（未命中）	输出	上下文
V3.2	0.2 元	2 元	3 元	128K
V4 Flash	0.2 元	1 元	2 元	1M
V4 Pro	1 元	12 元	24 元	1M

V4 Flash 降价，V4 Pro 全面涨价。

值不值？

V4 Pro 比 V3.2 贵了这么多，值不值：

类别	指标	V3.2	V4-Pro	提升情况（Pro）
知识	MMLU-Pro	65.5	73.5	↑ +8.0
知识	C-Eval	90.4	93.1	↑ +2.7
知识	MultiLoKo	38.7	51.1	↑↑ +12.4
事实问答	SimpleQA	28.3	55.2	↑↑ +26.9
事实问答	FACTS	27.1	62.6	↑↑ +35.5
推理	BBH	87.6	87.5	≈
推理	HellaSwag	86.4	88.0	↑ +1.6
推理	WinoGrande	78.9	81.5	↑ +2.6
代码	HumanEval	62.8	76.8	↑↑ +14.0
数学	MATH	60.5	64.5	↑ +4.0
数学	GSM8K	91.1	92.6	↑ +1.5
长上下文	LongBench-V2	40.2	51.5	↑↑ +11.3

现在就能用啦

目前 DeepSeek 官网以及 API 都上线了 V4。

原文：https://www.appinn.com/deepseek-v4/

能自己部署吗？

应该是不能的，Flash 最低也要200GB内存往上了。

#最强开源模型 #DeepSeek #发布1M上下文运行成本大降 #小众软件

最强开源模型 DeepSeek V4 发布，1M上下文，运行成本大降 – 小众软件

算力需求比 V3.2 降低 3～10 倍

与同行对比

降价了吗？

值不值？

现在就能用啦

能自己部署吗？

Ubuntu 26.04 LTS 发布，支持到 2041 年，附升级方法

本周赛博领鸡蛋：4.24~4.30 – 小众软件

又是 npm 包投毒，密码管理器 Bitwarden CLI 中招（放心：本体安全）

发表回复取消回复

现在看清了：AI不是平权，它是资本和劳动力的最后一战。越有钱跑得越快

印度教授：美欧单边主义削弱G20，金砖国家正崛起 – 2026年4月25日, 世界报道

别给好生意打工，要当好生意的股东

证监会出手，中能粮科违规擅自到纳斯达克发行上市，被重罚，公司在美上市当天就被停牌

为什么创业板这么强？还能买吗？

Video Poker Plan Tasarımında Anahtar Jacks or Better Popülarite Elde Etme

Searching for the forgotten heroes of World War Two

‘Somebody threatened to burn the school down’

Trump-Putin: Your toolkit to help understand the story

Business booming for giant cargo planes

王毅分别会见阿联酋总统中国事务特使、日本国际贸易促进协会会长

联合国：袭击试图获取食物援助的加沙平民的行径“令人发指”

韩国总统李在明正式宣誓就职

俄侦查委员会：俄两座桥梁被炸系乌克兰所为

第五届“中菲相知奖”颁奖仪式在马尼拉成功举行

你感兴趣的其他新闻

现在看清了：AI不是平权，它是资本和劳动力的最后一战。越有钱跑得越快

印度教授：美欧单边主义削弱G20，金砖国家正崛起 – 2026年4月25日, 世界报道

别给好生意打工，要当好生意的股东

证监会出手，中能粮科违规擅自到纳斯达克发行上市，被重罚，公司在美上市当天就被停牌

为什么创业板这么强？还能买吗？

最新文章

图库

算力需求比 V3.2 降低 3～10 倍

与同行对比

降价了吗？

值不值？

现在就能用啦

能自己部署吗？

阅读更多相关

发表回复 取消回复

你感兴趣的其他新闻

标签云

最新文章

图库

发表回复取消回复