DeepSeek R1 模型本地化部署教程 – 微音，微箱的网络科技

DeepSeek

DeepSeek（杭州深度求索人工智能基础技术研究有限公司），是一家专注于开发先进大语言模型（LLM）和相关技术的企业，主要业务为研究和试验发展。2023年7月17日，由知名量化资管巨头幻方量化创立，法定代表人是裴湉，公司位于浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室。自成立以来，DeepSeek发展迅速，在大模型领域成果颇丰。2024年1月5日，发布首个包含670亿参数的大模型DeepSeek LLM，其在2万亿token的数据集上训练，涵盖中英文，并开源供研究社区使用，在推理、编码等方面表现出色。同年5月，开源第二代MoE大模型DeepSeek-V2，该模型拥有2360亿参数，训练参数量达8.1万亿个token，展现出极高的训练效率，在中文综合能力上超越众多模型，与GPT-4-Turbo等闭源模型处于同一评测梯队。此后，9月升级推出DeepSeek V2.5；11月上线推理模型DeepSeek-R1-Lite预览版；12月开源模型DeepSeek-V3首个版本。进入2025年，1月20日正式发布DeepSeek-R1模型，在数学、代码等任务上性能比肩OpenAI o1正式版，并在1月24日国外大模型排名Arena上取得优异成绩，1月27日其应用在中国区及美区苹果App Store免费榜均占据首位。 DeepSeek的产品矩阵丰富，除上述模型外，还有DeepSeek Coder（一系列代码语言模型，在多种编程语言和基准测试中表现出色）、DeepSeekMath（基于DeepSeek-Coder-v1.5 7B预训练，在竞赛级MATH基准测试成绩优异）、DeepSeek-VL（开源视觉-语言模型，在视觉-语言基准测试表现突出）、DeepSeek-Coder-V2（开源MoE代码语言模型，在代码特定任务性能与GPT4-Turbo相当）等。这些模型凭借出色的性能、高效的训练以及广泛的应用场景，在大模型领域占据了重要地位，推动着人工智能技术的发展与应用。

DeepSeek-V3 的综合AI能力对比

能力维度	DeepSeek V3	DeepSeek V2.5	Qwen2.5	Llama3.1	Claude-3.5	GPT-4o
架构	MoE	MoE	Dense	Dense	–	–
激活参数数量	37B	21B	72B	405B	–	–
总参数数量	671B	236B	72B	405B	–	–
英文能力（MMLU（EM））	88.5	80.6	85.3	88.6	88.3	87.2
英文能力（MMLU-Redux（EM））	89.1	80.3	85.6	86.2	88.9	88.0
英文能力（MMLU-Pro（EM））	75.9	66.2	71.6	73.3	78.0	72.6
英文能力（DROP（3-shot F1））	91.6	87.8	76.7	88.7	88.3	83.7
英文能力（IF-Eval（Prompt Strict））	86.1	80.6	84.1	86.0	86.5	84.3
英文能力（GPQA-Diamond（Pass@1））	59.1	41.3	49.0	51.1	65.0	49.9
英文能力（SimpleQA（Correct））	24.9	10.2	9.1	17.1	28.4	38.2
英文能力（FRAMES（Acc.））	73.3	65.4	69.8	70.0	72.5	80.5
英文能力（LongBench v2（Acc.））	48.7	35.4	39.4	36.1	41.0	48.1
代码能力（HumanEval-Mul（Pass@1））	82.6	77.4	77.3	77.2	81.7	80.5
代码能力（LiveCodeBench（Pass@1-COT））	40.5	29.2	31.1	28.4	36.3	33.4
代码能力（LiveCodeBench（Pass@1））	37.6	28.4	28.7	30.1	32.8	34.2
代码能力（Codeforces（Percentile））	51.6	35.6	24.8	25.3	20.3	23.6
代码能力（SWE Verified（Resolved））	42.0	22.6	23.8	24.5	50.8	38.8
代码能力（Aider-Edit（Acc.））	79.7	71.6	65.4	63.9	84.2	72.9
代码能力（Aider-Polyglot（Acc.））	49.6	18.2	7.6	5.8	45.3	16.0
数学能力（AIME 2024（Pass@1））	39.2	16.7	23.3	23.3	16.0	9.3
数学能力（MATH-500（EM））	90.2	74.7	80.0	73.8	78.3	74.6
数学能力（CNMO 2024（Pass@1））	43.2	10.8	15.9	6.8	13.1	10.8
中文能力（CLUEWSC（EM））	90.9	90.4	91.4	84.7	85.4	87.9
中文能力（C-Eval（EM））	86.5	79.5	86.1	61.5	76.7	76.0
中文能力（C-SimpleQA（Correct））	64.1	54.1	48.4	50.4	51.3	59.3

DeepSeek 本地部署教程

Ollama 官网下载：https://ollama.com/

Page Assist – 本地 AI 模型的 Web UI：https://chromewebstore.google.com/detail/page-assist-%E6%9C%AC%E5%9C%B0-ai-%E6%A8%A1%E5%9E%8B%E7%9A%84-web/jfgfiigpkhlkbnfnbobbkinehhfdhndo

Ollama DeepSeek 安装命令

# 1.5B Qwen DeepSeek R1
ollama run deepseek-r1:1.5b

# 7B Qwen DeepSeek R1
ollama run deepseek-r1:7b

# 8B Llama DeepSeek R1
ollama run deepseek-r1:8b

# 14B Qwen DeepSeek R1
ollama run deepseek-r1:14b

# 32B Qwen DeepSeek R1
ollama run deepseek-r1:32b

# 70B Llama DeepSeek R1
ollama run deepseek-r1:70b

DeepSeek AI 模型下载：https://huggingface.co/deepseek-ai