
DeepSeek
DeepSeek 官网:https://www.deepseek.com/
DeepSeek(杭州深度求索人工智能基础技术研究有限公司),是一家专注于开发先进大语言模型(LLM)和相关技术的企业,主要业务为研究和试验发展。2023年7月17日,由知名量化资管巨头幻方量化创立,法定代表人是裴湉,公司位于浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室。 自成立以来,DeepSeek发展迅速,在大模型领域成果颇丰。2024年1月5日,发布首个包含670亿参数的大模型DeepSeek LLM,其在2万亿token的数据集上训练,涵盖中英文 ,并开源供研究社区使用,在推理、编码等方面表现出色。同年5月,开源第二代MoE大模型DeepSeek-V2,该模型拥有2360亿参数,训练参数量达8.1万亿个token,展现出极高的训练效率,在中文综合能力上超越众多模型,与GPT-4-Turbo等闭源模型处于同一评测梯队 。此后,9月升级推出DeepSeek V2.5;11月上线推理模型DeepSeek-R1-Lite预览版;12月开源模型DeepSeek-V3首个版本。进入2025年,1月20日正式发布DeepSeek-R1模型,在数学、代码等任务上性能比肩OpenAI o1正式版 ,并在1月24日国外大模型排名Arena上取得优异成绩,1月27日其应用在中国区及美区苹果App Store免费榜均占据首位。 DeepSeek的产品矩阵丰富,除上述模型外,还有DeepSeek Coder(一系列代码语言模型,在多种编程语言和基准测试中表现出色) 、DeepSeekMath(基于DeepSeek-Coder-v1.5 7B预训练,在竞赛级MATH基准测试成绩优异)、DeepSeek-VL(开源视觉-语言模型,在视觉-语言基准测试表现突出) 、DeepSeek-Coder-V2(开源MoE代码语言模型,在代码特定任务性能与GPT4-Turbo相当)等。这些模型凭借出色的性能、高效的训练以及广泛的应用场景,在大模型领域占据了重要地位,推动着人工智能技术的发展与应用。
DeepSeek-V3 的综合AI能力对比
能力维度 | DeepSeek V3 | DeepSeek V2.5 | Qwen2.5 | Llama3.1 | Claude-3.5 | GPT-4o |
---|---|---|---|---|---|---|
架构 | MoE | MoE | Dense | Dense | – | – |
激活参数数量 | 37B | 21B | 72B | 405B | – | – |
总参数数量 | 671B | 236B | 72B | 405B | – | – |
英文能力(MMLU(EM)) | 88.5 | 80.6 | 85.3 | 88.6 | 88.3 | 87.2 |
英文能力(MMLU-Redux(EM)) | 89.1 | 80.3 | 85.6 | 86.2 | 88.9 | 88.0 |
英文能力(MMLU-Pro(EM)) | 75.9 | 66.2 | 71.6 | 73.3 | 78.0 | 72.6 |
英文能力(DROP(3-shot F1)) | 91.6 | 87.8 | 76.7 | 88.7 | 88.3 | 83.7 |
英文能力(IF-Eval(Prompt Strict)) | 86.1 | 80.6 | 84.1 | 86.0 | 86.5 | 84.3 |
英文能力(GPQA-Diamond(Pass@1)) | 59.1 | 41.3 | 49.0 | 51.1 | 65.0 | 49.9 |
英文能力(SimpleQA(Correct)) | 24.9 | 10.2 | 9.1 | 17.1 | 28.4 | 38.2 |
英文能力(FRAMES(Acc.)) | 73.3 | 65.4 | 69.8 | 70.0 | 72.5 | 80.5 |
英文能力(LongBench v2(Acc.)) | 48.7 | 35.4 | 39.4 | 36.1 | 41.0 | 48.1 |
代码能力(HumanEval-Mul(Pass@1)) | 82.6 | 77.4 | 77.3 | 77.2 | 81.7 | 80.5 |
代码能力(LiveCodeBench(Pass@1-COT)) | 40.5 | 29.2 | 31.1 | 28.4 | 36.3 | 33.4 |
代码能力(LiveCodeBench(Pass@1)) | 37.6 | 28.4 | 28.7 | 30.1 | 32.8 | 34.2 |
代码能力(Codeforces(Percentile)) | 51.6 | 35.6 | 24.8 | 25.3 | 20.3 | 23.6 |
代码能力(SWE Verified(Resolved)) | 42.0 | 22.6 | 23.8 | 24.5 | 50.8 | 38.8 |
代码能力(Aider-Edit(Acc.)) | 79.7 | 71.6 | 65.4 | 63.9 | 84.2 | 72.9 |
代码能力(Aider-Polyglot(Acc.)) | 49.6 | 18.2 | 7.6 | 5.8 | 45.3 | 16.0 |
数学能力(AIME 2024(Pass@1)) | 39.2 | 16.7 | 23.3 | 23.3 | 16.0 | 9.3 |
数学能力(MATH-500(EM)) | 90.2 | 74.7 | 80.0 | 73.8 | 78.3 | 74.6 |
数学能力(CNMO 2024(Pass@1)) | 43.2 | 10.8 | 15.9 | 6.8 | 13.1 | 10.8 |
中文能力(CLUEWSC(EM)) | 90.9 | 90.4 | 91.4 | 84.7 | 85.4 | 87.9 |
中文能力(C-Eval(EM)) | 86.5 | 79.5 | 86.1 | 61.5 | 76.7 | 76.0 |
中文能力(C-SimpleQA(Correct)) | 64.1 | 54.1 | 48.4 | 50.4 | 51.3 | 59.3 |
DeepSeek 本地部署教程
Ollama 官网下载:https://ollama.com/
Page Assist – 本地 AI 模型的 Web UI:https://chromewebstore.google.com/detail/page-assist-%E6%9C%AC%E5%9C%B0-ai-%E6%A8%A1%E5%9E%8B%E7%9A%84-web/jfgfiigpkhlkbnfnbobbkinehhfdhndo
Ollama DeepSeek 安装命令
# 1.5B Qwen DeepSeek R1
ollama run deepseek-r1:1.5b
# 7B Qwen DeepSeek R1
ollama run deepseek-r1:7b
# 8B Llama DeepSeek R1
ollama run deepseek-r1:8b
# 14B Qwen DeepSeek R1
ollama run deepseek-r1:14b
# 32B Qwen DeepSeek R1
ollama run deepseek-r1:32b
# 70B Llama DeepSeek R1
ollama run deepseek-r1:70b
DeepSeek AI 模型下载:https://huggingface.co/deepseek-ai