DeepSeek 使用指南
DeepSeek 是由杭州深度求索人工智能基础技术研究有限公司开发的系列大模型。
DeepSeek 使用指南
DeepSeek(深度求索)是目前国产大模型中的佼佼者,以其强大的推理能力、优秀的编码水平以及极高的性价比著称。DeepSeek-V3 更是被公认为达到 GPT-4 级别的开源模型。
1. DeepSeek 简介
DeepSeek 是由杭州深度求索人工智能基础技术研究有限公司开发的系列大模型。
- 核心优势:
- 强大的编码能力:DeepSeek-Coder 在代码生成任务上表现极其出色。
- 数学与逻辑推理:DeepSeek-V3 在数学竞赛级问题上表现亮眼。
- 极致性价比:API 价格极低(约为 GPT-4o 的 1/10 甚至更低)。
- 开源精神:核心模型权重完全开源。
2. 主要模型介绍
| 模型名称 | 说明 | 适用场景 |
|---|---|---|
| DeepSeek-V3 | 最新旗舰模型 (MoE 架构) | 通用对话、复杂推理、创意写作 |
| DeepSeek-R1 | (预览版) 主打深度思考与推理 | 复杂的数学证明、逻辑分析 |
| DeepSeek-Coder-V2 | 专为代码优化的模型 | 代码生成、Bug 修复、代码解释 |
3. 如何使用 DeepSeek
3.1 网页版(Web Chat)
最简单的使用方式,直接访问官网:chat.deepseek.com
- 支持文件上传分析
- 支持联网搜索
- 可以在设置中开启“深度思考 (DeepThink)”模式(类似 OpenAI o1)
3.2 API 接入(开发者推荐)
DeepSeek 的 API 完全兼容 OpenAI 格式,这意味着你可以直接在大多数支持 OpenAI 的软件中(如 Cursor, NextChat, One API)使用 DeepSeek。
接入步骤:
- 访问 DeepSeek 开放平台。
- 注册账号并创建 API Key。
- 配置参数:
- Base URL:
https://api.deepseek.com - Model:
deepseek-chat(对应 V3) 或deepseek-coder
- Base URL:
Python 调用示例:
from openai import OpenAI
client = OpenAI(
api_key="<YOUR_DEEPSEEK_API_KEY>",
base_url="https://api.deepseek.com"
)
response = client.chat.completions.create(
model="deepseek-chat",
messages=[
{"role": "system", "content": "你是一个乐于助人的助手"},
{"role": "user", "content": "你好,请介绍一下你自己"}
],
stream=False
)
print(response.choices[0].message.content)
3.3 本地部署 (Ollama)
由于 DeepSeek 开源了权重,你可以轻松在本地运行它(需根据显存选择不同量化版本)。
# 运行 7B 版本 (适合 8G 显存)
ollama run deepseek-r1:7b
# 运行 V3 版本 (需要较大显存或内存,通常推荐 7B/8B 或 32B 量化版)
# DeepSeek V3 完整版参数巨大 (671B),本地通常无法完整运行,建议使用蒸馏版或较小参数版本
ollama run deepseek-coder-v2
4. 最佳实践技巧
-
开启提示词缓存 (Prompt Caching): DeepSeek API 支持硬盘缓存技术,对于长文档分析或重复的上下文,开启缓存可以大幅降低成本并提升速度。
-
利用 FIM (Fill-In-the-Middle): 在代码补全场景,DeepSeek 支持中间补全模式,能根据光标前后的代码推断中间内容。
-
复杂任务使用 Chain of Thought: 对于数学或逻辑题,明确要求模型“请一步步思考”,能显著提升准确率。
5. 常见问题
-
Q: DeepSeek 是免费的吗?
- A: 网页版目前免费使用。API 需要付费,但价格极其低廉(输入 1元/百万 Tokens,输出 2元/百万 Tokens - 价格仅供参考,以官网为准)。
-
Q: DeepSeek 支持多模态(识图)吗?
- A: 目前主力模型主要专注于文本和代码,多模态能力正在逐步完善中(建议关注 DeepSeek-VL)。
最后更新:2025-12