DeepSeek 介绍
DeepSeek是一家专注于**通用人工智能(AGI)**技术研发的中国公司,成立于2023年,致力于通过底层技术突破推动AGI发展与应用。面向企业提供个性化模型训练,应用于金融、医疗、教育等领域的智能分析和决策支持。使用Python示例(需安装。通过在API请求中添加。
·
DeepSeek是什么
DeepSeek(深度求索) 是一家专注于**通用人工智能(AGI)**技术研发的中国公司,成立于2023年,致力于通过底层技术突破推动AGI发展与应用。
核心产品与技术特点:
-
大语言模型系列
开发了如 DeepSeek-R1、DeepSeek v2 等模型,特点包括:- 长上下文处理:支持高达128K tokens的文本理解(如文档分析、长对话)。
- 搜索增强生成(Search-Augmented Generation):通过实时信息检索减少模型“幻觉”(生成错误信息)。
- 架构创新:部分模型采用MoE(混合专家)技术,提升响应速度与准确性。
-
行业定制化解决方案
面向企业提供个性化模型训练,应用于金融、医疗、教育等领域的智能分析和决策支持。 -
技术优势
- 强调在复杂逻辑推理和多模态交互(如文本与代码结合)的优化。
- 部分模型支持API接口开放,便于开发者集成。
DeepSeek的使用
1. 基本使用方式
① 通过API调用(以聊天模型为例)
- 适用场景:开发者在代码中集成DeepSeek模型。
- 步骤:
-
注册账户
访问 DeepSeek开放平台,注册账号并获取 API Key。 -
调用REST API
使用Python示例(需安装requests
库):import requests API_KEY = "YOUR_API_KEY" url = "https://api.deepseek.com/v1/chat/completions" headers = { "Authorization": f"Bearer {API_KEY}", "Content-Type": "application/json" } data = { "model": "deepseek-chat", # 指定模型类型 "messages": [ {"role": "user", "content": "帮我写一篇关于AI未来的短文"} ], "temperature": 0.7, # 控制生成随机性(0~1) "max_tokens": 1000 # 限制生成文本长度 } response = requests.post(url, json=data, headers=headers) print(response.json()['choices'][0]['message']['content'])
-
② 通过开放平台直接体验
- 适用场景:快速测试模型效果,无需编程。
- 步骤:
- 访问 DeepSeek官网,登录账号。
- 选择对应的模型(如 DeepSeek-R1 或 DeepSeek v2),直接在网页对话框输入问题交互。
2. 进阶功能
① 搜索增强生成(SAG)
通过在API请求中添加 search_query
参数,启用实时信息检索:
data = {
"model": "deepseek-r1-lite",
"messages": [{"role": "user", "content": "2024年奥运会举办地在哪里?"}],
"search_query": "2024年奥运会举办地" # 触发搜索增强回答
}
② 长上下文处理
对于需要长文本分析的场景(如文档分析),直接传入完整内容:
long_text = "这里放入你的长文档..."
data = {
"model": "deepseek-v2",
"messages": [{"role": "user", "content": f"总结以下文档的核心观点:\n{long_text}"}],
}
更多推荐
所有评论(0)