亚马逊AWS官方博客
DeepSeek-R1 现已在 HAQM Bedrock 中作为完全托管的无服务器模型推出
自 1 月 30 日起,DeepSeek-R1 模型通过 HAQM Bedrock Marketplace 和 HAQM Bedrock Custom Model Import 在 HAQM Bedrock 推出。从那时起,成千上万的客户在 HAQM Bedrock 中部署了这一模型。客户非常重视用于安全人工智能部署的坚固 Guardrails 和全面的工具支持。今天,我们通过扩大选项范围,包括新的无服务器解决方案,使得在 HAQM Bedrock 中使用 DeepSeek 变得更加便捷。
完全托管的 DeepSeek-R1 模型现已在 HAQM Bedrock 上正式推出。HAQM Web Services (AWS) 是首家提供完全托管通用模型 DeepSeek-R1 的云服务提供商 (CSP)。通过 AWS 上的 DeepSeek,您可以加速创新并实现切实的业务价值,而无需应对基础设施管理的复杂性。您可以通过 HAQM Bedrock 的完全托管服务,使用单个 API 来利用 DeepSeek-R1 的强大功能,为生成式 AI 应用程序提供支持,并从中获得丰富的功能和工具优势。
DeepSeek 表示,他们的模型根据 MIT 许可证公开发布,具备强大的推理、编码和自然语言理解能力。这些功能为智能决策支持、软件开发、数学问题解决、科学分析、数据洞察以及全面的知识管理系统提供了坚实的基础。
与所有人工智能解决方案一样,在生产环境中实施时,需仔细考虑数据隐私要求,检查输出是否存在偏差,并持续监控结果。在实施 DeepSeek-R1 等公开模型时,请注意以下几点:
- 数据安全 – 您可以利用 HAQM Bedrock 的企业级安全、监控和成本控制功能,这些功能对于负责任地大规模部署人工智能至关重要,同时确保您对数据保持完全控制。用户的输入和模型输出不会与任何模型提供者共享。默认情况下,您可以启用一系列关键安全功能,包括静态和传输中的数据加密、细粒度的访问控制、安全的连接选项,以及在与 HAQM Bedrock 中的 DeepSeek-R1 模型通信时下载各种合规性认证。
- 负责任的人工智能 – 您可以根据应用程序需求和负责任的人工智能政策,使用 HAQM Bedrock Guardrails 实施定制化的安全措施。这包括内容过滤、敏感信息筛选和可定制的安全控制等关键功能,结合上下文基准和自动推理检查功能,有效防止模型生成幻觉内容。这意味着,您可以通过定义策略集,在生成式人工智能应用中过滤不良和有害内容,从而控制用户与 Bedrock 中的 DeepSeek-R1 模型之间的交互。
- 模型评测 – 您可以使用 HAQM Bedrock 模型评测工具,通过自动或人工评测的方式,在几个简单步骤中对模型进行评测和比较,从而确定最适合您应用场景的模型,包括 DeepSeek-R1。您可以选择使用包含准确性、稳定性和恶意内容等预定义指标的自动评测。或者,对于相关性、风格和与品牌声音的一致性等主观或自定义指标,您可以选择人工评测工作流程。模型评测提供内置的精选数据集,或者您可以引入自己的数据集。
我们强烈建议将 HAQM Bedrock Guardrails 与 DeepSeek-R1 模型集成,并利用 HAQM Bedrock 模型评测功能,为您的生成式 AI 应用提供强大的保护。如需了解更多信息,请访问使用 HAQM Bedrock Guardrails 保护您的 DeepSeek 模型部署和评估 HAQM Bedrock 资源的性能。
开始使用 HAQM Bedrock 中的 DeepSeek-R1 模型
如果您不熟悉使用 DeepSeek-R1 模型,请转到 HAQM Bedrock 管理控制台,在左侧导航窗格的 Bedrock 配置下选择模型访问。要访问完全托管的 DeepSeek-R1 模型,请先在 DeepSeek 中申请 DeepSeek-R1 的访问权限。然后,您将获得在 HAQM Bedrock 中访问该模型的权限。
![]() |
接下来,要在 HAQM Bedrock 中测试 DeepSeek-R1 模型,请在左侧菜单窗格的 Playgrounds 下选择 聊天/文本。然后在左上角选择选择模型,在类别中选择 DeepSeek,在模型中选择 DeepSeek-R1。选择应用。
![]() |
我使用选定的 DeepSeek-R1 模型,运行了以下提示示例:
某个家庭有 5000 美元的存款,用于明年度假。他们可以将这笔钱存入年利率为 2% 的储蓄账户,也可以存入年利率为 4% 的定期存单,但在度假前不能动用这笔资金。如果他们在这一年中需要 1000 美元用于应急开支,他们应该如何在两种方案之间分配资金,以最大限度地利用他们的假期奖金?
这个提示需要复杂的思维链推理,并能够生成非常精确的结果。
![]() |
要了解更多关于提示的使用建议,请参阅 DeepSeek-R1 模型在其 GitHub 存储库中的自述文件。
您还可以选择查看 API 请求,使用 AWS 命令行界面(AWS CLI)和 AWS SDK 中的代码示例访问模型。您可以使用 deepseek.r1-v1:0
作为模型 ID。
以下是 AWS CLI 命令的示例:
aws bedrock-runtime invoke-model \
--model-id us.deepseek-r1-v1:0 \
--body "{\"messages\":[{\"role\":\"user\",\"content\":[{\"type\":\"text\",\"text\":\"[n\"}]}],max_tokens\":2000,\"temperature\":0.6,\"top_k\":250,\"top_p\":0.9,\"stop_sequences\":[\"\\n\\nHuman:\"]}" \
--cli-binary-format raw-in-base64-out \
--region us-west-2 \
invoke-model-output.txt
该模型同时支持 InvokeModel
和 Converse
API。以下 Python 代码示例展示了如何使用 HAQM Bedrock Converse API 向 DeepSeek-R1 模型发送文本消息来生成文本。
import boto3
from botocore.exceptions import ClientError
# 在您要使用的 AWS 区域中创建 Bedrock 运行时客户端。
client = boto3.client("bedrock-runtime", region_name="us-west-2")
# 设置模型 ID,例如 Llama 3 8b Instruct。
model_id = "deepseek.r1-v1:0"
# 使用用户消息开始对话。
user_message = "Describe the purpose of a 'hello world' program in one line."
conversation = [
{
"role": "user",
"content": [{"text": user_message}],
}
]
try:
# 使用基本推理配置将消息发送到模型。
response = client.converse(
modelId=model_id,
messages=conversation,
inferenceConfig={"maxTokens": 2000, "temperature": 0.6, "topP": 0.9},
)
# 提取并打印响应文本。
response_text = response["output"]["message"]["content"][0]["text"]
print(response_text)
except (ClientError, Exception) as e:
print(f"ERROR: Can't invoke '{model_id}'.Reason: {e}")
exit(1)
要在 DeepSeek-R1 模型上启用 HAQM Bedrock Guardrails,请在左侧导航窗格的安全措施下选择 Guardrails,然后根据需要配置任意数量的过滤器来创建 Guardrails。例如,如果您设置了过滤“政治”一词的规则,Guardrails 会在提示中识别出该词,并向您显示被屏蔽的消息。
![]() |
您可以通过不同的输入来评测 Guardrails,以评估 Guardrails 的性能。您可以通过设置拒绝主题、字词过滤器、敏感信息过滤器和屏蔽消息来完善 Guardrails,直到符合您的需求。
要了解有关 HAQM Bedrock Guardrails 的更多信息,请访问 AWS 文档中使用 HAQM Bedrock Guardrails 阻止模型中的有害内容,或访问 AWS 机器学习频道上有关 HAQM Bedrock Guardrails 的其他深度博客文章。
现已推出
DeepSeek-R1 现已支持跨区域推理,并可在以下 AWS 区域的 HAQM Bedrock 中进行完全托管:美国东部(弗吉尼亚州北部)、美国东部(俄亥俄州)和美国西部(俄勒冈州)。查看完整区域列表以了解将来的更新。要了解更多信息,请访问 HAQM Bedrock 中的 DeepSeek 产品页面以及 HAQM Bedrock 定价页面。
立即在 HAQM Bedrock 控制台中试用 DeepSeek-R1 模型,并将反馈发送至 AWS re:Post for HAQM Bedrock 或通过您常用的 AWS Support 联系方式发送。
– Channy
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。