亚马逊AWS官方博客
大模型推理有妙招:HAQM SageMaker 让你事半功倍,伸缩自如
本文将以 Llama3 模型为例,介绍如何在 HAQM SageMaker 便捷地进行模型推理,并根据设定的伸缩策略进行自动扩缩,以应对不同的工作负载需求。
推云揽竞 – 借力竞价实例(Spot), 提升大语言模型云端推理效能
LLM 的推理过程需要强大的算力包括显存资源,这使得在现代硬件平台上高效服务这些模型变得极具挑战性。通过使用 Spot 实例, 在维持高性能的同时能显著降低大语言模型的推理成本。
量入为出,借助 headless 集群构建 HAQM Aurora 全球数据库,实现高性价比的跨区域容灾
在本博客中,我们将探讨使用 HAQM Aurora Global Database Headless(全球数据库无头集群)作为数据库跨区域方案的一部分所带来的好处,以及如何实现跨区域灾难恢复。
云中的 Windows,怎么解决蓝屏?
浏览本文需要约 5 分钟,建议按照章节分段阅读。 前言 2024 年 7 月 19 日的 Windows 操作 […]
基于 HAQM Connect、Lex 和 Bedrock 打造智能客户问答方案
HAQM Connect 是一种基于云的联络中心服务,旨在帮助企业提供更灵活、更高效的客户支持。通过集成多种通信渠道和自动化工具,HAQM Connect 能够显著提升客户体验和业务效率。某客户前期已经使用 HAQM Connect 在工作时间为其终端用户提供人工电话咨询服务。为了在非工作时间为终端用户提供自动化问答服务,我们将 HAQM Lex 和 HAQM Bedrock 与现有知识库结合起来,借助大型语言模型,为客户构建一个自动化的问答方案。
为在 AWS Private CA 中托管的 Matter CA 开启 CRL
本文介绍了如何为托管在 HAQM Private CA 中的 CA 来开启符合 Matter 标准的证书吊销列表(CRL),以及如何使用 AWS CLI 来执行证书吊销和使用 Openssl 工具来查验证书吊销列表中的内容。
亚马逊云科技服务之安全巡检及优化
AWS 高级合作伙伴伊克罗德在服务客户的过程中,可以及时帮助客户巡检 AWS 上的资源状况和相应资源利用情况,以便对账号内安全合规、成本使用、资源利用率等情况进行巡检查看,以给出优化建议。
基于 Route53 实现 AWS PrivateLink 高可用架构
本文提出了一种 PrivateLink 高可用/负载均衡方案,通过 Route53 cname 配置多值应答或者权重路由的方式,将多个 PrivateLink 和后端服务组成高可用集群,以达成高可用/负载均衡的目标。
CloudFront AWS 骨干网就近回源和特殊头处理方案
本文将介绍一种通过结合使用 AWS CloudFront、Application Load Balancer (ALB)、Auto Scaling 和 Nginx 来实现全球性高性能源站加速的解决方案。
利用 HAQM Bedrock,3 步低代码构建 AI 股票分析助手
在当今快节奏的金融市场中,投资者需要实时获取并分析大量信息,以做出明智的投资决策。传统的分析方式需要大量的代码工作,也对人员的技术代码能力有一定的要求。通过利用 HAQM Bedrock 的 Agents 功能,我们可以低代码构建 AI 驱动的股票分析助手,帮助投资者快速高效地分析股票。