亚马逊AWS官方博客
利用 Apache Celeborn 减少 AWS EMR 集群中 Spot 实例回收导致的重算成本
Celeborn 是一个开源的实现 Remote Shuffle 的工具。通过为 EMR 部署 Celeborn 服务,可以将 Spark 计算的中间结果从采用 Spot 实例的 EMR 集群节点中分离存储,实现 shuffle 数据的存算分离,有效减少了 Spot 实例回收导致的重算成本。
垂直电商图像搜索再升级:DINO 模型带来精准匹配体验
本文通过使用服装鞋类商品进行模型训练,同时通过 GroundingDINO 进行目标物品检测和剪切的方式对图片进行搜索,这种方式满足企业级的,特别是垂直行业的高精度搜索。有助于更好地提升用户的搜索体验。 该方案也可以拓展到其他的垂直行业使用,如电商、游戏、短视频,医疗、制造业等。
摆脱 GPU 资源束缚,HAQM Inf2 让大模型推理更高效
亚马逊自研芯片 inf2 与 vLLM 助力企业高效部署大型语言模型。
Direct Connect 零中断切换方案
Direct Connect 零中断切换方案,在实现 DX 扩容时无缝替换,在类似场景,例如专线更换、专线扩容替换、VGW 替换、TGW 替换等需求下,均可采用相同思路。
HAQM DocumentDB 之中文检索
通过 HAQM DocumentDB 与开源组件的集成,增强了 DocumentDB 中的中文检索能力
HAQM Lambda 函数配置动态更新方案分析
本文将在“从 HAQM Lambda 主动向配置中心查询配置”的基础上,分析不同配置更新方案的优缺点,以便您在架构设计时进行选择。
利用 HAQM Elastic Kubernetes Service(HAQM EKS)打造弹性 StarRocks 集群
介绍如何利用 Elastic Kubernetes Service(EKS)打造弹性 StarRocks 集群,以及 StarRorks 在亚马逊云上的部署优势。
基于 HAQM Bedrock 构建端到端实时语音助手
本文使用 HAQM Bedrock、Transcribe 和 Polly,结合开源 ASTRA 框架,开发了一个高效的实时语音助手,并提供常规聊天及同声传译两个工作模式。
使用 HAQM WAF 和 HAQM CloudFront 保护您的生成式 AI 应用
Architect defense-in-depth security for generative AI applications using the OWASP Top 10 for LLMs 介绍了如何多层级地对 GenAI 应用程序进行安全加固。本文将针对其中的 Network & Edge Protection 层级做进一步的展开,介绍如何使用 HAQM WAF 和 HAQM CloudFront 保护您的 GenAI 应用。
亚马逊云科技助力光伏企业生成式 BI 落地的实践探索
我们为一家光伏企业开发了基于生成式 AI 技术的商业智能工具,该工具极大提高了数据使用效率。传统 BI 工具难以满足企业大量即时查询和分析的需求,直接将数据库表 schema 作为提示词给大模型也效果不理想。我们采取了数据治理、使用具备物化视图特性的数仓产品、优化提示词工程、跨源数据使用 Pandas 聚合等措施。证实了良好的数据架构、优秀的提示词工程和高性能大模型对实现生成式 BI 的重要性。