亚马逊AWS官方博客
使用 SageMaker AI 运行 GGUF 格式的模型推理实践
本文详细介绍了如何在 HAQM SageMaker AI 中部署 GGUF 格式的 LLM 模型。通过使用自带容器(BYOC)方法,文章展示了从创建 SageMaker Notebook 实例、构建必要文件、创建自定义 Docker 镜像,到在 SageMaker 中部署模型并进行推理测试的完整流程。
使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型(一)
AWS Inferentia2 是亚马逊云科技自主研发的云端机器学习推理芯片,为深度学习推理工作负载提供高性能和高效率的计算能力,帮助客户在云端高效地部署和运行机器学习模型。
HAQM CloudFront 部署小指南(十二):HAQM CloudFront Anycast
近期推出的 CloudFront Anycast 静态IP,通过BGP技术提供固定IP地址,实现流量路由至最佳服务器。相比传统动态IP,这项功能在 零费率合作 和 企业防火墙白名单 场景中优势显著,简化ISP合作并提升安全性。部署需申请配额、创建IP列表并关联分配。
HAQM CloudFront 部署小指南(十一)- 实现指定请求特征绕行缓存(Bypass Cache)
本文将提供两种思路,实现 CloudFront 绕行缓存(Bypass Cache)
基于 HAQM Athena HAQM S3 和 Fluentbit 实现 HAQM EKS kubernetes event 的 Log 方案
在 HAQM EKS (Elastic Kubernetes Service) 上运行的应用程序通常会生成大量日志数据,有效地收集和分析这些日志对于故障排查、安全监控和成本优化至关重要。本方案利用 HAQM Athena、HAQM S3 和 Fluent Bit 构建了一个高度可扩展、成本效益高的 Kubernetes 事件日志解决方案。
利用 HAQM Client VPN, HAQM Directory Service 和 HAQM Transit Gateway 打造安全稳定的全球办公解决方案
利用亚马逊云科技的 HAQM Client VPN,HAQM Directory Service 和 HAQM Transit Gateway 等服务,企业可以构建一个安全可靠的全球办公网络环境,为远程员工提供无缝访问体验。该综合解决方案保护关键数据,支持全球多地办公室互连,助力企业灵活实现全球化布局。
使用 HAQM Nova Lite 实现多快好省的智能视频审核
本文将分享我们在实际案例中利用亚马逊在re:Invent 2024刚刚推出新一代自研大模型HAQM Nova Lite构建视频分享平台的智能审核方案。我们分别从审核的准确性、处理速度、运营成本等维度深入探讨这个话题。
云端引擎:使用 HAQM Lambda 和 HAQM S3 打造智能汽车数据处理平台
汽车行业借助HAQM S3和AWS Lambda构建了新一代数据采集平台,实现了高效、灵活的数据处理能力。
HAQM GameLift 高阶使用技巧(一)- FlexMatch 多模式匹配的实现
通过使用 HAQM GameLift FlexMatch 实现多模式匹配,分离或单一规则集对比,实践中的建议与性能测试对比,以及其他技巧。
为 HAQM EventBridge 事件传输规则推出跨账户目标
使用 EventBridge 构建的事件驱动型架构允许您创建跨多个公司部门和业务领域的解决方案