亚马逊AWS官方博客
Category: Artificial Intelligence
逆向图灵,借助生成式 AI 技术打造激动人心的 Role-play 游戏智能 NPC:ChatArena-Plus 解决方案
随着人工智能技术的快速发展,游戏行业正面临着一个激动人心的机遇:利用生成式 AI 来创造更加智能、动态和个性化的 NPC。传统的 NPC 往往存在行为模式固定、对话有限等问题,难以为玩家提供真实而丰富的互动体验。而借助先进的语言模型和多智能体系统,我们可以打造出具有动态对话生成、独特个性、NPC 间互动博弈等特点的新一代 NPC。
HAQM SageMaker TF 2 分布式训练方案
本文将总结分享客户从 TF 1.15 迁移升级到 TF 2.14 过程中遇到的一些问题及应对方法,并以一个简单的例子给出基于 TF 2 的分布式训练代码。
垂直电商图像搜索再升级:DINO 模型带来精准匹配体验
本文通过使用服装鞋类商品进行模型训练,同时通过 GroundingDINO 进行目标物品检测和剪切的方式对图片进行搜索,这种方式满足企业级的,特别是垂直行业的高精度搜索。有助于更好地提升用户的搜索体验。 该方案也可以拓展到其他的垂直行业使用,如电商、游戏、短视频,医疗、制造业等。
摆脱 GPU 资源束缚,HAQM Inf2 让大模型推理更高效
亚马逊自研芯片 inf2 与 vLLM 助力企业高效部署大型语言模型。
基于 HAQM Bedrock 构建端到端实时语音助手
本文使用 HAQM Bedrock、Transcribe 和 Polly,结合开源 ASTRA 框架,开发了一个高效的实时语音助手,并提供常规聊天及同声传译两个工作模式。
使用 AWS Console-to-Code 控制台转代码功能(现已正式发布)将 AWS 管理控制台操作转换为可重复使用的代码
今天,我们宣布推出 AWS Console-to-Code 控制台转代码功能正式发布版本(GA),该功能可以轻 […]
亚马逊云科技助力光伏企业生成式 BI 落地的实践探索
我们为一家光伏企业开发了基于生成式 AI 技术的商业智能工具,该工具极大提高了数据使用效率。传统 BI 工具难以满足企业大量即时查询和分析的需求,直接将数据库表 schema 作为提示词给大模型也效果不理想。我们采取了数据治理、使用具备物化视图特性的数仓产品、优化提示词工程、跨源数据使用 Pandas 聚合等措施。证实了良好的数据架构、优秀的提示词工程和高性能大模型对实现生成式 BI 的重要性。
基于 Claude 3 和 WhisperX 构建 ASR 方案(二)
在《基于 Claude 3 和 WhisperX 实现 ASR 方案(一)》中我们介绍了 WhisperX 模型的实现原理,以及如何在 AWS 上快速部署和使用 WhisperX 模型,实现语音转文字,视频字幕生成与对齐,识别不同的说话人等功能。通过 StreamlitUI 的方式,我们可以快速对 YouTube 视频、本地音频文件实现 ASR,方便我们做技术调研和 Demo 演示。
基于 Claude 3 和 WhisperX 构建 ASR 方案(一)
本文将深入探讨 WhisperX 的一个关键特性——说话人分离,剖析其实现原理和应用场景,并指导您如何在 AWS 上部署和使用该模型。Whisper 是一种先进的深度学习语音识别技术,能将语音精确转换为文字。其核心优势在于高效的神经网络结构和创新的训练方法,使其能应对各种复杂场景,如嘈杂环境、多样口音和不同语速。
AWS 一周综述:Jamba 1.5 系列、Llama 3.2、HAQM EC2 C8g 和 M8g 实例等(2024 年 9 月 30 日)
每周,HAQM Web Services(AWS)都会举办社区活动,您可以在其中拓展人脉、学习新知,并 […]