亚马逊AWS官方博客

Category: HAQM SageMaker

HAQM SageMaker Ground Truth — 构建高度准确的数据集并将添加标签的成本最高降低 70%

今天,大部分机器学习任务都使用一种被称为监管学习的方法:通过一种算法从带标签的数据集中学习模式或行为。带标签的数据集包含数据样本以及每个样本的准确答案,也就是“地面实况”。根据所拥有的问题不同,人们可以使用带标签的图像(“这是一只狗”、“这是一只猫”)、带标签的文本(“这是垃圾邮件”、“这不是”)等等。

HAQM SageMaker Automatic Model Tuning:利用机器学习支持机器学习

HAQM SageMaker Automatic Model Tuning 已正式发布。Automatic Model Tuning 消除了为了搜索超参数空间,以获得更精确的模型,而必须执行的无差异化繁重工作。在训练和校正机器学习模型时,开发人员和数据科学家能够利用这项功能节省大量时间和工作。超参数校正任务会根据已完成的训练任务的结果,启动使用不同超参数组合的多项训练任务。SageMaker 根据贝叶斯优化训练“元”机器学习模型,为我们的训练任务推断超参数组合。我们稍微深入地探索一下这方面的内容。

HAQM SageMaker 增加批量转换功能和适用于 TensorFlow 容器的管道输入模式

AWS 推出了两个新的 HAQM SageMaker 功能:一是批量转换功能,这是一种新的批量推断功能,客户可以通过它对 PB 级的数据进行非实时场景预测;二是适用于 TensorFlow 容器的管道输入模式。SageMaker 依然是 AWS 最受欢迎的服务之一,此博客和机器学习博客都对它进行了非常广泛的介绍。事实上,要赶上 SageMaker 团队快速的创新步伐是一件较为困难的事情。自上一篇有关 SageMaker 自动模型调整和超参数优化功能的博客发布以来,该团队已经推出了 4 种新的内置算法和许多的新功能。下面我们来看新推出的批量转换功能。

机器学习的三月也疯狂!

在美国,三月中旬是上亿人观看、投注大学篮球联赛的季节。NCAA 大学篮球联赛鑫战正酣,Randall想借此机会简单介绍一下 Wesley Pasfield 的工作,他是我们的专业服务机器学习专家之一。Wesley 可以从 kenpom.com 和 College Basketball Reference 提取数据以创建模型,使用 HAQM SageMaker 嵌入的 XGBoost 算法来预测疯狂三月的结果。

如何宅在家里构建一个分图利器? – 利用 HAQM SageMaker 快速构建一个基于深度学习端到端的图像分类器

基于深度学习 (Deep Learning) 的图像分类的研究与应用已经进行的如火如荼,对大部分的业务场景来说,更是有着深刻的现实意义 – 基于图片的互联网分享社交应用,如何借助 Deep Learning 在第一时间对用户分享的图片进行实时监测,分类是一个比较典型的应用场景;又例如,电商运营可能希望对所有的产品照片按照产品属性进行自动化分类,减少人工分类的工作;另外,在工业生产线的良品率基于产品图片的自动筛检,以及辅助医疗领域对病理图片的分类等等场景都有着十分广泛的应用前景和实用价值。

当然,利用神经网络 (Neural Networks)构建的深度学习,因为其非线性的特性以及堆叠网络架构使其具备了数以百万计的模型参数在图片分类利用越来越成熟。但是,对于不具备深度学习研发能力的用户,从零构建这样的应用无疑是一种挑战。HAQM SageMaker 是一个完全托管的机器学习服务,它使一般的开发人员和数据科学家可以快速轻松地构建以任何规模的机器学习训练任务,并且提供基于API的端到端的模型部署方案以及 10 多类 HAQM 自带的典型算法,让用户无障碍地轻松构建各种典型的机器学习应用。

好了,我们今天给大家准备了一个有趣的任务 – 构建一个猫狗图片的分类器。

让神经网络触手可及 – AWS 风格

HAQM AI 的目标是通过开发 HAQM SageMaker 之类的平台来让机器学习变得大众化,而 fast.ai 的目标正好与其相同:提供平等教育机会,以便每个人都可以掌握机器学习并提高工作效率。fast.ai 的宣传语是“让神经网络触手可及。”这不是一场降低深度神经网络热门度的比赛,而是要让其吸引力和可访问性不仅仅局限于主导该领域研究的学术精英。

随着深度学习用例 (例如,计算机视觉、自然语言处理和机器翻译) 的激增,我们还发现,开发人员社区对了解机器学习及其在众多问题上的应用产生了浓厚的兴趣。在实际应用方面,“深度学习纳米学位”开发公司 Udacity 在全球的用户数量已超过 800 万。其中,5 万多名用户志在获得纳米学位,获得这些学位的很大一部分用户专注于深度学习。我们开始注意到,机器学习掀起热潮,但这方面的教育仍旧沿袭一般教育方式,从研究开始,然后才是应用。进入 fast.ai 世界,感受大规模开放在线课程 (MOOC) 无与伦比的魅力,与 10 万余名学生共同利用 AWS 云的全球网络办公环境在线学习深度学习。

HAQM SageMaker 现在推出了 AWS CloudTrail 集成

AWS 客户请求提供一种方法用来在 HAQM SageMaker 中记录活动,从而帮助满足管治及合规性要求。我很高兴地宣布,HAQM SageMaker 现在与 AWS CloudTrail 进行了集成,这项服务可用来记录、持续监控以及保留与 HAQM SageMaker API 活动相关的账户信息。无论是通过 HAQM SageMaker SDK、AWS SDK、Apache Spark SDK for HAQM SageMaker,还是通过 HAQM SageMaker 控制台进行的 HAQM SageMaker API 调用,都可以被捕获并发送到 HAQM S3 存储桶,从而提供 AWS 账户活动的事件历史记录。记录的信息包括源 IP 地址、发出请求的日期和时间、与请求关联的用户身份以及请求的参数。