亚马逊AWS官方博客

AWS Team

Author: AWS Team

Amazon EMR 集群的成本优化实践

本文详细介绍了一个针对 AWS EMR 集群定时启停并保持 IP 地址固定的解决方案。该方案巧妙地结合了弹性网卡(ENI)技术和自动化脚本,有效解决了企业在使用 EMR 时面临的两大挑战:资源使用效率与 IP 地址变化问题。

基于 IoT 数据平台案例看 EMR HBase BucketCache 调优

我们提到,当 HBase 使用 Amazon S3 作为底层存储时,可以通过预热 BucketCache 来提升读取性能。随着 BucketCache 大小的增加,内存占用也呈正比上升。那么,BucketCache 对于性能的提升有多少?这些提升能否弥补 cache 带来的额外内存与算力成本呢?这篇 blog 将讨论这一问题。

基于 Datahub +Redshift 自动生成字段级血缘

这篇文章介绍了一个基于 DataHub 和 SQLLineage 实现 Redshift 字段级血缘的轻量级解决方案。这个方案为数据团队提供了一个实用的数据血缘追踪工具,有助于数据治理、影响分析、问题排查和性能优化等工作。同时其轻量级和可扩展的特点,也使其非常适合中小型数据团队使用。

借助 Cloud Foundations 产品工厂和包工厂以最佳安全实践事件驱动自动初始化实例安装基础软件并配置会话日志和监控指标

基于官方镜像启动一台新的 EC2 实例后,标准化过程一般包括安装必要软件包并配置 CloudWatch 代理以发送日志和监控指标。此外还包括改名、入域等操作。如何安全、规范、自动、快速完成上述实例初始化是本文想解决的问题。

Amazon CloudFront 部署小指南(十七) – 利用 AWS 服务构建用户友好的 CloudFront性能监控工具

在使用 Amazon CloudFront 进行内容分发时,户侧的性能指标(如 DNS 解析时间、TCP 连接时间、请求时间、响应时间等)难以直接获取,本文提供了一个用户友好的 CDN 性能监控工具,借助 AWS 服务实现指标收集、上报及可视化展示,可帮助开发者快速定位和解决问题。