Amazon Web Services ブログ
[AWS Black Belt Online Seminar] Amazon Timestream 資料及び QA 公開
先日 (2020/12/16) 開催しました AWS Black Belt Online Seminar「Amazon Timestream 」の資料を公開しました。当日、参加者の皆様から頂いた QA の一部についても共有しております。
20201216 AWS Black Belt Online Seminar Amazon Timestream
AWS クラウドサービス活用資料集(すべての過去資料が閲覧できます)
Q. 普通のRDBとどうやって使い分ければよいでしょうか?出せる範囲で実際の他社事例をおしえてください。
A. 以下特徴のある時系列データにはAmazon Timestreamの使用をお勧めいたします。
- 秒単位の大量の書き込みが複数箇所から同時に発生する場合(IoTデバイスからなど)
- スキーマの柔軟性が必要な場合
- データ量増加時の対応を自動管理したい場合(パーティショニングやシャーディング etc.)
- データ取得時のレイテンシ要件に合わせたコストの最適化と、データライフサイクルを簡易化したい場合
- 時系列機能を利用した集計を行いたい場合
また、他社事例に関してはこちらをご参照ください
Q. 同じタイムスタンプ(ディメンション、メジャー)で挿入されたレコードが更新されますか、それとも2つのレコードになりますか?
A. タイムスタンプ、ディメンション、メジャー名が同一の場合、更新されずに挿入エラーとなります。
「Version」というパラメータを利用することでメジャーの値を更新することが可能です。
-
- https://www.slideshare.net/AmazonWebServicesJapan/20201216-aws-black-belt-online-seminar-amazon-timestream#56
- https://docs.aws.amazon.com/timestream/latest/developerguide/writes.html#writes.writing-data-inserts-upserts
- https://docs.aws.amazon.com/timestream/latest/developerguide/API_WriteRecords.html
Q. メジャーの種類 = measure_name の種類 という理解であっていますか?
A. こちらのスライドの「メジャーの種類」は「measure_nameの種類」のことであっております。
Q. ディメンションとtimestampが重複した場合、通常時はエラーになるとあったのですが、timestampの最小単位はミリ秒ですか?
A. ナノ秒までサポートされています。タイムスタンプの単位はデータ挿入時に指定可能です。こちらをご参照ください。
Q. DynamoDBを使って時系列データを管理する場合と比較したときの、利点・欠点についてお聞きしたいです。
A. Amazon Timestreamでは、ANSI SQL 2003を使用したクエリの実行、用途の異なる複数のストレージ階層を使ったコストコントロール、時系列特有のトレンド分析・予測・補間といった時系列専用ユーティリティを使ったデータ取得が可能になります。
Amazon DynamoDBはタイムスタンプデータが必須ではなく、トランザクション対応や手動バックアップ&リストアが可能です。
Q. システム移行の場合、過去の履歴データを Amazon Timestream に挿入できますか?
A. 現在の仕様では、インメモリ階層の最大保持期間である 8766 時間よりも古いデータを挿入することができません。こちらのご要望は複数のお客様から伺っており、機能追加できるかどうかを確認しています。
Q. Grafanaのように、 Amazon Timestream を ElasticSearch とどのように統合しますか?
A. Elasticsearch は可視化ツールではなく、分散型RESTful検索/分析エンジンのため、Grafanaとはサービス種類が異なります。その前提で、Amazon Timestreamとは別にElasticsearch を利用したい場合の連携方法は、一例として、Amazon Timestreamにクエリして取得したデータをElasticSearchに投入するやり方が挙げられます。お客様のサービス要件・システム構成次第ではその他ソリューションも考えられるため、AWS個別相談会でご相談ください。
Q. インメモリ/ディスク「SuccessfulRequestLatency」を個別に監視できますか?
A. 現在の仕様では、インメモリ階層とマグネティック階層を分けて監視いただくことは出来ません。(「SuccessfulRequestLatency」問わず) こちらの資料をご参照ください。
「SuccessfulRequestLatency」に関しては、「Operation、DatabaseName、TableName」の単位で監視いただくことが出来ます。
Q. Amazon Timestreamはどんな用途で使うのに最適なサービスですか。類似サービスの差別化は何になりますか?
A. 代表的な用途に関しては、こちらご参照ください。
- https://www.slideshare.net/AmazonWebServicesJapan/20201216-aws-black-belt-online-seminar-amazon-timestream#11
- https://www.slideshare.net/AmazonWebServicesJapan/20201216-aws-black-belt-online-seminar-amazon-timestream#12
- https://aws.amazon.com/jp/timestream/?nc=sn&loc=1
類似サービスの差別化としては、こちらご参照ください。
- https://www.slideshare.net/AmazonWebServicesJapan/20201216-aws-black-belt-online-seminar-amazon-timestream#13 〜 https://www.slideshare.net/AmazonWebServicesJapan/20201216-aws-black-belt-online-seminar-amazon-timestream#24
Q. あまりイメージが湧いていないのですが、どのようにSageMakerと連携するのでしょうか?Timestreamのストレージに格納されたデータをCSVなどに焼き直して、SageMakerで読み込んでforecastingなどする感じでしょうか?
A. AWS Labsの「awslabs/amazon-timestream-tools」にサンプルをご用意しております。
こちらでは、Amazon TimestreamのQuery結果をpandasのデータフォーマットに整形して渡す方法をご紹介しております。
Q. 論理障害(app.logic bug)に備えたり、テスト環境で本番データを使用したりするには、データをバックアップ/リストアする方法を教えてください。S3 へのエクスポートは可能ですか?
A. 現在機能としてエクスポート/インポート手段は提供しておりません。エクスポート/インポート機能のご要望は複数お客様からも伺っており、機能追加できるかどうかを確認しています。
Q. Timestream へレコードを登録するコードを組んだとき、ローカルで閉じてデータが登録できることを確認するテストを行えるようなツールはありますか?
A. Amazon Timestreamをローカルで閉じてテストを行えるツールは現在ご用意しておりません。
Q. テーブルをまたいでのクエリはできない、ということでよろしいでしょうか。(複数のテーブルをJOINのようなことはできない)
A. はい。現在の仕様ではテーブル間JOINは出来ません。SELF JOINのみサポートしております。
Q. リソース情報についてはCloudWatch CustomMetrics でも代替できるかと思いますが、どのように使い分け・棲み分けするのが良いのでしょうか。取得する値が決まっている、単一である等であればCWの方が良いなどありますか。
A. Amazon CloudWatchは、AWSのクラウドリソースやAWS上で実行しているアプリケーションを監視するサービスです。アプリケーションの運用状況に重要なメトリクスを送信して保存しておくことで、トラブルシューティングやトレンドの可視化、Amazon CloudWatchアラームの生成、SNS通知の送信などに役立てることができます。
一方Amazon Timestreamは、時系列を扱うことを目的としたデータベースサービスです。可視化やアラート発行には別のサービスと統合して実現します。ナノ秒単位の時系列データの保存と取得、SQLクエリを使ったデータの取得、用途に合わせた複数のストレージ、柔軟なデータ構造・階層化、トレンド分析、予測、補間などの時系列分析を行うためのデータベースが必要な場合、Amazon Timestreamは最適なサービスです。
Q. 今までAthenaに格納していたデータも、時系列データであればTimestreamで取り扱った方が良いという理解でしょうか?
A. Amazon Athenaに分析するにはAmazon S3にデータを保存する必要があります。S3へのデータ挿入スループットが要件を満たせない場合はAmazon Timestreamを利用することお勧めします。また、トレンド分析、予測、補間などの時系列分析を行う関数が備わっているため、データ取得要件次第ではAmazon Timestreamをご利用いただくことをお勧めします。
—–
今後の AWS Webinar | イベントスケジュール
直近で以下を予定しています。各詳細およびお申し込み先は下記URLからご確認いただけます。皆様のご参加をお待ちしております。
——
AWSome Day Online Conference
「AWSome Day Online」は、AWSの主要サービスや基礎知識を約 3 時間という短い時間で、ポイントを押さえて紹介いたします。技術的な面だけではなく、AWS クラウドを学ぶために必要となる知識を身に付けたい方、エンジニアのみならず、営業職、プリセールス職、学生まで幅広い方々におすすめします。
※この回ではAWSエキスパートによる技術的な内容についてチャット形式でのQ&Aを実施します。
※AWS サービスの導入に関するご相談も同時にチャット形式にて対応します。
※2020年は毎月第一水曜日に開催します。
日時:2021 年 2 月 10 日(水) 15:00 – 18:00 終了予定 | 詳細・お申込みについてはこちら≫
——
2020年 AWS re:Invent Recap シリーズ
- 1/14(木)AM インダストリー編 Webサービス事業者様向け
- 1/19(火)PM ソリューション編 AI/ML
- 1/20(水)AM インダストリー編 テレコム
- 1/20(水)PM インダストリー編 金融サービス
- 1/21(木)AM インダストリー編 消費財
- 1/21(木)PM インダストリー編 Game
- 1/22(金)AM ソリューション編 Storage
- 1/22(金)PM ソリューション編 コンテナ
- 1/26(火)PM ソリューション編 Serverless
- 1/27(水)AM/PM インダストリー編 製造業
- 1/28(木)AM インダストリー編 ヘルスケア・ライフサイエンス
- 1/28(木)PM インダストリー編 メディア&エンターテインメント
- 1/29(金)AM ソリューション編 Database
- 1/29(金)PM ソリューション編 アナリティクス
- 2/5(金)AM ソリューション編 プロダクティビティーアプリケーションズ
- 2/5(金)PM ソリューション編 Compute
——
AWS Black Belt Online Seminar
2021 年 2 月のアジェンダが公開となりました。また1月の残りのアジェンダは以下になります。セミナー中は内容に関する疑問点を質問することができます。参加された方だけの特権ですので、ぜひこの機会にご視聴ください。
- 1/19 (火)12:00-13:00 AWS CloudTrail
- 1/20 (水)18:00-19:00 Amazon Connect
- 1/26 (火)12:00-13:00 AWS CodeDeploy
- 1/27 (水)18:00-19:00 Amazon Redshift 運用管理
- 2/9 (火) 12:00-13:00 AWS Direct Connect
- 2/16 (火) 12:00-13:00 AWS Database Migration Service
- 2/17 (水) 18:00-19:00 AWS Glue DataBrew
- 2/23 (火) 12:00-13:00 AWS Audit Manager