Amazon Redshiftとは?データを高速で分析する


Amazon Redshiftとは?

スケーラブルなクラウドデータウェアハウスで、全てのデータを高速で分析する事ができます。

ペタバイト規模の大規模なデータに対応しており、数百ギガバイトのデータから開始して、ペタバイト以上まで拡張できます。これにより、お客様のビジネスと顧客のために新しい洞察を得る目的でデータが使用できるようになります。

データのサイズ関係なく、現在使用しているのと同じ SQL ベースのツールとビジネスインテリジェンスアプリケーションを使用して、高速なクエリパフォーマンスを提供します。

特徴と利点

  • 高速で処理世界で最も高速なデータウェアハウスであり、その速度は年を追うごとに向上しています。

高いパフォーマンスが要求されるワークロードには、新しい RA3 インスタンスを使用して、最大で他のクラウドデータウェアハウスの3倍に達するパフォーマンスが得られます。

  • 低コスト1時間あたり0.25USDで小規模に開始し、1テラバイトあたり年間1,000 USD以下でペタバイト規模にスケールアップできます。

料金は使用した分のみで、発生する費用を予測可能な月額コストとして把握できます。Amazon Redshiftは他のクラウドデータウェアハウスプロバイダーより50%以上安価です。

ストレージとコンピューティングのスケールと支払いを分離することで、さまざまなワークロードに最適化されたストレージ容量とコンピューティング性能を手に入れられます。

パフォーマンス要件を基づいてRedshiftクラスターのサイズを選択し、実際に使用した分だけを支払います。(2021年1月現在)

・データレイクや、AWSサービスとの密接な連携

  • Redshift では、データウェアハウス、運用データベース、およびデータレイクにあるペタバイト規模の構造化データと半構造化データを、標準的なSQLを使用してクエリすることができます。

Redshift を使用すると、Apache Parquet のようなオープンフォーマットでクエリの結果をS3データレイクに保存することも簡単です。

そうすることで、Amazon EMR、Amazon Athena、Amazon SageMakerといった他の分析サービスを使ってさらに分析を実施できます。またAmazonS3のデータレイクのデータに対して直接クエリを実行できるRedshiftSpectrumの機能を活用することにより、新しいデータソースを数日または数週間ではなく、数時間で簡単に統合できるようになりました。

これによりインサイトを得る時間を短縮できただけでなく、インフラストラクチャにかかるコストを管理することもできるようになりました。

  • AQUA (Advanced Query Accelerator)を使用した次世代のRedshiftをプレビュー

AQUA はハードウェアにより高速化された新しい分散型キャッシュで、Redshiftが他のクラウドデータウェアハウスに比べて最大10倍の速度で動作します。分析サービスを使ってさらに分析を実施できます。

またAmazonS3のデータレイクのデータに対して直接クエリを実行できるRedshiftSpectrumの機能を活用することにより、新しいデータソースを数日または数週間ではなく、数時間で簡単に統合できるようになりました。

これによりインサイトを得る時間を短縮できただけでなく、インフラストラクチャにかかるコストを管理することもできるようになりました。

  • AQUA (Advanced Query Accelerator)を使用した次世代のRedshiftをプレビューAQUAはハードウェアにより高速化された新しい分散型キャッシュで、Redshiftが他のクラウドデータウェアハウスに比べて最大10倍の速度で動作します。

参考資料
https://aws.amazon.com/jp/redshift/