データサイエンス

データ分析・機械学習・アプリケーションで利用する様々なデータを検出/準備/移動/統合するサーバレスのデータ統合サービス

AWS Glue

AWS Glueは多様なデータソースの検出・接続とデータカタログによるデータ管理、
視覚的なETLパイプラインの作成を備えたサーバーレスのデータ統合サービスです。
データ統合・ETLだけでなく、Python Shellによってデータ統合からデータ分析までを一元的に実現することが可能です。

解決可能な課題

データ分析・機械学習を行うために最初に必要なデータの準備を迅速・簡潔・低コストに実現します

  • 活用したいデータソースが複数存在しており、これらのデータを統合する必要がある
  • 迅速にデータ統合を実現したい
  • 大容量のデータを統合する必要がある
  • データ統合基盤にかかる運用負荷やコストを軽減したい
  • ETLからデータ分析モデルまでを統合したデプロイ・実行を行いたい

サービスのご紹介

データ準備・ETL

AWS Glue Studio/DatabrewによるノーコードETLジョブ開発から、ETLスクリプトによる高度なジョブ開発まで用途や目的に応じた多彩なETL実装が可能です。

分析・モデリング

Python Shellジョブを使用して、AWS GlueでシェルとしてPythonスクリプトを実行できます。ETLから予測分析モデルの実行までをシームレスに実行することが可能になります。

データカタログ

AWS Glue Data Catalogは、AWS GlueのETLジョブのデータソース・ターゲットデータに関するメタデータを保持するメタデータストアです。
カタログ化されたデータは、すぐに Amazon Athena、Amazon EMR、Amazon Redshift Spectrum を使用した検索やクエリで利用できるようになります。

可視化

Glueで統合したデータはAmazon AthenaやAmazon QuickSightをはじめとするBIツールによって迅速に可視化できます。

導入によるメリット

  • サーバレスデータ統合によるコストの最適化
  • AWS Glue Studioによる、簡易かつ迅速なAWS Glue ETL ジョブの視覚的な作成、実行、モニタリング
  • 一元化されたデータカタログによるデータの再利用と効率化・データ活用促進
  • NI+Cの実績と経験に基づいた導入~データ活用の支援

NI+Cが選ばれる理由

NI+Cは100人を超えるAWS認定資格取得者を擁するAWS サービスパートナーです。

AWS Glueを用いたデータ活用・データ分析の実現に向け、AWSの構築~運用フェーズまで一貫した支援をご提供いたします。
システムインテグレーターとして、AWS Glueと既存システムやその他AWSサービスとの統合をご支援するだけでなく、NI+Cのデータエンジニア/データサイエンティストがお客様のデータ活用・データ分析をお客様と伴走しながらサポートします。

ページのトップへ