【ニュースレター】ビッグデータやAI領域で活用が進むSnowflakeの解説と導入事例の紹介
Digital PR Platform / 2024年12月16日 13時0分
※2 Snowflakeのテーブルに対して継続的にデータをロードする仕組み
事例2:データ分析基盤および分析モデルの開発環境構築の支援(製造業のお客様)
ローカルに存在していたloTログをSnowflakeにインポートする独自Pythonツールを開発しました。
多数のCSV、TSVが存在し、同じデータ種でも発生時期によりカラムの数が異なるという状態だったものの、ファイルにヘッダレコードが付与されていたため、インプットファイルをJSON形式に変換する汎用的なツールを作成しました。それにより、ELT方式で、短期間でSnowflakeへ格納することを実現しました。また、汎用ツールの中でテーブル作成をする際、抽出条件で頻繁に利用するカラムはJSON外でも独立したカラムとして保持するよう、設定ファイルでコントロールできるよう工夫しました。
分析モデルの開発環境構築においては、Snowflakeと連携して特定期間のIoTログを取得してクレンジング・前処理・可視化を行うPythonの分析環境を構築するとともに、分析時間を更に短縮するためにSnowflake内で全て処理を行うSnowparkを使ったPythonの分析環境の構築も行っています。
事例3:開発の生産性向上に向けたデータ加工・運用業務(通信業のお客様)
開発の生産性を向上させるためにSnowflakeとdbtを活用したデータ加工・運用業務の支援をしました。
お客様はサービス向上のため、利用情報などのデータ分析を迅速に行う必要があり、Snowflakeを導入することで高速かつ安定したデータ分析基盤を実現していましたが、ビジネススピードが加速するなかで、データ加工におけるデータマートの開発生産性が課題となっていました。
そこで、データ変換に特化したツールであるdbtを導入しました。dbtは、実行結果を自動でテストしたり、処理フローを視覚的に確認したり、仕様書を自動生成したりといった機能が充実しており、Snowflake単体では補いきれない部分をカバーしてくれます。これにより、データ変換に関する作業を効率化し、開発のスピードアップを実現しました。
さらに、dbt.Labs社が公開しているdbtベストプラクティスに則って3つのレイヤーに分けて設計・構築するなど統一ルールを設けることにより、開発者が増えると発生しがちな品質のばらつきや教育面の負担軽減も図っています。
この記事に関連するニュース
-
テラデータのAI/MLサーバレスエンジンTeradata AI Unlimited、パブリックプレビューをMicrosoft Fabricで提供開始
PR TIMES / 2024年12月18日 12時45分
-
富士ソフト、AIデータクラウドSnowflakeのAIデータクラウド サービスパートナーに認定
PR TIMES / 2024年12月13日 13時15分
-
Morph、スポーツと他産業のコラボレーションによる新たな価値創造を目指すオープンイノベーションイベントに登壇。
PR TIMES / 2024年12月12日 17時45分
-
モビリティサービスを使いやすく
共同通信PRワイヤー / 2024年12月12日 14時0分
-
生成AIを活用した自動前処理機能を新たにリリース
PR TIMES / 2024年12月9日 11時15分
ランキング
-
1なぜ?「角が丸い」案内標識が最近増えているワケ 丸くする“メリット”とは?
乗りものニュース / 2025年1月5日 16時12分
-
2サクランボ初競り、桐箱入り佐藤錦が過去最高150万円…1粒あたり2万2000円
読売新聞 / 2025年1月5日 14時55分
-
3日鉄、米政府提訴へ準備 USスチール買収禁止に批判噴出
共同通信 / 2025年1月5日 19時24分
-
4銀行が恐れる日銀「預金準備率引き上げ」の現実味 銀行の「棚ぼた利益」に対する国民の不満も
東洋経済オンライン / 2025年1月5日 7時40分
-
5連休明けの「会社に行きたくない」は要注意…産業医が指摘「急性のメンタル不調」の放置で起きるリスク
プレジデントオンライン / 2025年1月5日 17時15分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください