1. トップ
  2. 新着ニュース
  3. 経済
  4. プレスリリース

DXの実現を、セルフ型のデータ前処理で活性化させる「KSKP」バージョン3.0を提供開始

PR TIMES / 2021年3月23日 9時15分

現場での機械学習適用を促進させるデータ前処理プロセスの共有化機能を強化

株式会社KSKアナリティクス(本社:大阪府大阪市西区、代表取締役:森本 好映、以下 「KSKアナリティクス」)は、データ前処理に特化した分析基盤「KSKP(ケーエスケーピー)」に新たな機能を追加したバージョン3.0の提供を2021年3月 23日(火)から開始します。



■バージョンアップの背景
DX(デジタルトランスフォーメーション)実現の一環として、IoTや機械学習の適用を組織的に活性化させたい場合、労力最大のネック工程であるデータ前処理への対処も重要となります。

複雑で煩雑なデータ前処理をノーコードにより作成し、高速に実行できるツールとしてKSKPを提供しておりますが、今回のバージョンアップにおいて、ユーザーが自発的にプロジェクトを立ち上げて、データ前処理のプロセスや共通化部品の作成管理を行うセルフ型のプロジェクト管理が可能となります。これにより分析業務の専任者ではない現業部門での自発的な活用を支援します。

■使用者の拡大により生じるデータ前処理の隠れた問題点
DXを実現する手段として、機械学習を活用した業務改革を行う能力を、社内へ普及させる取り組みが増加しています。分析業務の専任者だけではなく、最終的に社内の誰もが活用できることを目指して、Pythonなどのプログラミング言語の習得や、AutoML(自動化された機械学習)の活用により普及させるなどが行われています。
しかしながら分析業務の専任者だけから、社内の誰もが活用へと使用者の拡大につれて、データ前処理の隠れた問題に直面する恐れがあります。

直面する問題
データ分析活用の経験者は認識していながら後回しにされてきた問題で、使用者の拡大につれて顕在化してきます。

データ前処理が事実上ブラックボックス化することで生じる損失1. データ処理の品質の確認に、余分な労力を要す 2. 将来の改修・発展時に、余分な労力を要す 3. 引継ぎの際に、双方に余分な労力を要するか、または ブラックボックス化を進展させてしまう 例 PoCを担当した分析者と、運用システム担当の開発者との連携時 例 運用システム開発者と、運用担当者との連携時 例 将来の改修や発展の際に、分析者、開発者、運用者とで連携 例 担当者の変更時これらの損失は、DataOps(継続的にデータ活用を維持発展させる取組)、MLOps(継続的に機械学習モデルを維持発展させる取組)という継続した改善に取り組む際にも障害となる問題です。

データ前処理の重複開発による労力の損失1. 分析の状況に応じて生じる反復作業により、余分な労力を要す ※共通の処理が多数のプログラムに派生し、データソースの追加などにより発生 2. 異なる機械学習モデル開発時に、重複したデータ処理を開発し、余分な労力を要す[データ前処理の重複開発による労力の損失]
※データ前処理は、分析作業の労力の大半を占める最大のネック工程で、課題とデータソースで決まり変化が少ない処理と、モデル化ごとに変化する2種類が存在します
[画像1: https://prtimes.jp/i/38622/2/resize/d38622-2-478049-0.png ]



■ データ前処理の隠れた問題点への対処
データ前処理に関して、余分な労力を削減し、分析者と関係者の心理的なプレッシャーを下げることで、機械学習活用への挑戦意欲を高めて活性化させることを狙います。

対処策1. 関係者が理解容易で処理内容が透明な、データ前処理のプロセスを作成する 2. 作成したデータ前処理プロセスは、運用性に優れている 3. 作成したデータ前処理プロセスを、簡単に他のユーザーへ共有部品として提供できる 4. ユーザーが自発的で簡単に、他のメンバーとの共同プロジェクトを始められるKSKPにおける対処策の機能1. セルフ型のノーコードによるデータ前処理プロセスの作成機能 2. 自動的にパイプライン処理として高速に実行するエンジン機能 3. セルフ型の共有部品の作成機能 4. セルフ型のプロジェクト管理機能 ・・・ 新機能の追加[KSKPにおける対処策の機能]
[画像2: https://prtimes.jp/i/38622/2/resize/d38622-2-914809-1.png ]



期待される効果
分析者は「良いモデルを早くつくる」ことに精一杯で、「良い分析システムを効率的につくる」ための開発部門との連携や引継ぎの容易性を考える労力的、心理的な余裕が少なく、問題が先送りされてしまうのが現状です。
分析者、開発者、運用者などの関係者と連携した開発において、対処策を通じて将来的に生じる損失の回避が可能になります。

またデータ処理自体の複雑で煩雑な特性から、通常プログラムの作成者であっても、期間を経ると理解が難しくなるという現状から、関係者が理解容易な処理プロセスを作成可能な環境を整備することで、分析者の心理的、労力的な負担を軽減します。これにより、分析業務専任者ではない現業部門での自発的な活用の促進と、活用されないことによる機会損失の抑制に、貢献します。

KSKPが効果的なユースケース

セルフ型の前処理とAutoML(自動化された機械学習)と組み合わせて、ユーザー層を拡大したい
DataOps、MLOpsの取り組みにおいて、前処理の隠れた問題点も対策したい
機械学習モデルは課題への最適化のため共通化は難しいが、データ前処理の共通部分は組織で共有したい

KSKPが効果的でないユースケース

作成者以外の人はブラックボックで問題なく、使い捨てのデータ前処理を素早くつくりたい

■ セルフ型のプロジェクト管理機能 <新規追加>

ユーザーが、自由に他のユーザーと共有するプロジェクトを作成できます
プロジェクトを作成したユーザーが、他のユーザーとの共有と権限範囲を設定できます
ユーザーは、権限があるリソース(データ、前処理のプロセス、共有化した部品)を使用できます

■ センサー時系列データに対する補間機能 <新規追加>

時系列データの欠損値は、平均値などで置換する「補完」でなく、時系列性を考慮した「補間」が適切です
3次スプライン、線形補間(1次スプライン)などを用いて、欠損値を計算します
補間により異なる間隔で収集された2つのデータを、1つのコマンドで結合することができます

■ 機械学習のための特徴量生成機能 <入力支援の拡充>

数値とカテゴリデータに対して、70種類の特徴量が組み込まれています
今回のバージョンアップにより、設定したい特徴量を指定するUI操作を改良しました


■データ前処理ツール「KSKP(ケーエスケーピー)」について
機械学習のためのデータ前処理は、複雑で煩雑な特性から従来の分析者や開発・運用などの関係者に高い負担を強いているのが現状です。KSKPは、透明性・理解性の高い処理プロセスを通じた組織的な連携、高速な実行性による運用システムの開発、分析業務の専任者ではないユーザー層での前処理の実現の手段として、「誰もが当たり前にデータを分析・活用できる」を支援するデータ前処理に特化した分析プラットフォームです。

製品紹介ページ:https://www.kskp.io/

《KSKP画面イメージ》
[KSKP画面イメージ]
[画像3: https://prtimes.jp/i/38622/2/resize/d38622-2-841056-2.png ]


《KSKPでのセルフ型の共有部品の作成機能》
[KSKPでのセルフ型の共有部品の作成機能]
[画像4: https://prtimes.jp/i/38622/2/resize/d38622-2-496623-3.png ]



■KSKアナリティクス 会社概要
KSKアナリティクスは「Data Analysis for Everyone! ~誰もが当たり前にデータを分析・活用できる社会を作る~」のビジョンのもと、2006年の創業以来、グローバル製造業を中心に様々な企業にデータ分析環境の構築、導入支援/分析コンサルティング/データ分析人材の育成支援等を行っています。

【会社名】株式会社KSKアナリティクス
【代表者】代表取締役 森本 好映
【所在地】
〒550-0002 大阪市西区江戸堀1-18-35 肥後橋IPビル6F(本社)
【設立】2006年8月
【事業内容】
1)ETL・BI・機械学習・前処理など各種分析ツールの販売、導入サポート、活用支援
2)分析環境の構築や機械学習を活用したデータ分析コンサルティングの提供
3)AI・機械学習活用人材を組織に育成するための教育、研修の実施
【URL】https://www.ksk-anl.com/

企業プレスリリース詳細へ
PR TIMESトップへ

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください