よくある質問と回答｜データサイエンス・機械学習プラットフォーム「Dataiku」 - AIによるメール監査・監視/IoTデータベースなら

Q-G01：Dataikuとは何ですか。

Dataikuは、データサイエンティストから初級アナリストまで様々なメンバーで構成される、データ分析チームの誰もが扱いやすいコラボレーションデータサイエンスプラットフォームです。

Q-G02：Dataikuで何ができますか。

データサイエンティストからビジネスユーザまで様々なスキルセットを持つメンバーが、チームとして共同で機械学習の全行程をカバーできます。

ソースデータへの接続、データの準備・加工、機械学習モデルの自動生成、モデルのデプロイ及び運用管理。これら一連の処理を一つのプラットフォームで実行できます。

また、上述の全行程に加えて、モデルの性能監視と再トレーニングを自動化することで作業効率が大幅にアップします。

Q-G03：Dataikuが接続できるDB関連製品はどのようなものがありますか。

フルサポート
・MySQL
・PostgreSQL
・Vertica
・Amazon Redshift
・Pivotal Greenplum
・Teradata
・Oracle
・Microsoft SQL Server
・Google Bigquery
・Snowflake

Tier2サポート
・IBM DB2
・SAP HANA
・IBM Netezza
・AWS Athena
・Exasol

※Tier2サポートとはベストエフォート対応を意味します。詳細は、弊社までお問い合わせください。

お問い合わせはこちらから

Q-G04：NoSQLにも対応していますか。

はい。MongoDB、Cassandra、Elasticsearchに対応しています。

Q-G05：Automationノード、Designノード、APIノードの違いは何ですか。

Designノードは開発環境です。AutomationノードとAPIノードは運用環境です。

Designノードで機械学習モデルを含むデータ分析処理フローを開発します。Automationノードでバッチ予測を実行します。モデルのパフォーマンスをより適切に評価し、本番データをより細かく制御します。APIノードで、リアルタイム予測を実行します。HTTPリクエストに応答するアプリケーションサーバーです。

Q-G06：製品はマルチクラウドデータアクセスをサポートしていますか。

はい。Dataikuは、クラウドとオンプレミスの両方のデータソースへのアクセスがあります。 GCP、Azure、AWSなどの3つの主要なクラウドベンダーをサポートしています。

– 複数のクラウドデータプラットフォーム（Amazon S3、Google Cloud Storage、Azure Blobストレージ、Azureデータウェアハウス、Azure Data Lake Storage）でのデータアクセスのサポート
– 複数のHadoopクラスター（複数のYARNリソースマネージャーなど）に接続する機能
– EMRクラスターを作成、破棄、およびスケールアップおよびスケールダウンする機能
– 選択した計算タイプのルールを設定して、特定のプラットフォームエンジンで実行する機能
– マルチクラウドプラットフォーム全体での検索とメタデータ検索

Q-G07：時系列データに対するデータ前処理機能をサポートしていますか。

はい。移動平均などのウィンドウベースの集計や、集計単位時間の指定、欠損している時間のデータの線形補完、スプライン補完などをサポートしています。

Q-G08：特徴量の生成をサポートしますか。

はい。Excel数式またはPythonを使用して、任意の式で新しい特徴量の作成できます。また、既存の特徴量から新しい特徴量を自動生成するために、次の機能があります。

– 派生した数値機能の自動処理（log、sqrt、多項式）
– 自動ペアワイズ相互作用機能の作成
– プラグインによるイベントデータの自動機能作成

Q-G09：深層学習はサポートされていますか。

はい、次の機能がサポートされています。

– keras / tensorflowによるディープラーニングモデリング（LSTMを含むがこれに限定されない）の完全サポート
– H2Oのディープラーニング機能の完全サポート
– アーキテクチャとトレーニングの完全なコード制御

Q-G10：Dataikuを入れるメリットは何ですか。

データの準備、加工、モデル作成、予測結果のグラフ化まで機械学習に必要なすべての工程をDataiku１つで実行可能になります。Dataikuを社内共通プラットフォームとして利用することでデータや処理フローなどのサイロ化が解消され、部署間や役割の違う担当者間の連携が効率化されます。

Q-G11：Dataiku有償版のメリットは何ですか。

有償版のメリットを一部ご紹介します。

・製品サポートが付与
・開発環境と運用環境を分けられる
・3名以上のユーザが利用可能
・様々なデータソースとの接続が可能

その他、詳細はお問い合わせください。

Q-G12：データのセキュリティは問題ないでしょうか。

Dataiku はオンプレミス環境で動作します。社内のデータが外部に出ることはないので、安心してご利用いただけます。またDataikuは各ユーザごとにデータソースへのアクセス権を付与することができ、ユーザ操作のログを全て記録するため、安全なデータ分析環境をご提供いたします。

Q-G13：教師なし学習も可能ですか。

教師なし学習（クラスター分析）も可能です。その他にも時系列予測、因果ML、ディープラーニングなども可能です。

Q-G14：学習に使用するデータも自分たちで用意しますか。

はい、ユーザ様自身でご用意いただきます。Dataikuは、機械学習モデルの精度を上げるために非常に重要な特徴量エンジニアリングを、簡単に実施する機能が多く用意されています。

Q-G15：スキルアップなどの学習を目的として使うことはできますか。

はい、可能です。わかりやすいGUIで操作ができるため、初めて分析を行う人でも直感的に分析をしていただけます。

Q-G16：データサイエンティストがいない組織でも活用できますか。

はい、可能です。わかりやすいGUIで操作ができるため、営業担当やマーケティング担当などビジネスユーザの方でもご活用いただけます。また弊社サービスとしてデータサイエンティストによる支援も可能です。詳細はお問い合わせください。

Q-G17：データサイエンティストのような専門家がいないと扱いに苦労しますか。

いいえ、そのようなことはありません。弊社では使いこなしていただけるようサポート体制を整えておりますので安心してご利用いただけます。また、Dataiku社公認の講師が丁寧に使い方をレクチャーするトレーニングを定期開催しております。ぜひご利用ください。

Q-G18：Dataikuは誰でも使えますか。

誰でも簡単にご利用可能です。データサイエンティストから、営業担当、マーケティング担当などのビジネスユーザまで、ご利用いただける製品です。

Q-G19：導入実績・事例はありますか。

はい、ございます。ぜひこちらの導入事例をご確認ください。

Q-G20：そもそも分析に必要なデータがないのですが……。

データの取得の段階からお手伝いすることができます。社内に眠っている様々なデータを収集し、分析できるような形に整える最初のステップからご支援できます。詳細はこちらをご確認ください。

大量の過去データからAIで未来を予測する

よくあるご質問と回答

一般的なご質問

メールセキュリティ

メールセキュリティクラウドサービス

ビッグデータ統合

印刷管理

クラウド暗号化

マルチデバイス対応テレワーク環境

AP仮想化