RapidMiner(ラピッドマイナー)は機械学習プラットフォームです。データ可視化、データ加工、モデル作成、評価、運用までを一つのプラットフォームで行うことができます。KSKアナリティクスはRapidMinerの正規販売代理店です。

コース内容COURSE

難易度:
【基礎】☆☆☆★

課題創出ワークショップ研修

課題創出ワークショップ研修イメージ

データ分析プロジェクトのマネジメントをこれから行う管理者の方向けのデータ分析基礎研修です。
データ分析・機械学習の基礎知識を身に着け、
分析課題の策定やプロジェクトの管理に必要なことを学習するコースです。

対象者

機械学習プロジェクトのマネージャー・推進者 におススメ

所要時間

約75分

習得内容

機械学習の基礎を習得する
データ分析プロジェクトの管理について学習する

コース内容

全4回 約75分

第1章 データ分析基礎/教師あり学習/教師なし学習
第2章 分析課題の評価方法/実現性とビジネスインパクト/実現性の各指標の説明/課題評価ワークシート記入例
第3章 統計学と機械学習/統計学と機械学習の違い
第4章 データ分析プロジェクトの回し方/データ分析の作業フロー(CRISP-DM)/データ分析プロジェクトの3つの役割/分析プロジェクトを進める際の注意点

 

詳細はこちら

RapidMiner Tips

RapidMiner Tipsイメージ

RapidMinerを活用する際に便利な情報を、チートシートやホワイトペーパーとして配布しています。
下記リンクに順次公開を増やしていきますので都度ご確認ください。
https://www.rapidminer.jp/materials/

対象者

初めてRapidMinerに触れる方 におススメ

内容

オペレーター集
ユースケース集
Tips集 など

詳細はこちら

統計学基礎編

統計学基礎編イメージ

機械学習を活用していくための前提知識である統計学の基礎を学習していく初心者向けの講座です。
本講座ではRapidMinerは使用しません。

対象者

初めて機械学習に触れる人 におススメ

所要時間

約110分

習得内容

統計学の基礎を習得する

コース内容

全4回 約110分

第1章 記述統計/平均・中央値・最頻値/四分位数/標準偏差と正規分布
第2章 相関/相関と因果/相関と因果関係の向き
第3章 中心極限定理/標本数による標本平均分布の変化/⺟集団と標本平均分布
第4章 推定と検定/点推定と区間推定/帰無仮説と対立仮説/両側検定と片側検定

 

詳細はこちら

RapidMiner 回帰編

RapidMiner 回帰編イメージ

回帰問題に特化して、機械学習とRapidMinerの基礎が学習出来る初級コースです。
分析をビジネスに活用するシーンにおいて出番の多い回帰分析を入門から、様々なアルゴリズムを解説する応用までを学ぶことができます。

対象者

初めて機械学習に触れる人、数値予測がメインの人 におススメ

所要時間

約110分
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

機械学習の概要、特に回帰分析を理解する
RapidMinerの基本的な使い方を習得する

コース内容

全3回 約110分

第1章 単回帰/重回帰/多項式回帰/交互作用項の追加
第2章 回帰におけるオーバーフィッティング/リッジ回帰/ラッソ回帰
第3章 k近傍法による回帰/決定木の回帰への拡張(回帰木、ランダムフォレスト、勾配ブースティング回帰木/サポートベクターマシンによる回帰

 

詳細はこちら

基礎編(Pt1/Pt2)

基礎編(Pt1/Pt2)イメージ

機械学習の概要とRapidMinerの基本的な使い方が習得出来る初級コースです。
『顧客データを分析して離反を防ぐ』というケーススタディでRapidMinerの基礎を学習します。

対象者

初めて機械学習に触れる人 におススメ

所要時間

Pt1 約298分 (ver.10.0以前の旧講座は約140分)
Pt2 約416分 (ver.10.0以前の旧講座は約250分)
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

機械学習の概要を理解する
RapidMinerの基本的な使い方を習得する

コース内容

Pt1 / 全5回 約298分 (旧講座:約140分)

第1章 本コースの概要/アナリティクスとは何か/今回扱うデータ/CRISP-DMモデルとは/RapidMinerの操作
第2章 データの準備/データの前処理/変数の定義/プロセスの保存/2章まとめ
第3章 モデリングの概要/k-nnとは/モデルの適用/3章まとめ
第4章 モデルの検証/パフォーマンスの見方/クロスバリデーションとは標準化とは/4章まとめ
第5章 第5章:線形回帰とは/郵便番号のより良い表現/決定木とは/まとめ

Pt2 / 全6回 約416分 (旧講座:約250分)

第1章 本コースの概要/アナリティクスとは何か/今回扱うデータ/CRISP-DMモデルとは/RapidMinerの操作
第2章 結合の理解/離反データの結合/目的変数の生成/性別情報の結合/データの集計/2章まとめ
第3章 データの回転-ピボット/行方向の集計/属性でループ/属性名の削除/年齢の算出/最後の仕上げ/解約データに含まれる顧客データを削除
第4章 ニューラルネットワークの概要/学習係数/局所最適点とモメンタム/不均衡データ/不均衡データの処理/4章まとめ
第5章 サポートベクターマシン概要/カーネルトリック/サポートベクターマシンまとめ/パラメータ最適化/5章まとめ
第6章 変数選択/変数増加法/変数増加法の計算量/Speculative Rounds/変数減少法/変数選択の検証/変数選択後のシナリオ/第6章のまとめ

詳細はこちら