2024年5月27日に開催した「第2回RapidMiner AIコンテスト発表会」のレポートをお届けします。今回のRapidMiner AIコンテストでは、過去の気象予報情報などから⼀⽇先の太陽光発電量を予測するモデルを作成し、その予測精度を競って頂きました。
本レポートは、各部門(20〜30代部⾨、40代部⾨、50代以上部⾨)の優勝者3名の方よりご報告いただいた分析アプローチ等を要約しております。ぜひご覧ください。
- カテゴリ:
- 初級者
第2 回 RapidMiner AI コンテスト 発表会 開催レポート
Altair AI Studio 2024.0 リリース
Altair AI Studio 2024.0がリリースされました。
RapidMiner StudioからAltair AI Studioへリブランドされ、複数バージョンインストールが可能になりました。Interactive Analysisでは数値ラベル対応やツリー編集、ノード分布表示など新機能が追加され、ログ機能も改善されました。より使いやすく、強力なAI分析プラットフォームとなっています。
RapidMiner Studio ver.10.2の変更点
RapidMiner Studio ver.10.2ではさまざまな新機能が追加されました。多くの変更点がありますが、その中でも特に大きな変更点をピックアップしております。ぜひご参考にして頂ければと思います。
検証方法のご紹介
RapidMinerでモデルを検証する際の方法をご紹介します。検証方法にはさまざまな種類があり、手元にあるデータのサンプル数や、時系列データに対して時間軸を考慮した検証を行いたいかなど状況によって使い分ける必要があります。
RapidMinerで実行する時のオペレータ、設定方法をご説明しておりますので、ぜひご参考ください。
Leave one out 交差検証/k-fold 交差検証/group k-fold 交差検証/Sliding Window Validation
RapidMinerの始め方
RapidMiner Studioのインストール方法をお伝えします。簡単な手順と注意事項などを記載しておりますので、インストールで迷った時はぜひご参考ください。
<内容>
・RapidMiner Studioのインストール方法、アカウント作成/ログイン
・Manual Enter ライセンスキーの確認方法
・RapidMiner Studio 旧バージョンのインストール方法
・RapidMineの⽇本語化
・Extension(拡張機能)のインストール方法
RapidMinerの基本操作
RapidMinerを初めて操作するという方向けの資料です。
ご自身で分析を進められるように、基本的な使い方の解説やTipsを掲載しています。ぜひ、RapidMinerを立ち上げて、資料をご覧いただきながら実際に操作してみてください。
RapidMiner CheatSheet 時系列データ編
RapidMiner Studioには数多くのオペレーターが収録されており、非常に多機能となっております。今回は時系列データに使われるオペレーターに絞って、CheatSheetにまとめました。プロセス例もご紹介しておりますので、是非こちらをご覧になりながらRapidMinerで実装してみてください。
資料内で使用しているデータ、プロセスを下記からダウンロード頂けますので、お手元のRapidMinerで再現頂けます。
▼https://ksk-anl.smktg.jp/public/file/document/download/3104
※Merge Attributesオペレータは、無償拡張機能「Operetor Toolbox」をインストールいただくとご使用いただけます。Operetor ToolboxはText Processingと依存関係があるため、「Text Processing」の拡張機能もインストールする必要があります。
(Operator Toolboxが利用できない時の対処法はこちら)
機械学習におけるバイアスについて考えてみよう
「バイアス」という言葉が、データサイエンスや機械学習の分野においてどのよう使われているのか。バイアスの種類ごとに例をあげて見ていきます。機械学習モデルに偏りがあると分かった場合に、原因を探るための方法などについてもご紹介しております。
【シリーズ連載】データを一から分析してみよう(Part2)
Kaggleで公開されているデータを使った、データ分析プロセスの連載記事です。Part2ではデータを確認しながら欠損値や外れ値の処理を行ってモデルを作成し、Kaggle のコンペティションに実際に参加するまでをご紹介します。機械学習やデータ分析初心者の方も、是非ご一緒にデータ分析を進めていただければと思います。(Part1の記事はこちら▼)
資料内のプロセスは下記からダウンロード可能です。お手元のRapidMinerで再現頂けます。
https://ksk-anl.smktg.jp/public/file/document/download/3171
マーケットバスケット分析
マーケットバスケット分析は、顧客の購買データを分析し、同時購入される商品を見つ出す手法のことです。有名な事例に「おむつとビール」があり、売上アップやマーケティング施策に活かされています。
本資料では、「マーケットバスケット分析」について、取引データサンプルを用いてハンズオン形式でご説明します。資料内で使用しているプロセスを下記からダウンロード頂けますので、お手元のRapidMinerで再現頂けます。
▼https://ksk-anl.smktg.jp/public/file/document/download/3137
【初心者向け】RapidMinerで始める簡単データ分析
RapidMiner をダウンロードしてみたもののどのように使えばよいか分からないという方に向けた、使い方の入門講座です。RapidMiner Studio の基本機能と特徴について、チュートリアルを通して学んでいただき、RapidMiner の操作に慣れていただけたらと思います。ぜひ、資料記載のリンクからサンプルデータをダウンロードいただき、実際に操作してみてください。
※本資料は、RapidMiner Studio Version9.10を使用しています。
RapidMiner9.10リリース
2021年8月に、RapidMinerの9.10がリリースされました。実際にお客様からご要望があったものが実装されております。主な変更点についてご紹介しておりますので、ぜひご参考にして頂ければと思います。
利益重視の機械学習モデル評価方法〜化学メーカーを事例に〜
機械学習モデルの有効性を評価するプロセスを、化学メーカーの事例を用いてご紹介します。データサイエンスの問題をコスト(円)に置き換え、状況を理解することで、最も良いビジネス上の意思決定を行うことができます。
【初心者向け】モデル評価指標 ー回帰編ー
機械学習モデルを評価する上で、目的に合わせた評価指標の選択する必要があります。
回帰モデルを評価する際に用いるPerformanceオペレータと代表的な評価指標をご紹介します。RapidMiner 初心者の方はぜひご覧ください。
代表的な拡張機能の紹介 ーOperator Toolboxー
マーケットプレイスでよくダウンロードされている拡張機能”Operator Toolbox”をご紹介します。
各オペレータにはチュートリアルが収録されており、使い方をお試しいただけます。目的に合わせて、ぜひご活用ください。
マーケットプレイスと拡張機能の利用方法はこちら▶︎
クラスター分析:知っておきたいこと
クラスタリングは、教師なし学習の一種で共通の特徴を発見しグループ分けする手法です。ビジネスで幅広く用いられており、その代表的な使用例をご紹介します。また、RapidMiner Go を用いた基本的なクラスター分析を ワインのデータセットを使って実行しております。
【初心者向け】モデル評価指標 ークラス分類編ー
機械学習モデルの作成においてモデルの評価は重要です。
・Performance指標がたくさんあり迷ってしまう。
・Performanceオペレーターの種類が多くどれを使うか迷う。
といったお悩みを解決するために、評価指標をまとめました。今回は分類モデルの評価指標をご紹介します。RapidMiner 初心者の方はぜひご覧ください。
拡張機能イントロダクション ーMarketPlaceの活用ー
RapidMiner Studioの機能を最大限活用するための、マーケットプレイスと拡張機能の利用方法をご紹介します。
無料の拡張機能をインストールすることで、レコメンデーションなどより高度な分析ができます。さらに、オープンソースの統計分析ソフトRやプログラミング言語Pythonなどを呼び出して使うこともできます。(一部有償の拡張機能あり)
拡張機能を利用することで、目的に合ったRapidMinerにカスタマイズしさらにご活用いただけます。
RapidMiner vs KNIME
ビジュアルワークフロー型のデータ分析プラットフォーム
RapidMinerとKNIME(ナイム)について、提供しているサービスに焦点を当て比較しております。RapidMiner製品・サービスの特徴もまとめてご紹介しておりますので、ぜひご覧ください。
プラットフォーム セキュリティ
データを最大限に活用するために、組織でデータを扱う安全なプロセスを確立する必要があります。本資料では、RapidMinerプラットフォームのセキュリティについてご紹介します。セキュリティインフラにより、コンプライアンスを気にする時間を減らし、データから実用的な知見を得る時間を増やすことができます。
組織でデータ分析を行い活用をされる方はぜひご覧ください。
RapidMiner製品評価Q&Aシート
RapidMinerの製品仕様や機能面などの基本的な部分についての139個の質問に対する回答集です。データの読み込みや前処理において、どのような手法が利用できるか、このアルゴリズムはサポートされているか、など、ツールの導入検討をされる際に、気になる項目は多々あるかと思いますので、まずはこちらの資料をご一読いただき、記載されていない、あるいは読んでもなおご不明な点につきましては、弊社にご連絡いただけますと幸いです。
資料ダウンロードにつきましては、下記URLよりダウンロードお願い致します。
https://ksk-anl.smktg.jp/cc/0x1QT1W7
食品・飲料業界におけるデータ分析の使用例トップ6
RapidMinerはドイツで始まっており、ドイツ政府などの公的な組織からの助成金プロジェクトとの関わりも深く、ドイツの名物であるビールとの関係性も非常に深くなっています。ビール醸造におけるデータ分析は同じ食品・飲料業界の方々は勿論、製造業の方々にとっても近しい話題が多くなっています。
本資料では、RapidMiner社がこれまでビール醸造会社とデータ分析を取り組んできた経験の中でもビジネスインパクトの高かった6つの事例をご紹介致します。こちらで紹介している事例と同じ課題・お悩みを抱えていらっしゃる方は、是非一度弊社へお問い合わせください。
製造業におけるAlと機械学習技術のインパクト
RapidMinerの共同創設者兼研究責任者であるRalf Klinkenberg氏に製造業での機械学習やAIの注目点や導入の課題、将来像を話していただいたインタビュー記事を日本語訳・追記しました。
製造業における機械学習やAIのトレンド、昨今の新型コロナによるパンデミックの影響など2021年現在の状況も踏まえてお話しいただいておりますので、まさに現在、機械学習やAIに携わろうとしている製造業の方にご覧頂きたい内容となっております。
【シリーズ連載】データを一から分析してみよう(Part1)
これから機械学習やデータ分析を始めよう、という方々も多いかと思いますが、勉強はされていても実際に分析を始めてみると、なかなか思うようにいかないこともあるかと思います。特に自社や自部署の中で、先にされている方がおらず、ご自身が先駆けとならなければいけないような状況だと、何から始めればいいかもわからないことすらあるかもしれません。
本シリーズではKaggleで公開されているデータを使って、最初から最後までデータ分析をしていく過程を連載していきます。作業の中で起きるエラーやトラブル、そしてそれにどう対処したのかもご紹介していきたいと思いますので、これからデータ分析の扉を叩く方は、是非ご一緒に分析を進めて頂ければと思います。
資料内で使用しているファイルと一部プロセスを下記からダウンロード頂けますので、お手元のRapidMinerで再現頂けます。
https://ksk-anl.smktg.jp/public/file/document/download/3170
【マネージャー向け】組織の為のデータ分析アップスキル
データ分析、機械学習において「アップスキル」という言葉やそれに近い言葉をお聞きになったことがある方は多いのではないでしょうか。しかし、このアップスキルに難航して、組織の中でのデータ分析や機械学習の活用に苦労されたり、挫折されたりされる例が珍しくありません。逆に言えば、組織でのアップスキルに成功されている企業の多くはデータ分析の導入においても成功を収めていると言えます。
また、アップスキルが誤解されていることも時折、見受けられます。アップスキルとは一時的なものではありませんし、特定の誰かだけがしなければいけないものではなく、関わる全ての人が持続的に行っていくものです。
本資料では、改めて正しいアップスキルについてご紹介し、組織においてなぜ重要なのかご説明しますので、データ分析や機械学習を組織の中に根付かせたいDX推進の方やマネージャーの方は、是非ご理解いただきたい内容となっております。
RapidMiner9.9リリース
先般、RapidMinerの9.9がリリースされました。それに合わせてStudioやAI-Hubに関する変更点についてRapidMiner社のリリースノートを日本語訳致しました。RapidMinerのバージョンアップについて、ご不明なことがございましたら、こちらをご参考にして頂ければと思います。
RapidMinerとGrafanaの連携
RapidMiner AI-HubにはGrafanaが付属しており、RapidMinerと連携させることで、インタラクティブで動的なダッシュボードを簡単に作成することが出来ます。ダッシュボードによって、可視化が出来るだけでなく、リアルタイムモニタリング等にも活用でき、予測分析の効果や質の低下を防いだり、より効果を向上させたりといった活用が可能です。
本資料では、RapidMiner AI-HubとGrafanaの連携方法や、ダッシュボードの作成方法をご紹介しますので、既にAI-Hubを導入されている方や導入を検討している方は是非、ご覧ください。
RapidMiner CheatSheet モデル作成・検証編
RapidMiner Studioには2021年3月段階で1500を超えるオペレーターが収録されており、非常に多機能となっております。今回はモデル作成と検証で良く使われるオペレーターに絞って、CheatSheetにまとめましたので、是非こちらをより良いモデルの作成や確かな精度検証にお役立てください!
RapidMiner CheatSheet 前処理編
RapidMiner Studioには2021年3月段階で1500を超えるオペレーターが収録されており、非常に多機能となっております。今回はデータ前処理で良く使われるオペレーターに絞って、CheatSheetにまとめましたので、是非こちらをご覧になりながら、RapidMinerで前処理を実装してみてください!
【機械学習初心者向け】10の機械学習アルゴリズム
機械学習と言うと、アルゴリズムのことを連想される方は多いのではないでしょうか。一方、機械学習アルゴリズムは様々な種類が用意されていて、初心者の方にとってはアルゴリズムそれぞれの違いや特徴について知ることも大変で、時間が掛かったり、時には挫折してしまったりすることもあります。
本記事では、そんな初心者の方が知っておくべき、機械学習アルゴリズムについて10個に絞ってご紹介いたします。機械学習をこれから始めたい、考えていきたい方はまずこちらを見て頂くことをオススメ致します。
【機械学習初心者向け】教師あり学習VS教師なし学習
機械学習をこれから始めようという方にとっては、分析課題に対してどのようにアプローチしていくべきなのかすら、なかなか分からないこともあるのではないかと思います。
機械学習自体の初心者向けシリーズとして、今回は教師あり学習と教師なし学習の違いの紹介から、問題解決へのアプローチを考えていきます。
今後も機械学習初心者向けのコンテンツを順次公開致しますので、RapidMinerを使って機械学習に初挑戦する方は是非ご覧ください。
機械学習モデル構築時の Python とRapidMiner の⽐較
機械学習の目的は人間の手を介さずにコンピュータがデータから自動的にパターンを学習させることです。機械学習の構築方法は大まかに分けて、PythonやRといったプログラミング言語での構築と、GUI(グラフィカル ユーザー インターフェース)ツールでの構築との二つがあります。
本資料では実際にPythonとRapidMiner、それぞれで同じデータセットから機械学習モデルを作成してみることで、それぞれの違いについてご紹介します。これから機械学習を進めていこう、という時に、どちらを選ぶべきか考える際の参考として頂ければ幸いです。
RapidMiner 20 Tips
RapidMinerには作業を楽にする様々な機能がありますが、その多くはあまり知られていません。ここでは、便利なRapidMinerのTipsを20個紹介します。
今までドラッグ&ドロップしていたものが、クリック一つで済んだり、同じ作業を繰り返していたものがあっという間に終わったり、そんな裏技みたいな機能ばかりですので、是非ご活用ください。
PythonとRapidMinerのjupyternotebook統合
機械学習はこれまでPythonやRといったプログラミング言語を利用することが主流となっており、GUIツールを使うことはそれに対抗するイメージで考えられていました。しかし、機械学習を業務に適用し、企業として活用するためには、それぞれどちらかだけでなくハイブリッドに利用していくことが有効な手段となります。
RapidMinerは、PythonやRを機械学習を共に進めていくツールと考え、これらによって作成されたモデルやスクリプトとの連携を強化しています。そのため、PythonやRでの機械学習に精通したデータサイエンティストと、ドメイン知識が豊富なエンジニアがRapidMinerを通じて連携してプロジェクトに参加することが可能になっています。
本資料では、RapidMinerとPython、Rの統合の概要について、紹介しております。
動画
現場を巻き込むものづくりデータサイエンスの進め方
データ分析は日本企業にも浸透し始めておりますが、一方で組織内での推進に課題やお悩みを抱えている企業も少なくありません。データ分析の効果的な活用には、組織体制自体を従来の形から見直す必要があります。
当社では、データ分析推進に適した組織として、CoE(Center of Excellence)モデルを推奨しております。データ分析担当部署や担当者だけでなく、現場も関わる形のデータ分析推進を行うことで、活用の拡大、効果の向上を図ることが出来ます。本動画及び資料ではCoEモデルの説明と進め方、そしてCoE推進に役立つデータ分析の総合プラットフォーム「RapidMiner」をご紹介します。
社内でのデータ分析の活用・推進にお困りの方は是非一度ご覧ください。
【各業界向け】RapidMinerユースケース集
全世界でご愛用いただいておりますRapidMinerが、どのような事案でどのような効果を生んでいるのか、今回は製造業以外の金融業界や医療業界、小売業など広範な業界の事例をご紹介いたします。
各業界ごとにまとまっておりますので、ご自身の業界をご覧いただくのは勿論のこと、他業界の事例もご覧いただきますと、ご活用のバリエーションが広がります。
それぞれの課題や方法、効果、問題の概要を端的にまとめておりますので、ご興味のある内容を一目で確認頂けます。
【製造業向け】RapidMinerユースケース集
全世界でご愛用いただいておりますRapidMinerが、どのような事案でどのような効果を生んでいるのか、
今回は製造業における実際の事例を使ってご紹介いたします。
それぞれの課題や方法、効果、問題の概要を端的にまとめておりますので、
ご興味のある内容を一目で確認頂けます。
動画
RapidMiner Goイントロダクション
新製品RapidMiner Goはダウンロード不要の100%Webブラウザで使用できるAutoMLツールです。
数分でモデルが作成でき、内容の可読性も高いため、機械学習の知識に明るくない方でも機械学習の結果をビジネスに生かすことが出来ます。ドメイン知識に詳しい方々自身の手でビジネスインパクトの大きい問題、そしてその効果を確認出来ますので、より大きなビジネスインパクトにつながります。RapidMiner Goは皆さまとデータサイエンティストを橋渡しして繋いでくれます。
今回はそんなRapidMiner Goのイントロダクションを動画にてご紹介いたします。製品情報ページからも詳細ご覧いただけますので、是非ご確認ください。
https://www.rapidminer.jp/rapidminer-go/
AutoModel実行のためのガイド
RapidMinerを使い始めたばかりの方でも、使い慣れた方でも、Auto Modelを使うことで機械学習の活用を一気に加速させることができます。Auto ModelはRapidMiner Studioの拡張機能で、モデルの構築と検証のプロセスを備わっています。何より優れているのは、AutoModelで作成した予測モデルを自分自身で修正することができる点です。運用(deployment)も容易にできます。
Auto Modelは、教師あり学習、教師なし学習、外れ値検出の3つの大きな問題に対応しております。
このガイドでは、RapidMinerのAutoModelについて説明を行なっております。チュートリアル形式でご自身で手を動かして頂きながらAutoModelを試して頂くことが可能です。
Matthew North チュートリアル
「Data Mining for the Masses, Third Edition」の著者であるMatthew North氏 に許可を得て、同書籍の翻訳と編集と公開を実施しております。
シリーズの中では豊富な事例が出てきますので、機械学習の活用シーンをイメージ頂けます。
今回は、まず実施して頂きたい「データの前処理編」をご紹介させて頂きます。
RapidMiner チュートリアル 9.0対応
RapidMinerをダウンロードした後、まず実施して頂きたいチュートリアルです。
今回ご紹介させて頂きます本チュートリアルはVersion9に対応しております。
100ページありますが、初めての方はまず一通りやって頂くことをオススメ致します。