3-1 既存の業務にデータ分析を活用する場合
例:
- 次のイベントではどのぐらいの集客が見込めるのか
- 顧客のクレームのうちどのような内容が多いのか
- 商品Aはどのような顧客によく売れているのか
- 平均的な顧客行動はどのようなパターンか など
3-1-1 非専門家によるデータ分析実務
- 商品Aはおそらく20代女性に最もよく売れているだろう
→性別 × 購買金額(もしくは平均勾配金額)を表かグラフにして比較する - 商品Bを買った人は、未購入の人と比べて商品Cを買いやすいだろう
→商品Bを買った人のうち商品Cを買った人の割合と、全体における商品Cを買った人の割合を比較する - ウェブ広告のデザインEとFではどちらが顧客の反応が良い(クリックしやすい)だろうか
→デザインEを用いた広告を2週間表示させた後に、デザインFを用いた広告を2週間表示させ、各広告のクリックされた数を比較する
市民データサイエンス
高度な予測・判別能力を持つモデルを作成するが、主な職務はデータ分析以外の人
(データ分析のためのツール・ユーザー )
3-1-2 データ分析の知識が必要となるとき
- 商品Aはおそらく20代女性に最もよく売れているだろう
→性別 × 購買金額(もしくは平均勾配金額)を表かグラフにして比較する-
重回帰分析のような多変量分析の手法を使う
性別、年代、職業…
分析の結果、年代よりも性別や職業の影響が大きいことを確認できたりする
-
- 商品Bを買った人は、未購入の人と比べて商品Cを買いやすいだろう
→商品Bを買った人のうち商品Cを買った人の割合と、全体における商品Cを買った人の割合を比較する-
効率的なコーディングや大規模データの扱いが可能となり、見逃しやすい他の要因を発見できたりする
例えば商品Xを買った人との関係が発見できる
-
- ウェブ広告のデザインEとFではどちらが顧客の反応が良い(クリックしやすい)だろうか
→デザインEを用いた広告を2週間表示させた後に、デザインFを用いた広告を2週間表示させ、各広告のクリックされた数を比較する-
統計学的な仮説検定(とその応用であるABテストや実験計画など)
2週間という期間の適性を判断できるなど
-
3-1-3 データ分析の専門知識が武器になる時
- クロス表にまとめられないような多数のデータ(変数)」の影響関係を調べて、データの持つ複雑さに対処することができる
- ウェブ広告の例のように、優劣比較に伴う不確実さに対処することができる
- ECサイトの例のように、大規模データから自動的に(購買ルールなど)有益な特徴を抽出することができる
コメント