本文
7月15日から7月26日まで行われた授業公開週間に経営情報学科1年生対象の経営情報学研究序論を公開し,高校生に出席してもらいました。対象となったのは7月16日と7月23日の授業で,高校生の参加があったのは7月23日の以下の授業です。
テーマ:関係を「見える化」するためのデータ分析
講師:冨田哲治教授
授業では,数値や記号の集まりであるデータの間にある関係を「見える化」するためのデータ分析について,高校数学でも登場する基礎的な分析法から,多次元データを可視化する高度な分析法まで,統計ソフトによる分析事例を交えて紹介しました。
以下に講義終了後,高校生を含め受講生から提出してもらった質問とそれに対する冨田教授の回答を一部ですが紹介します。
Q1. 身近な統計学の活用法。
先週あった選挙でのテレビなどの報道番組では,開票から僅かな時間で「当確(当選が確実)」の情報が出ていたと思います。これは,出口調査などの結果に基づき統計学を利用して算出されています。
Q2. 統計学でも,傾向や特徴をつかめないデータってあるのですか。
データは「有用な情報」と「ゴミ情報(測定誤差や観測不可能な要因など)」で構成されています。有用な情報に比べてゴミ情報の変動の方が大きいデータの場合は,統計学などで分析をしても有用な情報を得るのは難しいです。
Q3. 統計の仕方がいっぱいあるのはなぜ?1つじゃだめなのか。
講義中でもお話しましたが,データ分析に「唯一の正解」はありません。同じデータであっても,異なる視点で分析することで違った形で結果を得ることができます。なので,必ずしも難しい分析をすれば良いという訳でもありません。簡単なグラフを描いて可視化してデータの特徴をつかむだけでも,実用上とても大切です。
Q4. データの種類によりどの様な統計方法が合っているのか。
データの種類は,大雑把には「数値で測れる量的データ」と「数値で測れない質的データ」があります。もっと細かく分ければ,身長?体重のような連続値データ,人数のようなカウントデータ,0から1の値をとる割合データ,時間データなど様々な種類があり,その特徴に応じて分析法が考えられています。
Q5. データを距離によってグループに分けることによって何がわかるのですか?
似た特徴を持ったグループに分けることで,その後の分析対象をグループ別に考えることができます。例えば,マーケティングの分野では,このグループ分けは「セグメンテーション」と呼ばれています。顧客の行動や, ニーズなどを基準に, 顧客の属性や行動特性から同質とされる複数のグループに細分化することで,どのような集団をターゲットにどんなサービスや商品を提供するかなどの戦略と立てます。