SSブログ

教育機関向けソリューション SAS [データサイエンス、統計モデル]

朝野熙彦先生がSASでコラムを書いています(書いていました)。
http://www.sas.com/ja_jp/industry/higher-education.html#-------

10回目で最終回になってしまったのが残念ですが。。。
改めて朝野先生が書かれた本を読みなおしてみたくなりました。

コラムには、確かに!と思える言葉がたくさんあったので、備忘録としてメモしておきます。

--------------------

私は良いデータ・アナリストが育つ条件は「よい本」「よい仲間」「よい仕事」の3つだと考えています。

理論は理論として整合性がなければなりませんが、その理論が実社会で役立つかどうかは実社会が答えを出すことです。データ解析の価値は現実の世界にどれだけ貢献できたかによって評価すべきでしょう。

データ解析の実務で大切なことは、回帰分析の計算手順を覚えることでもなければ、パソコンの操作を覚えることでもありません。アウトプットが何を意味するかについてユーザーが理解することこそが肝心なのです。

学生時代を考えると、もし分からない講義内容が出てきたら、それは勉強不足の学生の方が悪かったのです。しかしプレゼンテーションにおいては、聴き手が理解できなければ、それは報告者の方が悪いのです。授業とプレゼンテーションは似て非なるものだということを実感しました。

ところでどういうわけで類似した分析法がたくさん生まれてしまったのかという疑問への私なりの結論ですが、それは応用目的に応じて発展するというデータ解析ならではの性格にあると思います。

低次元でありながらも原データの情報が再現できる2相点間距離が定義できないかというのが、1990年ごろの私の関心事でした。それは無茶な相談だというのが最近の西里(2014)の見解です。結局空間の次元を拡張するしかない、という見通しです。西里先生はまた、本来は複雑なデータ構造にもかかわらず、低次元の解釈だけで済ませることを戒めています。たしかに因子分析で30因子も抽出しておきながら、最初の2ないし3因子だけを図示して済ませてしまうデータ解析を目にすることがありますね。

--------------------