SSブログ

Clementineで重み平均 [データサイエンス、統計モデル]

理科の実験で「てこの働き」について勉強したのを思い出しました。
てこの原理とは、
重さ×距離 = 重さ×距離
というものです。

   ∩_ _ ≡=-
   ミ(゚∀゚ ) ≡=-重さ!
    ミ⊃ ⊃   ≡=-
    (⌒__)っ  ≡=-
     し'´≡=-
  -=≡   _ _∩
 -=≡   ( ゚∀゚)彡  距離!
-=≡   ⊂ ⊂彡
 -=≡  ( ⌒)
  -=≡  cし'


このように長さ2:1になっている天秤の場合は


1[重さ]×2[距離] = 2[重さ]×1[距離]
にすると釣り合います。

ある状態が連続値で与えられている場合、それを離散値に変換したいとします。

四捨五入をする場合、

加重平均をする場合、

こういったデータの加工はClementineが得意ですね。
加重平均を計算するノードを作成しました。
ノードをご希望の方は松本まで。(・∀・)!

データの数が少ないとそれほど差がないのですが、
これが、数百万レコードになってくると計算時間に差がでてきます。


nice!(0) 
共通テーマ:学問

nice! 0