nigoblog

技術系会社のCEOブログ~私的編~

R入門、Rによる様々な統計量の取得

今回はRで色々な統計量の取得方法について書いていきます。

  1. 最初のデータ
  2. 平均値
  3. 分散
  4. 標準偏差
  5. まとめ

最初のデータ

まずは処理する用のデータを用意します。

> testData <- c(90, 60, 70, 65, 88)

これはテストなどでの5教科の点数を表すような形です。
この形式を「ベクトル」といい
関数「c()」はベクトルを作成するための関数です。
また行列なども表せますが、今回は簡単のためにベクトルを扱います。
プログラミングの対応としては

R 多言語
ベクトル 配列
行列 2次元配列

という感じです。
線形代数の知識があればRの習得は早く出来そうです。

平均値

平均値は次の関数で取得します。

> mean(testData)

結果は

[1] 74.6

となります。

分散

分散は次の関数で取得します。

> var(testData)

結果は

[1] 185.8

となります。
分散の求め方は

> sum((testData - mean(testData))^2)/(length(testData)-1)
[1] 185.8

でも表すことが出来ます。詳細は基本的な統計学を参照して下さい。

標準偏差

標準偏差は次の関数で取得します。

> sd(testData)

結果は

[1] 13.63085

となります。

また

> sqrt(var(testData))
[1] 13.63085

でもOKです。

まとめ

今回利用した関数をまとめます。

ベクトルの作成 c()
平均の取得 mean()
分散の取得 var()
標準偏差の取得 sd()
合計の取得 sum()
べき乗 ^N (Nは自然数)
ベクトルの長さを取得 length()