R入門、Rによる様々な統計量の取得
今回はRで色々な統計量の取得方法について書いていきます。
- 最初のデータ
- 平均値
- 分散
- 標準偏差
- まとめ
最初のデータ
まずは処理する用のデータを用意します。
> testData <- c(90, 60, 70, 65, 88)
これはテストなどでの5教科の点数を表すような形です。
この形式を「ベクトル」といい
関数「c()」はベクトルを作成するための関数です。
また行列なども表せますが、今回は簡単のためにベクトルを扱います。
プログラミングの対応としては
R | 多言語 |
ベクトル | 配列 |
行列 | 2次元配列 |
という感じです。
線形代数の知識があればRの習得は早く出来そうです。
平均値
平均値は次の関数で取得します。
> mean(testData)
結果は
[1] 74.6
となります。
分散
分散は次の関数で取得します。
> var(testData)
結果は
[1] 185.8
となります。
分散の求め方は
> sum((testData - mean(testData))^2)/(length(testData)-1) [1] 185.8
でも表すことが出来ます。詳細は基本的な統計学を参照して下さい。
標準偏差
標準偏差は次の関数で取得します。
> sd(testData)
結果は
[1] 13.63085
となります。
また
> sqrt(var(testData)) [1] 13.63085
でもOKです。