nigoblog

技術系会社のCEOブログ~私的編~

マーケター必見R入門 ! Rを使って数字分析を行う~インストールからグラフの描画まで~

f:id:nigohiroki:20130117005111p:plain

本ブログではたびたび数字による分析がどれほど重要かを書いて来ました。

その数字分析の初めに行う「グラフでの分析」について

グラフでの分析はおおまかな傾向、ある値とある値の関係性(相関)を見るのにとても役に立ちます。

今回はRを使って「グラフでの分析」行なっていこうと思います。

  1. Rとは?
  2. Rのインストール
  3. R入門
  4. Google AnalyticsCSVファイルをエクスポート
  5. RでCSVファイルを読み込みプロットする
  6. まとめ
  7. 使った関数、文法まとめ

Rとは?

ざっくり説明すると、統計に特化したプログラミング言語
様々なライブラリがありそれを利用して、確率密度関数の計算など様々なことが行えます。

資料としましてはこちらがわかり易かったです。
10分で分かるR言語入門ver2_0906

Rのインストール

こちらのページ
The Comprehensive R Archive Network
からOSを選んでダウンロード、
完了後パッケージを開き、画面に従い、ボタンを押していけばOK!

R入門

インストールが完了すればターミナルから

> R

と打ちます。
すると次のような感じで現れます。
f:id:nigohiroki:20130117010002p:plain

> demo()

でデモが見れるみたいなので見てみたり、

> help()

で情報が見れたりします。
終了には

> q()

とうちます。

変数の代入

> a <- 5
> a
[1] 5

「=」ではなく「 <- 」を使います。

では早速実践的な使い方を見ていきます!

Google AnalyticsCSVファイルをエクスポート

まずはGoogle AnalyticsCSVファイルをエクスポートします。
今回はカスタムレポートより、「日 - ページビュー数」の情報をエクスポートします。

すると適当な名前をつけ、R用の作業ディレクトリを作り、そこに保存します。
自分の場合

> mkdir R
> cd R
> mkdir nigoblog
> cd

みたいな感じで作業ディレクトリを作りました。

RでCSVファイルを読み込みプロットする

手順をざっくり説明すると

  1. CSVファイルを読み込み変数に保存
  2. 行列でいう列を保存
  3. プロット関数で読み込み

このような感じで行います。

CSVファイルを読み込み変数に保存

まずCSVファイルが作業ディレクトリにあるかどうか確認

> dir()
[1] "20130116.csv"

「dir()」を用いて確認します。
次に

> dayxpv <- read.csv("20130116.csv")

変数「dayxpv」に20130116.csvファイルを読み込み代入。
つまりCSVファイルの読み込みには「read.csv()」を用います。

> dayxpv

とし、確認しましょう。ちなみに変数名はday x(対) pvみたいなイメージ。

行列でいう列を保存

まず、

> dayxpv$Day

とうちます。するとdayxpvのDay情報が確認されます。
なので

> day <- dayxpv$Day

とします。
同様に

> pv <- dayxpv$Pageviews

としてpvにPV数を代入します。

プロット関数で読み込み

> plot(day, pv)

をすることでグラフを表示させます。
表示されたグラフは次のような感じです。
f:id:nigohiroki:20130117011940p:plain

デフォルトではこのような散布図で、オプションを付けることにより様々なグラフに出来ます。
詳しくはぐぐってみてください。笑

まとめ

以上簡単でしたが、Rの使い方でした。
これまでならばエクセルで充分だと思います。
しかし、これからもっともっと複雑な統計の計算が現れると確実にRの方が早くでき、
ビッグデータにも対応出来ます。
これから先のナウでヤングなマーケターには必須スキルではないでしょうか??

使った関数、文法まとめ

簡単に表にまとめます

関数 or 文法 効果
<- 代入
dir() 作業ディレクトリの中身を確認
read.csv() 引数のCSVファイルを読み込む
table$col tableのcolを読み込む
plot() グラフを描画