R言語

R言語は、統計学の分野で手軽に利用できる代表的言語です。対話型でコマンドを入れるとすぐに結果が得られます。「手軽」といっても、高度な機能を支援するアドインのライブラリが完備しており、通常の目的には十分です。

この利用環境も整備されており、Google Colaboratry環境を用いれば、PC側には何もインストールせずに使えます。PCにインストールする場合でも、200MB程度で、使いやすいプラットフォームを構築できます。

教養の一環(?)としてかじった程度ですが、かなりハマリました。本ページは、その忘備録のようなものです。


本サイトの内容(目次)

Rの基礎

基本記述規則
他言語とおおきく異なる事項だけ
命令記述、演算子、制御構造など
plint系の記述方法
配列の操作
他の軽量言語と同様に、ベクトル、行列、データフレームなどの配列があり、1命令で配列の全要素に同じ操作を行なえ、forループが不要です。しかも、配列の部分指定をして、その部分だけに同じ処理を行えるので、if文も不要になります。
 ・配列(ベクトル・行列・データフレーム)の生成
 ・配列の部分指定
 ・ベクトル・行列・データフレームの相互変換
 ・配列間の演算

グラフ

グラフ(リファレンス)
Rはグラフ作成に便利な言語です。本章はグラフ作成のイントロダクションとして基本的な機能を示すとともに、実際にグラフ作成でのリファレンスとして用いることを目的としています。
 ・作図関数の体系
 ・グラフ作成用のデータ形式
 ・オプション機能の説明と実例
グラフ
代表的なグラフのパターンについて、ほぼコピー&ペーストで作図できる実例を列挙しました。
 ・数表のグラフ:折線グラフ、棒グラフなど
 ・数式のグラフ:陽関数だけでなく、媒介関数、陰関数、3次元グラフなども
ggplot グラフ作図ライブラリ
Rだけでも多様なグラフ作成機能をもっていますが、特に大量データを用いる統計分野では ggplot が便利で広く用いられています。
 ・ggplot2 の記述体系
 ・geom_point():散布図、geom_line():折れ線グラフ、geom_bar():棒グラフの概要  ・主要なオプション機能

統計基礎

基本統計
R言語は、特に統計分野を重視しており、簡単な操作で多様な機能ができる関数を多数持っています。
 ・sum() 合計、sd() 標準偏差、cov()共分散行列などの基本統計量の関数
 ・ソート、順序付け
 ・逆行列、連立方程式、固有値・固有ベクトル
ベイズ推論
与えられている事前確率行列について、その特性の幾つかが実現したとき、事後確率を求めるモデルです。アルゴリズムが簡単なので、ここまでの知識を組み合わせるだけで、それなりのアプリケーションができることを示しました。
統計分布関数
関数一覧、一様分布、正規分布、二項分布、t分布
回帰分析
統計分析の基本である回帰・重回帰分析の分野です。
 ・散布図・相関・回帰直線・信頼区間、重回帰などを対象にします。
 ・その処理に必要な lm(), predict() などの使い方
t検定
平均の検定・推定のためのt検定を扱います。
 ・帰無仮説、信頼水準、t値、P値など検定の基本概念
 ・t.test() 関数の使い方
 ・両側検定、上側検定などの具体的操作
比率検定、独立性検定
2X2分割表、2変数の独立性検定を題材に、フィッシャー検定(fisher.test)、カイ二乗検定(chisq.test)

統計活用

ビジネス活用、AIへの基礎技術としてのデータ分析の分野です。

判別分析
library(MASS) の lda を用いて、判別関数の算出、期待区分とのチェックなど
クラスタリング
library(cluster) の kmeans を用いて、K-Means法による非階層型クラスタリングをします。

利用環境の設定

Webに多くの解説がありますので、ここでは省略します。

Google Colaboratry で利用する場合

私個人向けのメモ:GoogleChrome → 右上の■(Googleアプリ)→ドライブ→R.ipynb

PCにR言語と開発環境 R-Studio をインストールする場合

  • 初心者向けRのインストールガイド
    https://syunsuke.github.io/r_install_guide_for_beginners/index.html
  • R言語インストール(2020年 Windows)
    https://qiita.com/FukuharaYohei/items/8e0ddd0af11132031355

  • 参照URL