R言語

R言語は、統計学の分野で手軽に利用できる代表的言語です。対話型でコマンドを入れるとすぐに結果が得られます。「手軽」といっても、高度な機能を支援するアドインのライブラリが完備しており、通常の目的には十分です。

この利用環境も整備されており、Google Colaboratry環境を用いれば、PC側には何もインストールせずに使えます。PCにインストールする場合でも、200MB程度で、使いやすいプラットフォームを構築できます。

教養の一環(?)としてかじった程度ですが、かなりハマリました。本ページは、その忘備録のようなものです。


本サイトの内容

リンク先のファイルは、すべて .txt ファイルです。クリックすると、「download.txt」がダウンロードするので、適当な場所に保管して開いてください。
実行サンプルは「↓↓↓…」と「↑↑↑…」で囲んであります。この部分をGoogle Colaboratryの「コード」部分にコピーアンドペースト(ペーストは Cntl+V)して実行すれば結果が表示されます。

【配列】
他の軽量言語と同様に、ベクトル、行列、データフレームなどの配列があり、1命令で配列の全要素に同じ操作を行なえ、forループが不要です。しかも、配列の部分指定をして、その部分だけに同じ処理を行えるので、if文も不要になります。
配列の入力方法と要素表現
配列の構造、生成、要素表現、部分指定、配列間の変換、行・列の追加などを扱います。
配列の計算
基本的な組込み関数、配列のソート、配列間の演算ルール、行列の積(%*%演算子)など、通常用いる基本的な操作を扱います。
【グラフ】
グラフ
・数表のグラフ(plot, barplot など):折線グラフ、棒グラフ、散布図など
・数式のグラフ(curve):y=f(x) などの陽関数だけでなく、媒介関数、陰関数、3次元グラフなども
・デザイン改良のためのオプション機能
ABC管理図
グラフとその前処理の例です。
【統計基礎】
R言語は、特に統計分野を重視しており、標準機能だけでもかなりの処理ができますし、ライブラリを用いれば、1命令で判別分析ができるようになっています。
lm()関数・2次回帰式・信頼区間、予測区間
2次の回帰式を例にして、回帰分析の関数 lm() に関する説明をします。
散布図・相関・回帰直線・信頼区間
これらの処理を行う関数の説明とグラフ化の橋渡しをする位置づけです。
統計分布関数
関数一覧、一様分布、正規分布、二項分布、t分布
基本統計量・検定・信頼区間
・基本統計量:sum(合計), sd(標準偏差) など
・検定・信頼区間:
  帰無仮説、t値とp値などの基本概念(解の理解)
  実例:1変数、独立の2変数の検定・信頼区間の算出 t.test() var.test() など
比率検定、独立性検定
2X2分割表、2変数の独立性検定、フィッシャー検体、カイ二乗検定
【統計活用】
判別分析
library(MASS) の lda を用いて、判別関数の算出、期待区分とのチェックなど
クラスタリング
library(cluster) の kmeans を用いて、K-Means法による非階層型クラスタリングをします。

利用環境の設定

Webに多くの解説がありますので、ここでは省略します。

Google Colaboratry で利用する場合

PCにR言語と開発環境 R-Studio をインストールする場合

  • 初心者向けRのインストールガイド
    https://syunsuke.github.io/r_install_guide_for_beginners/index.html
  • R言語インストール(2020年 Windows)
    https://qiita.com/FukuharaYohei/items/8e0ddd0af11132031355

  • 参照URL