R言語
R言語は、統計学の分野で手軽に利用できる代表的言語です。対話型でコマンドを入れるとすぐに結果が得られます。「手軽」といっても、高度な機能を支援するアドインのライブラリが完備しており、通常の目的には十分です。
この利用環境も整備されており、Google Colaboratry環境を用いれば、PC側には何もインストールせずに使えます。PCにインストールする場合でも、200MB程度で、使いやすいプラットフォームを構築できます。
教養の一環(?)としてかじった程度ですが、かなりハマリました。本ページは、その忘備録のようなものです。
本サイトの内容(目次)
Rの基礎
- 基本記述規則
- 他言語とおおきく異なる事項だけ
命令記述、演算子、制御構造など
plint系の記述方法
- 配列の操作
- 他の軽量言語と同様に、ベクトル、行列、データフレームなどの配列があり、1命令で配列の全要素に同じ操作を行なえ、forループが不要です。しかも、配列の部分指定をして、その部分だけに同じ処理を行えるので、if文も不要になります。
・配列(ベクトル・行列・データフレーム)の生成
・配列の部分指定
・ベクトル・行列・データフレームの相互変換
- apply系 配列内の操作
- 配列の sum, mean など、一つの配列内の操作を簡素に表現できる apply系の関数を説明します。
%>& パイプ演算子、ドット演算子
配列の sum, mean など、一つの配列内の操作を簡素に表現できる apply系の関数を説明します。
グラフ
- グラフ(リファレンス)
- Rはグラフ作成に便利な言語です。本章はグラフ作成のイントロダクションとして基本的な機能を示すとともに、実際にグラフ作成でのリファレンスとして用いることを目的としています。
・作図関数の体系
・グラフ作成用のデータ形式
・オプション機能の説明と実例
- グラフ
- 代表的なグラフのパターンについて、ほぼコピー&ペーストで作図できる実例を列挙しました。
・数表のグラフ:折線グラフ、棒グラフなど
・数式のグラフ:陽関数だけでなく、媒介関数、陰関数、3次元グラフなども
- ggplot グラフ作図ライブラリ
- Rだけでも多様なグラフ作成機能をもっていますが、特に大量データを用いる統計分野では ggplot が便利で広く用いられています。
・ggplot2 の記述体系
・geom_point():散布図、geom_line():折れ線グラフ、geom_bar():棒グラフの概要
・主要なオプション機能
統計基礎
- 基本統計
- R言語は、特に統計分野を重視しており、簡単な操作で多様な機能ができる関数を多数持っています。
・sum() 合計、sd() 標準偏差、cov()共分散行列などの基本統計量の関数
・ソート、順序付け
・逆行列、連立方程式、固有値・固有ベクトル
- ベイズ推論
- 与えられている事前確率行列について、その特性の幾つかが実現したとき、事後確率を求めるモデルです。アルゴリズムが簡単なので、ここまでの知識を組み合わせるだけで、それなりのアプリケーションができることを示しました。
- 統計分布関数
- 関数一覧、一様分布、正規分布、二項分布、t分布
- 回帰分析
- 統計分析の基本である回帰・重回帰分析の分野です。
・散布図・相関・回帰直線・信頼区間、重回帰などを対象にします。
・その処理に必要な lm(), predict() などの使い方
- t検定
- 平均の検定・推定のためのt検定を扱います。
・帰無仮説、信頼水準、t値、P値など検定の基本概念
・t.test() 関数の使い方
・両側検定、上側検定などの具体的操作
- F検定
- var.test による2つの分散の差異や大小の検定
- 比率検定、独立性検定
- 2X2分割表、2変数の独立性検定を題材に、フィッシャー検定(fisher.test)、カイ二乗検定(chisq.test)
統計活用
ビジネス活用、AIへの基礎技術としてのデータ分析の分野です。
- 判別分析
- library(MASS) の lda を用いて、判別関数の算出、期待区分とのチェックなど
- 主成分分析(PCA)
- library の prcomp を用いた主成分分析
- クラスタリング
- library(cluster) の kmeans を用いて、K-Means法による非階層型クラスタリングをします。
利用環境の設定
Webに多くの解説がありますので、ここでは省略します。
Google Colaboratry で利用する場合
私個人向けのメモ:GoogleChrome → 右上の■(Googleアプリ)→ドライブ→R.ipynb
Google Colaboratry 環境での操作
Google Colaboratory を開くと右図が表示されます。
- 灰色部分にコードを入力し、▶をクリックすると結果が下に表示されます。
- コードの編集は、右クリックでコピーはできるのですが、ペースト機能がありません。
Ctrl+v でペーストできます。
- 複数のコードを記述できます。左上の「+コード」をクリックすると、以前の下に▶が追加されます。
PCにR言語と開発環境 R-Studio をインストールする場合
初心者向けRのインストールガイド
https://syunsuke.github.io/r_install_guide_for_beginners/index.html
R言語インストール(2020年 Windows)
https://qiita.com/FukuharaYohei/items/8e0ddd0af11132031355
Rには多数のアドオンライブラリがあります。Google Colaboratoryで使えるライブラリの一覧は、
p = installed.packages()
rownames( p )
で得られます。
参照URL