Rによる計量政治学ノート
はじめに

このウェブサイトは、2023年度秋学期に開講される「プレゼミ」のための学習用教材です。 プレゼミでは、25名の学生が集まって静かに教員の講義を聴く、といったようなことはしません。 むしろ、授業を受ける前に学生が自分で教科書や資料を読んで宿題をやり、そして教室で発表をして議論をする、という形式をとります。 いわゆる「反転授業」というやつです。
このプレゼミの目的は、3〜4年次に所属する専門演習(以下、ゼミ)で卒業論文を書く際に、いわゆる「実証研究」で卒論を書くための基礎知識を提供することです。 したがって、会計を専門とする学生以外もいることを想定し、どの分野のゼミに入っても役立つように、広く統計学や計量経済学の知識を習得し、それをプログラミング言語Rを使って実装できるようになることが主目的です。 このウェブサイトは、そのための教材として、以下の教科書をベースに作成されています。
- Rによる計量政治学
- Rによるマーケティング・データ分析
- 経営学のための統計学・データ分析



資料の特徴
この資料は,第1章から順番に読んでいくことを想定して作成しています。 ただ,前に説明した内容であったとしても,その章の中で理論やプログラムの説明を繰り返すようにしています。 そのため,きちんと前から順番に学習している人にとっては冗長な記述になっています。
教科書・参考書について
プレゼミのメインテキストは浅野・矢内 (2020)「Rによる計量政治学」オーム社です。 このウェブ資料も、このテキストをベースに作成されています。 サブテキストであるウィラワン・勝又 (2023)「Rによるマーケティング・データ分析」新世社、の一部の内容も含まれています。 重要参考図書として、久保克行 (2021)「経営学のための統計学・データ分析」東洋経済、もオススメです。 この資料は基本的に松浦が自分の勉強用に作成したノートのため、誤りや不備が含まれている可能性が高いです。ミスなどを見つけ次第、松浦まで報告してくれると助かります。 またこのノートは、浅野・矢内 (2020)やウィラワン・勝又 (2023)の内容を網羅しているわけではないので、このノートを使う場合は教科書を手元において、学習することをおすすめします。
教科書選定の理由
なぜ会計学を専門とする松浦のプレゼミで、メインの教科書が「Rによる計量政治学」なのかというと、このテキストが社会科学の一分野である政治学という経営学部生にとっても関連のある興味深い題材を用いて、計量経済学の基礎から応用までをRで実装するための知識を習得できるものだからです。 とりわけ第1部の第2章「研究テーマの選び方」と第3章「理論と仮説」は、卒業論文を書く際にも非常に重要となる内容ですので、全経営学部生によんでもらいたい内容です。
第4章「Rの使い方」と第5章「Rによるデータ操作」は、本書の学習に必要な必要最小限の内容ですので、他の教科書やウェブサイトを参考にして、より詳細な内容を学習したほうが良いですが、この内容を理解し、使えるようになれば、MS Excelを使わずにRだけで分析できるようになるでしょう。
第6章から第15章までが、統計学から計量経済学の内容となります。 おおよそ、代表的な統計量の計算や、グラフを使ったデータの理解、標本(sample)を用いた母集団(population)の推定や仮説検定、複数の統計量の関係性の理解、因果関係を分析する手法の1つである回帰分析の基礎と応用、2値選択の問題を推定するためのロジスティック関数の使い方などを学習します。
ここまでの内容の学習にプレゼミ15回のうち、第2回目から第11回目のおおよそ10回分を使います。 12回〜14回の3回は多変量解析手法として因子分析やクラスター分析、機械学習を用いた判別モデルとして決定木分析を学習します。 最後の講義となる第15回目では、今まで修得した知識を使って、データ分析を行った結果を発表してもらいます。
2年生終了時点で、これらの内容を修得していれば、卒業論文の分析に必要な知識はほぼ習得できていると考えて良いでしょう。あとは関心のある研究テーマを選ぶために、面白そうな専門演習(ゼミ)に入って、Rと統計学・計量経済学を使った実証研究を楽しんでくれれば、プレゼミの目標が達成されます。
プレゼミの運営方法について
最初に触れたように、基本的にこのプレゼミは反転授業の形式をとります。 つまり、授業は家で受けて、宿題を大学でやる、という形式です。
具体的には、講義を受ける前に自宅で行う準備として、このウェブサイトと教科書・参考書の該当箇所を読んでおきます。そこで「ここは分かったけど、ここは分からなかった」というところをメモしておきます。 「分からなかった」という点について、具体的にどこが分からなかったのかを明確にすることが重要です。
その上で、大学にでは、分からなかったところを全員で共有し、分からなかった論点を潰していきます。 そのうえで宿題をやります。授業中に与えられるデータを使って、具体的に分析をやってみて、その結果を講義で発表してもらいます。 宿題の内容は、講義中に指示します。
本書の構成
本書の目次は以下の通りです。
- はじめに
第1部 リサーチデザイン
- 第1章 計量政治学とは
- 第2章 研究テーマの選び方
- 第3章 理論と仮説
第2部 Rを使った計量分析の方法
- 第4章 Rの使い方
- 第5章 Rによるデータ操作
- 第6章 記述統計とデータの可視化・視覚化
- 第7章 統計的推定
- 第8章 統計的仮説検定
- 第9章 変数間の関連性
- 第10章 回帰分析の基礎
- 第11章 回帰分析による統計的推定
- 第12章 回帰分析の前提と妥当性の診断
- 第13章 回帰分析の応用
- 第14章 交差項の使い方
- 第15章 ロジスティック関数
となっています。 第1部は研究の基礎となる内容ですので、全員がしっかりと理解しておく必要があります。 第2部はRを使った計量分析の方法を学習します。
使用ソフトウェアについて
このウェブ資料は、Posit社(以前はRstudio社)が開発したQuartoというソフトウェアを使って作成されています。Quartoとは、RMarkdownの記法で書かれたテキストファイルを、knitrというソフトウェアを介して、HTMLやPDF、MS Word、EPUBなどのファイルを作成するためのソフトウェアです。
最大の特徴は、MS ExcelとMS Wordのようにデータを分析する場所と文章を書く場所が別々ではなく、一つの画面の中でデータ分析とレポート・論文執筆を同時に行える、というものです。
また、Rだけでなく、PythonやJuliaといった他のプログラミング言語も文章内に埋め込むことができるため、データ分析と文章執筆を統合させる環境として非常に優れています。
プレゼミでも、Quartoを使って最終レポートの作成を行う予定です。 Quartoは今も開発が進んでいる新しいレポート作成ソフトウェアなので、情報が少ないことが難点ですが、公式サイトと私たちのRを見れば大抵のことは分かります。