ikeの日記

しがない研究者の雑記。

プログラミング

k-means法の可視化

授業用に作ったものを、こちらにも載せておく。 ちょっとした説明 今井. 2018. 『社会科学のためのデータ分析入門(上)』第3章に記載されている、DW-NOMINATEの1次元目及び2次元目のスコアを元に連邦下院議員を分類するタスクを扱う。分析の対象は第80議会 (1…

M+1法則の検証

人に見せる機会があったので、ここにも載せておく。 M+1法則とは M+1法則とは、雑にいうと「定数Mの選挙区において、有力な候補者はM+1人になる」という、政治学の理論である。 Reed (1990) は単記非移譲式 (SNTV) による日本の衆議院議員選挙のデータを用い…

頑健標準誤差 (robust standard error) を自力で計算する

RやStataといった統計ソフトでは、たいていの回帰モデルについて頑健な標準誤差 (robust standard error) を簡単に計算できる。 そのため、自力でrobust SEを求めなければいけないケースはほとんどない。 しかし、混合分布モデルなど複雑なモデルを用いる場…

Bradley-Terryモデルを使ったJリーグデータの分析

先日ツイッターでプレミアリーグのデータのBradley-Terryモデルを使った分析を見つけて、自分もやってみたくなった。 こんなことをやっている場合ではないが、同様の分析を2019年シーズンのJリーグのデータを用いてやってみてしまった…ので、ブログにまとめ…

分析コードの望ましい(?)書き方

今学期から、某政治学トップジャーナルのRAとして働いている。 主な仕事は、採択されたペーパーで報告されている統計分析の結果が再現(reproduce)できるかを確認することである。1 そのため他人が書いたRやStataのコードを見る機会が多いが、再現性や可読性…

走るチームは勝てる? - Jリーグのトラッキングデータの簡単な分析

最近Rを使ったデータ分析入門のレクチャーをする機会があったので、せっかくなのでブログにも書いてみようと思う。 リサーチクエスチョン サッカーの話をすると、しばしば「走るチームは強い」という言説を聞く気がする。 相手がボールを持った時素早くプレ…

「統計的に有意」な差は見た目も「有意」か?

最近ツイッターで「回帰分断デザインのプロットで「有意」な処置効果があるように見えるにはt値はどの程度必要か?」というスレッドを見つけた。 結構面白いなあと思ったので、Rでシミュレーションを再現してみた。 以下がそのRコード。結構簡単。 なお、回帰…

ガンマ分布と逆ガンマ分布

ブログに数式とコードを書く方法を学習したので、備忘録代わりに。 shape parameterが、scale parameterがのガンマ分布の確率密度関数は 一方shape parameterが、scale parameterがの逆ガンマ分布の確率密度関数は ここでとおいて確率変数の変換公式を適用す…