からあげ博士の日常と研究と

博士課程を満期退学した人が好きなことを好きなままに書くところ。

統計解析

Rのapplyファミリー(apply, tapply, sapply, lapply)をマスターする ――それぞれの関数の使い方

こんにちは。からあげ博士(@phd_karaage)です。Rを使いこなす上で一番苦労する関数の1つにapplyファミリーがある気がします。この前も後輩がapplyではなくforループであれこれ書いていて、別の後輩から苦言を呈されていました。 pythonやRにおいて、forル…

Rとpythonによる分散分析(ANOVA)のやり方 ―― irisデータセットを例にして

こんにちは。からあげ博士(@phd_karaage)です。今回は分散分析を取り扱おうと思います。それはなぜか。単純にTAで分散分析に関する授業のレポートの採点が回ってきたからですね。模範解答を作って、その上で採点をしていく訳ですが、せっかくなら分散分析の…

pandasによる要約統計量(平均、分散、中央値、四分位数など)の求め方 ―― irisデータセットを例にして

こんにちは。からあげ博士(@phd_karaage)です。今回もirisデータセットシリーズ。とはいえそんな難しいことはしません。単純な要約統計量を求めるだけのお話です。要約統計量と書くとあまりなじみがないかもしれませんが、平均や分散、中央値、四分位数など…

scikit-learnのデータセット、irisデータセットの使い方

こんにちは。からあげ博士(@phd_karaage)です。pythonでなにかのデータ解析の練習をしようと思った時に、手元にデータがなければなにもできません。さらに初心者にとって何か使えそうなデータを生み出すのはなかなか難しいところです。さらに言えば、実用的…