からあげ博士の日常と研究と

博士課程を満期退学した人が好きなことを好きなままに書くところ。

走ってマイルのコストパフォーマンスを考える

 こんにちは。からあげ博士(@phd_karaage)です。ある日自分が想定していないJALマイルが口座に積算されていました。端数のような絶妙な数。自分の持っているクレジットカードから積算されるマイレージは毎月12日頃までに積算されるし、量もそんなに多くないなあ。という感じで履歴を見てみたらありました。

f:id:phd_karaage:20220125233333p:plain

 ああ、確かに沖縄行ったときにタイムズのカーシェア使ったなあ。このマイレージかというお話です。この時はタイムズのカーシェアかニッポンレンタカーの正規料金レンタカーくらいしか空車がなく、まだ料金的に安いタイムズを使ったのでした。

 このマイレージ、走った距離の応じてマイレージがもらえるというものですが果たしてコスパはいいのでしょうか?ちょっと検証してみましょう。

続きを読む

Rとpythonによる分散分析(ANOVA)のやり方 ―― irisデータセットを例にして

 こんにちは。からあげ博士(@phd_karaage)です。今回は分散分析を取り扱おうと思います。それはなぜか。単純にTAで分散分析に関する授業のレポートの採点が回ってきたからですね。模範解答を作って、その上で採点をしていく訳ですが、せっかくなら分散分析の手法的な部分について記事にまとめておこうと思ったからです。

 データをいろいろ見ていくと、平均や標準偏差は分かった、じゃあこの母集団の平均値に差があるの?という問題に直面します。ぱっと見で平均値の棒グラフを見てみて差があるかどうかなんて、あまり当てにならない直感でしかない訳です。逆に消費者にそれだけの知識がないだろうと踏んだ、最低で最悪なグラフがこの世には蔓延る訳ですが。

 という訳でirisデータセットを使って、Rとpythonを使った分散分析について紹介しようと思います。これまでにirisデータセットを使った話はこちら。

www.phd-karaage.com

www.phd-karaage.com

続きを読む

pandasによる要約統計量(平均、分散、中央値、四分位数など)の求め方 ―― irisデータセットを例にして

 こんにちは。からあげ博士(@phd_karaage)です。今回もirisデータセットシリーズ。とはいえそんな難しいことはしません。単純な要約統計量を求めるだけのお話です。要約統計量と書くとあまりなじみがないかもしれませんが、平均や分散、中央値、四分位数などの値になります。こう書かれると分かりやすいと思います。

 そんな要約統計量ですが、Excelでも単純に求めることもできるしわざわざpythonでやらんでも……という声も聞こえてきそうですね。ただデータ解析をしていくにあたってこれら統計量は切っても切り離せない上に、python上で解析しているならこれらも一緒にやっちゃえばいいじゃん。という訳でpythonでどう書くと楽かな、という観点で書いていこうと思います。

 今回使うのはirisデータセット。以前紹介したデータセットですね。

www.phd-karaage.com

 こういうトイデータって、広く手法を紹介するのに便利。

続きを読む