ぴぴぴぴよよ

大学院生です。

【研究紹介】計量経済学でM-1グランプリを見る

皆さんこんにちは。M-1グランプリのエントリーが始まりましたね。僕はお笑いがかなり好きで、もちろんM-1も欠かさず見ています。Netflixで何周も見返すので、ネタの一部を言われたら何年のどのコンビか当てられます。

ところで、どうしたらM-1で良い順位がもらえるのでしょうか?なんとなく吉本興業の芸人が勝っているイメージがありますが、偶然でしょうか?なんとなく芸歴が長い芸人が有利なイメージがありますが、本当でしょうか?このように、複数の要素の関係について、因果関係を特定する方法があります。それが、計量経済学です。非常に難解で、僕自身よくわかっていないので、中学校の数学の知識まででわかるように説明したいと思います。

 

【ちょっと脱線】
因果関係と似た概念として相関関係があり、よく混同されます。両者には大きな違いがあるので、先に説明しておきます。因果関係とは、「Aの変化が原因となってBの変化が起きる関係」です。例えば、一般に気温の低下が原因となっておでんの売上が向上することが知られています。一方で相関関係とは、「Aの変化とBの変化が関係しあっている」ということです。例えば、数学の点数が高い子どもは理科の点数も高いでしょう。しかし、数学の点数の向上が原因で理科の点数が上がるかというと、そんなことはないでしょう。これが因果関係と相関関係の違いです。

 

中学数学の復習

さて、いきなり数学の話で恐縮ですが、1次関数って覚えていますか?y=ax+bとか言われてたヤツです。ここで、1個200円のりんごを買うことを考えます。購入するりんごの個数をx個とすると、合計金額y円について、

y = 200x ・・・①

という式で表せます。例えばりんごを5個買うとしたら、合計金額は200×5=1,000円です。10個であれば2,000円、15個であれば3,000円です。

また、1個500円のりんごについては、

y = 500x・・・②

という式で表せます。こちらも、りんごを5個買うとしたら2,500円、10個であれば5,000円、15個であれば7,500円です。当然、同じ個数を買うのであれば、②式の方が金額は高くなります。合計金額や個数はいくらでも変わる値で(これを変数と言います)、りんご1個の値段は定まっています(これを定数と言います)。

そして、xを変えると、それが原因となってyも変わっていきます。どれくらい変わるか、つまり、因果関係の強さを表しているのが定数です。具体的には、今回の場合では①②式それぞれについて、「りんごの個数xを1増やすと、合計金額yは200円増える・・・①」「りんごの個数xを1増やすと、合計金額yは500円増える・・・②」と言うことができます。

ここで、発想を逆転させてみます。りんごの例では、定数が既にわかっていましたが、未知の定数を推測してみましょう。ここで、11歳の日本人男子とその父親を100ペア集めて身長を測るとします。例えばA君の身長は140cmで、その父親175cm、B君の身長は130cmでその父親は162cmという具合です。さて、子どもの身長をy[cm]、その父親の身長をx[cm]としたとき、yはどのような式で表せるでしょうか。

y = 0.8x・・・③

こんな式で表せたとします。もしこの式について、計量経済学の手続きに従って正当性を示せたとすると、父親の身長が1[cm]高いと、息子の11歳時点での身長y[cm]は0.8だけ高くなるという因果関係が期待できると言えます。りんごの例と同じように、0.8という定数が、2つの要素の因果関係の強さを示しています。父親の身長をぐいっと伸ばしたりはできないので、因果関係ではないじゃないか!と言いたくなりますが、「ある子どもが今の父親よりも1cm背の高い父親の遺伝子を持っていたら、その子どもの身長は今よりも0.8cm高かったはずだ。」と言い換えると、因果関係感(?)が伝わるかと思います。

 

M-1グランプリの分析

さて、ようやく本題に入ります。③式と同じ方法で、M-1グランプリの順位について、芸歴〇年という要素、吉本興業に所属しているという要素がどのような因果関係を持っているのか(もしくは持っていないのか)考えてみましょう。上記だけでは説明できない考え方も含まれますが、とにかく、定数が因果関係の強さを示すということだけ覚えておいてください。

 

今回使う式は以下です。

順位スコア = α1 × 芸歴 + α2 × 吉本所属かどうか・・・④

注目してほしい点は3つです。

・順位スコア
順位が高いほど数字が低くなってしまうので、順位スコア = 11 - 順位として計算しています。

・α1 × 芸歴

芸歴が1年長くなると、順位スコアがα1ポイント上がる(=順位がα1ポイント上がる)ということです。

・α2 × 吉本所属かどうか
吉本に所属していると、順位スコアがα2ポイント上がる(=順位がα2ポイント上がる)ということです。数字で表せない要素も、0と1を使って表せます。複雑なのでここでは割愛します。(気になる方は”ダミー変数”でググってみてください)

 

統計ソフトで、M-1グランプリ勝戦2015-2021について分析した結果が以下です。

統計ソフトが出した答えは。。。

”Coefficient”と書いてある列の、"geireki""yoshimoto"の行を見てください。"geireki"と書いてある行にα1が、"yoshimoto"と書いてある行にα2が表示されています。つまり、M-1の順位は、芸歴が1年長くなるとおよそ0.166高くなり、吉本に所属しているとおよそ1.91高くなると言えます。

 

結果の解釈

皆さんはこの結果についてどう思いますか?個人的には、ある程度直感的な結果が得られたと思いますが、芸歴がさほど順位に影響しないことは意外でした。ただ、2018年霜降り明星(芸歴5年目で1位)や2020年おいでやすこが(芸歴1年目で2位)のような、超レアケース(外れ値と言います)によって芸歴の影響が薄められていると思います。こうしたケースを除いて分析してみると、もう少し芸歴の影響が顕著になるでしょう。

今回はデータの準備がめんどくさかったので、2015年以降で分析しましたが、初代M-1からまとめて分析しても面白いかもしれません。ますだおかだ松竹芸能)やアンタッチャブル人力舎)など、非吉本芸人の優勝があるので、違った結果が得られるはずです。また、順位に影響する変数として、これまでの表彰歴や関東出身/関西出身なども考えられます。有効な変数は全ていれるべきなので、もう少しこのテーマで分析を続けてみたいですね。

 

 

今日は計量経済学の紹介になれば、と思いこの記事を書きました。僕自身、進学してからこの分野の勉強をしているので、まだ3か月程度の経験しかありません。それでも、正しい手順を踏めば、世の中に隠れる因果関係がわかるという強烈な分野なので、とても魅力的に感じています。少しでもこの魅力が読んでいる方に伝わっていますように。。。!

 

【研究紹介】日本は温暖化しているのか

皆さんこんにちは。今年は6月下旬から酷い暑さでしたね。まだ梅雨なのに、40℃を超えた地域もあったそうです。

 

今日は僕の研究分野である、気候変動と農業被害について触れたいと思います。そもそも気候変動は発生しているのでしょうか。気候変動のひとつである、温暖化について考えてみます。

 

単純に年平均気温を比較して、(例えば)1976年と2020年とを比較して、今の方が気温が高くなっていると主張することもできます。しかし、もし冬が温暖化して夏が寒冷化していた場合に変化なしと判断されてしまいます。月間平均気温にしても同様のことが言えます。月初に温暖化して月末に変化がなかった場合や、たまたま平年より雨が多かった場合など、年平均気温や月平均気温で考えると正確な評価ができない場合があります。平均気温が上がっているとして、暑い日の数が増えているのか、暑い日が極端に暑くなっているのか、判断できません。人間にとっては些細な違いかもしれませんが、作物にとっては大きな違いです。

そこで登場するのがハザード曲線です。これは「ある自然現象の強度とその発生確率」を表す曲線グラフです。一般に、強度の高い現象(超高温、大洪水、大地震など)は発生確率が低く、強度の低い現象にはその反対のことが言えるため、右肩下がりの曲線になります。従来は地震や火山の噴火に適用されていたモデルですが、最近になって気象にも適用されるようになりました。これを温暖化に当てはめて、高気温になる確率が高くなっている場合に温暖化していると言えそうです。

 

それでは、この考え方を用いて、

稚内アメダス(地域気象観測システム)とつくばアメダスのデータから

②8月の日平均気温を用いて

③8月n日の平均気温がX℃を超える確率Y

を表すハザード曲線を、1976-2007年と1990-2020年について描いてみます。

(厳密には、雨で涼しい日を考慮して前5日間の平均気温を扱います。他と比べて極端に気温が低い日があると、比較結果がおかしくなるからです。)

下のグラフを見てください。これは、稚内アメダス(地域気象観測システム)のデータから、8月n日の日平均気温がX℃を超える確率Yについて表しています。必ず起こる現象の発生確率は1なので、稚内の8月はほぼ確実に6℃を超えると言えそうです。

青いグラフ(1990-2020のデータから作成)とオレンジのグラフ(1976-2007)を比較してみると、9-11℃を超える確率が高くなっていることがわかります。一方、12-14℃を超える確率はそれほど変化していません。

1976-2007/1990-2020の稚内ハザード曲線

次に下のグラフを見てください。これはつくばのアメダスのデータを用いて、同じ方法で作ったものです。当然稚内よりは暑いですが、青とオレンジのグラフに大きな差が見られません。(少なくともこの方法では)つくばのアメダスが観測する範囲において、ここ40年で温暖化は起きていないと言えそうです。

1976-2007/1990-2020のつくばハザード曲線

 

さて、この分析から地球温暖化がある/ないと言い切ることはできません。いろいろ理由はありますが、やはりアメダスの観測拠点1つ分ではデータ不足でしょう。また、観測所の標高について考慮できていません。標高が違えば気象条件も違うので、純粋な気温のみの比較にはなっていません。ただ、温暖化の影響が地域によって異なるということは言えそうです。今回の結果と衝突しますが、一般に北海道では、本州に比べて温暖化の進度が遅いことが指摘されています。もう少し色々な観測所について調べてみたらわかることが増えそうです。

ここで強調したいのは、ハザード曲線で考えると、少なくとも稚内においては「中程度の気温を超える確率が上がる現象」が起きているということです。温暖化の解像度が上がりましたね!ちなみに、全国の観測所で同じ分析をしても、ほとんどの地域でこの現象が見られます。

 

今回はこのあたりで終わりにします。今日お伝えしたかったのは

①ハザード曲線で温暖化の解像度を上げよう

②温暖化の影響は地域によって異なり、北海道は本州に比べて進度が遅い

の2つでした!皆さんも身の回りの出来事についてハザード曲線を作ってみてください。

 

 

 

【日記】サボってました

こんにちは。三日坊主という言葉は、一度出家した者が、修行に耐えられずたった三日で俗人に戻る(僧侶を辞める)ことから出来たそうです。このブログも3日書いて2か月放置してました。俗人なので。

 

今月は修士課程一つ目の学期が終わる頃で、なんとなく院生生活も勝手がわかってきたので、今回は最近何に時間を使っているのか紹介したいと思います。

基本的にやっていることは3つです。

①論文・専門書を読む
Pythonの勉強
③就活

大学院進学を考えている人に届け!

 

①論文・専門書を読む

自分の関心分野の論文や本を読んだり、講義の予習復習のために教科書を読んだりしています。関心分野については、コメ生産量と農業環境の関係について分析した論文を読むことが多いです。いずれは面白い論文を紹介する記事を書きたいのですが、アウトプットするにはまだ理解が足りていないような気がします。。。

最近読んで面白かった話を少し紹介します。温暖化によって気温が上がると、農業生産は著しく低下します。注目すべきは、熱帯地域ほど気温の上がり方が激しいことです。これは直感的だと思う人も、意外だと思う人もいるかもしれませんが、タイとイギリス、どちらがより温暖化しているか、というとタイなんですね。そして、世界のコメ生産のおよそ60%は熱帯国によるものです。農作物の中でも、特にコメが温暖化の危機にさらされているということです。

また、発展途上国と呼ばれるような国は熱帯に多いです。つまり、貧しい国ほど温暖化の影響を受けやすいということです。環境問題は、地球全域に公平に被害を与えているわけではありません。環境問題は正義・公正という観点から考えると新たな発見があると思います。(詳しくは”環境正義”で調べてみてね)

 

Pythonの勉強

プログラミング言語Pythonの勉強を始めました。プログラミングは機械とコミュニケーションを取る方法です。例えば、PCで”A”という文字を入力したければキーボードをタイピングすると思いますが、「”A”と入力しろ!」と言葉で指示を出すことで”A”という文字を入力することもできます。1文字であればキーボードで良いのですが、1秒間に500文字入力するとなると指が追い付きませんし、タイプミスも増えます。高速で、正確に、自動で機械を動かすために、プログラミングが使われます。

とりあえず、タイピング練習ソフト(寿司打)を自動でプレイできるようなプログラムを組んでみました。今後は自動でWeb検索をして、情報をピックアップしてくるプログラム(スクレイピング)を勉強するつもりです。

 

③就活

これが非常に厄介です。夏のインターンに向けて面接を受けたり書類を書いたりしています。研究が大学院生の本分なので、就活に力を入れすぎるのは悲しいですが、ある程度の生活水準で生きていくためには仕方のないことです。

 

以上、この2か月やっていたことでした。このブログは今後もぼちぼち続けていきたいと思います。

【日記】わかりやすさと誠実さの狭間で

こんにちは、今日は純粋な日記になります。

 

かれこれ4年間、個別指導塾で英語を教えています。中学生の頃、美しく整理された英語文法に感動して以来、リスニングもスピーキングもかなぐり捨てて英文法を勉強してきたので、英文法・英語リーディングには自信があります。(スピーキング、リスニングはてんでダメです。)

 

今日は分詞の単元の授業をしてきました。今日は分詞の単元で

” Look at that sleeping baby. (あの寝ている赤ちゃんを見てください。)”

という文章の sleeping について考えました。sleeping は動詞sleepが変形した形ですが、babyに修飾する形容詞であり、that sleeping baby は品詞的に that beautiful picture と同じ構造を持っていると言えます。(どちらも指示代名詞-形容詞-名詞の構造)

中高生は、以下2つの点でこのsleepingの解釈に戸惑います。
①動詞であったはずのsleepingが、beautifulと同じはたらき(形容詞)であるということ。

②sleepingが分詞とも形容詞とも呼ばれていること。(sleepingは”形容詞として機能する分詞”なので間違いではないですが、分詞なの?形容詞なの?どっちもってどういうこと?と思ってしまうようです。)

 

この手の混乱を解決するため、僕は「寝ている赤ちゃん」という日本語文を引き合いに出して、こう説明しています。

「”寝ている赤ちゃん”の 寝ている は動詞の連体形だよね。連体は体言(名詞)に連なるということだから、日本語動詞の連体形は、名詞を修飾する英語形容詞のはたらきと同じなんだ。”寝ている(動詞の連体形)”も"sleeping(現在分詞)"も、動詞が変形して出来たという点で一緒だよね。そして、動詞が連体形の形を取っていることと、分詞が形容詞のはたらきをしていることも対応して理解できるかな。」

文法用語が多いので一字一句文章にすると難解ですが、

①動詞の形容詞化に近いことは日本語でも起きている

②「分詞」と「形容詞」は「動詞」と「連体形」くらい違う

ということを説明しています。
だいたいこれで納得してくれるので、その後の副詞として機能する分詞や、形容詞句/副詞句の理解もスムーズになります。

 

この説明がわかりやすいかどうかは、生徒の学力やバックグラウンド、理解の特性に依るので気にしてはいません。わかりやすいといいな、程度です。

気になるのは、この説明は不正確ではないか、という点です。英語は屈折語(語が分解できない形に変化する言語:sleep→slept など)なのに対して、日本語は膠着語(語と語が組み合わさって意味を作る言語:寝る+た→寝た など)であり、動詞の扱いが大きく異なるため、英語動詞の分詞化と日本語動詞が連体形をとることは対照的でないような気がしています。
それと、「分詞-形容詞」の関係と「(日本語)動詞-連体形」の関係が近いというのが正確だとして、この説明では英語動詞や名詞のように、品詞がそのまま語の分類になっているものを連想すると余計わかりにくくなります。「分詞-形容詞」「(日本語)動詞-連体形」のような「語の呼び名-語の役割」の関係は、「名詞-名詞(名詞という語が名詞という役割を担っている)」「(英語)動詞-(英語)動詞(英語において、動詞という語は動詞という役割を担っている)」の関係とも近いのです。

 

結局、進路選択の自由度をできるだけ上げてあげたいという思いで塾講師をしているわけなので、多少不正確でもそれで点数が取れれば良いやという態度でやっています。でも、学問に対して非常に失礼な態度を取っていると思い、時々後ろめたい気持ちになります。

 

塾の研修は、生徒の褒め方とか宿題の出し方とかやってないで、教科ごと、単元ごとの具体レベルで指導のナレッジを共有してほしいなあ、なんて思ったりもします。集団じゃなくて個別指導だからナレッジがナレッジにならない、というほど個性的な生徒はまだ見ていない気がする。

 

 

屈折語膠着語の説明は本題でないので、関心がある方はより丁寧な説明を調べてみてください(予防線)。

【雑記】「俺か、俺以外か」のアンケート調査

俺以外の皆さんこんにちは、俺です。

 

皆さんはROLANDさんを知っていますか?歌舞伎町でホストをされている(いた?)方のお名前です。これを書くにあたって軽く調べたのですが、ホストのROLANDさん、という呼び方が正確なのかわからないので保留しておきます。

 

有名な話ですが、彼のホストとしての自信が「俺か、俺以外か」という名言を産んだそうです。

 

 

話は変わりますが、”MECE”って聞いたことありますか?英語で”Mutually Exclusive, Collectively Exhaustive(漏れなく、ダブりなく)"を意味する略語です。

 

例えば、渋谷駅利用者の年齢層を知るためにアンケートを取りたいとします。

A.10-20歳/ B.20歳-30歳/ C.30歳-40歳

という選択肢があったらどうなると思いますか?

「20歳はAとBどっち選べば良いんだよ!」

「私は30歳ですけど、Bですか?Cですか?」

「ボクは2歳でちゅが選択肢がないでちゅ」

という声が上がるのではないでしょうか。

 

この選択肢の問題点は

①20歳がAとBにダブっている。

②30歳がBとCにダブっている。

③10歳未満、41歳以上が漏れている。

の3つです。つまり、”MECEではない”と言えます。

このままでは、渋谷駅利用者の年齢層が知りたいのに、2歳が存在しないことになったり、20歳がAとBどちらにも数えられたりするため、正確なデータが得られません。(そもそも選択肢に10歳分の幅があるってどうなの?という意見は一旦置いておくとして)この選択肢を”MECEである”状態にする必要があります。

 

そこで、上記選択肢を少し修正してみます。まず、ダブりを解消します(問題点①②)。BとCが他の選択肢とダブらないように修正すると、

A.10-19歳/ B.20歳-29歳/ C.30歳-39歳

になりますね。

次に、漏れを無くします(問題点③)。選択肢以外の年齢も選択肢に含めれば良いので、新たな選択肢Dを追加し、

A.10-19歳/ B.20歳-29歳/ C.30歳-39歳/ D.それ以外

になりました。いかがですか?これで漏れもダブりもありません!

 

ところで、このアンケートの結果はどういう場面で便利になるでしょうか。例えば、「A. 10-19歳」の回答が多ければ渋谷駅は10代の利用者が多いと言えるため、ティーン向けの広告を打ち出すのに有効な駅だと考えられます。


では、「D. それ以外」が多かった場合は何がわかるでしょうか。恐らく、何もわかりません。10歳未満が渋谷駅を利用することは少ないでしょうが、それにしても40代の利用者が多いのか、50代の利用者が多いのか、他の選択肢が多かった場合に比べて言えることがありません。「漏れもダブりもない」状態だからといって、良い状態とは限らないということです。

 

国際協力学の研究では、研究対象地域に赴いてアンケート調査(フィールドワークと呼ばれるもののひとつです)を用いることがあります。アンケートを取るだけなら誰でもできますが、何のために、どんなアンケートを取るか考える作業は非常に奥が深いと思っています。上手なアンケートを準備できれば、その回答がたくさんのことを教えてくれますが、下手なアンケートの回答からわかることは限られています。当然、わかることが少ないのは残念なことですし、アンケートに協力してくれた人々に申し訳が立ちません。上手なアンケートを準備することは、回答者に対するリスペクトの表れでもあるのです。

インターネットが発達して、SNSなどで簡単にアンケートを取れる時代になりましたが、「MECEになってないなあ」「MECEにはなってるけど、この結果は何に使えるんだろう?」と思うようなアンケートを目にするようになりました。皆さんもアンケートを取る機会があったら、”MECE”というキーワードだけでも思い出してください。

 

【まとめ】

①” MECE(漏れなくダブりなく)”で情報を整理できる。

MECEであれば良いわけではない。特に「○○以外」という整理の仕方に注意。

③誰でもアンケートが取れる時代だけど、実は意外と奥が深い。

 

歌舞伎町ホスト100人に聞いてみた!「俺か、俺以外か?」

 

【自己紹介】話し相手がいないので

こんにちは。身の回りに話し相手がいないので、ブログをはじめました。

 

今、東京大学大学院の国際協力学専攻というところで、修士課程1年生をやっています。いろいろな自然現象が農家にもたらす被害に関心があります。


例えば、佐渡島には「おけさ柿」という超高級柿があるのですが、去年4月に発生した霜によって90ヘクタール分の新芽が枯れてしまい、推定1億7000万円の被害が出たそうです。(ちなみに、1ヘクタールはタテ100m×ヨコ100mの広さです。90ヘクタールはだいたいディズニーランド2個分!)
こうならないように、霜が降りそうな時期は風上で藁を燃やしてみたり、でっかい送風機で上空の暖かい空気を循環させたりします。
自然現象を”発生させない”ことはできないので、自然現象を”やり過ごす”方法が考案されます。この”やり過ごす”営みが、自然と人間のコミュニケーションのようで、僕はとても好きです。

 

学部時代の同期はだいたい就職してしまい、特に仲の良かった友達は遠方に引っ越してしまい、その日なんとなく思ったことや読んだ本の感想などを話す相手がいなくなってしまったので、このブログをはじめました。

 

【こんな人に読んでほしい】

①大学院生に興味がある人

→日本の学生のうち、修士・博士課程に在籍している人は10%未満です(文科省、2018)。珍しい存在なので興味を持ってください。

②農業や環境問題に興味がある人

→環境問題はキャッチ―なので、偏った見識が広まりやすいと思っています。このブログでは、事実ではなく議論をメインに紹介します。「きのこの山の方がウマい!」ということも、「たけのこの里の方がウマい!」ということも極力書かず、「世の中にはきのこ派たけのこ派がいて、主にチョコレートの量、歴史の長さ、売上高の3つが論点になっているよ!」ということを書きます。隙あらば自分の主張もしたりしなかったり。

③大学院進学を考えている人

→そろそろ夏入試の出願時期だと思うので、何か相談事があればぜひコメントください。僕が受験したのは、東京大学大学院新領域創成科学研究科国際協力学専攻、名古屋大学大学院国際開発研究科のふたつです。参考までに。

 

最低でも1か月はガンバリマス。よろしくお願いします。

 

 

サムネ用。クラーク博士は旧札幌農学校(現北海道大学)の教頭先生でした。