【2017年度版】紅白歌合戦の勝敗を統計学的に予想してみる【株式会社ソケッツの本気】

https://contents.oricon.co.jp/special/img/50000/50438/detail/img660/1510795627929.jpg

 

大晦日、紅白歌合戦見てるかって?いつも見てるのはK-1とかボクシングだよ。

f:id:diradical:20171214031133p:plain

そんな私も興味がない訳ではないです、紅白歌合戦。勝敗結果だけ知れればいいです。そもそもジェンダーフリーを叫ぶようになったこの社会で、どうして男を女を戦わせるのでしょうか。甚だ疑問でしかありません。でもどうせ戦うなら、生物である我らに秘められた闘争心に火がつくってもんよ。勝たねば。そこで1つ思い浮かぶ疑問

 「長年やってるんだし、統計的に勝敗予想できないのか」

選択肢は男か女の二択だし、十分にデータは揃ってるでしょ。どれどれ、調べてみようじゃないか。

大まかなデータはこちらを参照させていただきました。ありがとうございます。

紅白歌合戦データベース 

これまでの戦績

31 - 36

f:id:diradical:20171214032152p:plain

ほほう、いい勝負じゃないですか。気持ち白が勝ち越しているんですね。完全平等じゃないから男女平等にそぐわない!って叫ぶ人はいないのかしら。それほど男女で実力が拮抗してるんだね。非常に素晴らしいことであるが、また一つ疑問が。

勝敗の判定方法

よく日本野鳥の会(?)の人たちが懸命にカウントしてる姿は知ってるけど、最近はどうなのよ。それでは去年のデータをどうぞ。ちなみに去年は赤組の勝利です

f:id:diradical:20171214032810p:plain

紅白歌合戦の勝敗の決め方 - ひなぴしより引用

なるへそ。ボールの数で勝敗を決めてるんですね。引用したブログによると、そのボールの内訳がゲスト審査員(10個)+会場審査(2個)+視聴者審査(2個)+ふるさと審査員(1個)。ゲスト審査員の比重がでかいのが一目瞭然。視聴者審査で800万票集まってるのにボール2個分て。会場審査も視聴者審査も買っている白組がなぜ負けたのか。それは計算していくと、ゲスト審査の10個がほとんど紅組に入っているからである(8:2か7:3で)。

 なお、この方法、地味に毎年のように変わっているようなので

2016年以降はまた、少し変わると思います。

紅白歌合戦の勝敗の決め方 - ひなぴしより引用 

f:id:diradical:20171214033807p:plain

なんでやねん、調べたのに。

勝敗の順序

(1回目→)白白白紅紅紅紅紅紅白白白白白紅紅紅紅紅紅紅白白紅紅紅紅白白白白白白白白白白白白白白紅紅(←67回目)

f:id:diradical:20171214035003p:plain

ほうほう、こういう並びなんですね。ここ最近は白が勝ち越しているようにも見えますね。6回連続とか統計的にどうなのよ。ちなみに私は統計学の「と」も知らないのでこの順序見ただけでは何も判断できません。

f:id:diradical:20171214035120p:plain

助けて誰か。

ということで他の人の意見を伺うことに。

知恵袋の予想(過去)

detail.chiebukuro.yahoo.co.jp

いつでも実力が等しくて、勝敗が偶然によるならば、勝率は50%になるでしょうが、実際のところどうでしょうか。

『偏りの戻り』というのが大数の法則のことを言っているのであるならば、無限の試行を繰り返せば収束するというのはその通りですが、通常は独立を仮定しているので、今回の勝負の勝率については過去の勝率と無関係です。つまり、五分五分なら五分五分のままです。

f:id:diradical:20171214042008p:plain

 なるほど分からん。

ブログの予想(過去)

www.barks.jp

さて、2008年の紅白歌合戦について、カラオケJOYSOUNDに入曲されているそれぞれの組の出場者全員の演奏数ランキングを集計してみたところ、あっさりと結果が。

紅組──平均182位
白組──平均214位

結構な得点差をもって、紅組のランキングが高いことが分かる。つまり、より多くの支持を得ている紅組が絶対有利の状況下にあると勝手に結論。

なお、カラオケ演奏回数の歌手別ランキングをみてみると(下記表)、1位、3位、6位が白組のEXILEコブクロMr.Children、2位、4位が紅組の倖田來未浜崎あゆみとなっており、2008年の出場者の名前が、ランキング上位に多く登場している。この親和性の高さこそ、このデータがランキング指数としての信憑性の高さを裏付けている…と好解釈してしまおう。

f:id:diradical:20171214042124p:plain

カラオケの入曲数で判断とな。なるほど分からん。

youtuber(過去)

www.youtube.com

層が厚い。BUMP OF CHICKENがでる

f:id:diradical:20171214042057p:plain

 なるほど分からん

ビックデータによる予想(過去)←これが本命

prtimes.jp

感性メタとは、特に日本の繊細な感性表現にこだわり、たとえば音楽の歌詞においては全てを読み、内容の真意を理解してから付与するなど機械には出来ない膨大な作業によって生まれた国内唯一のエンターテイメントメタ(ゲノム)データです。

f:id:diradical:20171214042219p:plain

ほう。分からんが凄そうだな? 以下画像は元記事より抜粋。

これが

f:id:diradical:20171214041003p:plain

↓こうなって

f:id:diradical:20171214041024p:plain

↓グラフになって

f:id:diradical:20171214041114p:plain

↓凄そうな感じになって

f:id:diradical:20171214041815p:plain

↓統計だ!

f:id:diradical:20171214041146p:plain

↓結果

f:id:diradical:20171214041229p:plain

f:id:diradical:20171214042250p:plain

ちなみにこの予想、当たってました。

f:id:diradical:20171214042312p:plain

まじか。株式会社ソケットすげえ。歌詞データからその年の紅白の勝敗を当てるなんて…。

 

 

結論

f:id:diradical:20171214042351p:plain

株式会社ソケッツさん、今年も頑張ってください。