身近な日常をやんわりデータサイエンスしてみよう

身近な情報や現象からデータを取り出して解析してみます。

2023年冬ドラマの「100万回 言えばよかった」の初回を放送直後のツイートデータで振り返る

 2023年冬に放送されているドラマの「100万回 言えばよかった」を初回放送直後のツイートのデータで振り返ります。
www.tbs.co.jp
 TVドラマの放送中とその直後に多くの視聴者から数千から数十万のツイートが投稿されています。ツイッターには投稿者が共感したい感情と拡散したい情報が投稿されています。それらのツイートデータを解析することで、ドラマに対する視聴者の反応を知ることができます。
 このブログでは、視聴して気に入ったドラマの放送直後のツイートを数千収集し、自然言語処理することで、頻出単語を抽出して各ドラマのツイート分析しています。また、気になる頻出ワードの該当ドラマにおける関連ワードを、作成した機械学習モデルで算出してみます。
 プログラミング言語Pythonを使用し、各単語の分かち書きと品詞解析はJanomeで、出現頻度の可視化にはWardCloudで、出現頻度のランキングはCollectionsで、単語間の関連性算出の機械学習モデル作成はWord2Vecで行いました。いずれもプログラミング初心者にも使いやすい自然言語処理のライブラリです。各ドラマのメインキャストの名前と、役名、ドラマ題名などドラマ独自の語彙はJanomeのユーザー辞書に追加登録しています。

ツイートに出現した語彙を可視化

 WordCloudは出現頻度に応じた大きさのフォントサイズで表示してくれます。300の頻出単語を表示しています。気になる単語がありますでしょうか。
 タイトルの「100万回」「言えばよかった」の次に、「ドラマ」、二人の主役の「佐藤」「健」と「井上」「真央」が大きく表示されていて出現頻度が高かったことがわかります。続いて、「面白い」「切ない」、3人めのメインキャストの「松山」「ケンイチ」が見えます。

名詞の出現頻度ランキング

 ドラマの題名、3人のメインキャストが上位で、 「直木」は佐藤健さんの役名、「来週」が「楽しみ」、「ハンバーグ」と続いています。「ハンバーグ」は今回のキーかもしれません。 「板倉」はインパルスの板倉さんです、キーになる役を演じる?

  1. 100万回言えばよかった
  2. 佐藤健
  3. 井上真央
  4. 松山ケンイチ
  5. 楽しみ
  6. 直木
  7. ハンバーグ
  8. 来週
  9. 好き
  10. 板倉
  11. 演技
  12. 展開
  13. 初回
  14. 事件
  15. ゴースト

気になった名詞の関連語を算出

佐藤健

 「佐藤健」での関連語は「タートルネック」「コート」「かっこいい」
 役名の「直木」の関連語は「真実」「存在」「向き合う」「覚悟」「受け入れる」「悠依」でした。

井上真央

 「井上真央」の関連語は「ジャケット」「詳しい」「可愛い」「バッグ」
 役名の「悠依」の関連語は「真実」「向き合う」「覚悟」「受け入れる」「直木」でした。
主人公二人の関連語は良く似ています。

松山ケンイチ演じる魚住譲

 姓の「魚住」の関連語は、「刑事」「死」ですが、名前の「譲」の関連ワードは「乗り移る」「コミカル」「やりとり」と使い分けられているのが面白いです。

ハンバーグ

 関連語は「お腹」「プリン」「テロ」「美味しい」「作る」「食べる」「最強」「出会い」で、ハンバーグがドラマのキーになっていることが想起されます。ぜひ視聴して確かめて欲しいですね。

形容詞の出現頻度ランキング

「面白い」、「良い」はどのドラマでも上位に出現します。「切ない」と「美味しい」は「ハンバーグ」と「プリン」に繋がっていいます。「切ない」が気になります。

  1. 面白い、おもしろい
  2. 切ない
  3. 良い、よい、いい
  4. 可愛い、かわいい
  5. すごい
  6. 多い
  7. 美味しい
  8. 早い
  9. 悲しい
  10. 上手い
  11. しょっぱい
  12. かっこよい

気になった形容詞の関連語を算出

切ない

 「キュン」「笑える」「泣ける」「忙しい」「涙」「しんどい」「感情」「死」「ラスト」とドラマのラストの入り混じった視聴者の感情の起伏を括ったワードになっています。

放送直前のツイートに特徴的なワード「温かい」の関連語

 「温かい」の関連ワードは「切ない」「ファンタジー」「ラブストーリー」「失う」「織りなす」「恋人」「幽霊」でした。このドラマのストーリーに関する事前情報のツイートから抽出されたようです。このドラマの番宣記事をこれらの言葉から作成できそうです。