2023年冬に放送されているドラマの「ブラッシュアップライフ」の初回、2回目、3回目をツイートデータで振り返ります。
www.ntv.co.jp
なぜ初回、2回目、3回目なのかというと、ツイート数が、初回より2回目(約1.4倍)、2回目より3回目(約1.2倍)と増加しているからです。これはかなり珍しい現象です。今冬の9時から10時代のTVドラマで初回より2回目が増加したのはこのブラッシュアップライフだけです。他は3割から6割減少しています。そこで増加した理由を探るべく、各回への視聴者の反応の違いをツイートから分析してみました。
TVドラマの放送中と放送直後のツイッターには投稿者が共感したい感情と拡散したい情報が投稿されています。それらのツイートデータを解析することで、ドラマに対する視聴者の反応を知ることができます。
このブログでは、視聴して気に入ったドラマの放送直後のツイートを数千収集し、自然言語処理することで、頻出単語を抽出して各ドラマのツイート分析しています。また、気になる頻出ワードの該当ドラマにおける関連ワードを、作成した機械学習モデルで算出することができ、該当単語のドラマのなかでの意味付けを推測することができます。
プログラミング言語はPythonを使用し、各単語の分かち書きと品詞解析はJanomeで、出現頻度の可視化にはWordCloudで、出現頻度のランキングはCollectionsで、単語間の関連性算出の機械学習モデル作成はWord2Vecで行いました。いずれもプログラミング初心者にも使いやすい自然言語処理のライブラリです。各ドラマのメインキャストの名前と、役名、ドラマ題名などドラマ独自の語彙はJanomeのユーザー辞書に追加登録して自然言語処理に反映させています。
まず初回のツイートデータ全体をWordCloud 表示して眺める
WordCloudは出現頻度に応じた大きさで各単語を表示してくれます。
「面白い」「良い」「凄い」「楽しみ」「好き」などのポジティブな単語の出現率はツイート数の9割と、高評価でした。