身近な日常をやんわりデータサイエンスしてみよう

身近な情報や現象からデータを取り出して解析してみます。

2022年秋ドラマ「silent」ロスの低減に、小さなAIで新たなツイートを無限に自動生成!    

 人間は多くの人との共感を持ちたい生物です。TVドラマの視聴中・視聴後にツイート投稿したり、ツイートを調べたくなります。
 ツイートデータから自然言語処理により機械学習モデルを作成すると、新たなツイート風の文章を自動生成させることができます。
ドラマロスの低減にもなるかもしれません。
 今回は、SNSや見逃し配信の視聴数記録で大変話題になった昨年秋のドラマ「silent」で試してみました。
www.fujitv.co.jp

 汎用的な文章作成には大規模な機械学習モデル(AIのコア)が必要で、最近ではOpenAIが開発したChatGPTが話題になっています。わずか2ヶ月で月間1億ユーザーを達成して、マイクロソフトと独占的な提携も進めており、Googleの検索事業も大打撃を受ける可能性があるのではと言われたりしています。
 しかし、最近のドラマに関しての文章、特にツイートのような短い文章を作成させるには、対象のドラマに特化したもっと手軽で小さな機械学習モデルが適しています。
 データサイエンスで良く使うプログラミング言語Pythonのライブラリmarkovifyは「マルコフ連鎖」と呼ばれる手法を使って、文章を生成することができます。「マルコフ連鎖」は、文章のなかの単語と単語のかかり方・繋がりを確率的にとらえて、新しく文章を生成することができるアルゴリズムです。少ないデータで文章生成用の機械学習モデルを作ることができます。ひとつの短い文章を作るのに向いています。
プログラミングはこちらの記事を参考にしました。
qiita.com

作成手順

  1. 最終回直後のツイートをYahooリアルタイム検索からコピペで千件ぐらい収集します。10分ぐらいでできます。
  2. ツイート本文のみ抽出して、ライブラリmarkovifyで機械学習モデルを作成
  3. 作成した機械学習モデルを使って、文章を生成

何も指定せずに自由に生成させたり、文章の頭の単語を設定して生成させることができます。

自由に40の文章を生成させる

  • 湊斗誰よりも幸せになりましたsilent。
  • 物語の最後あるあるでしたね→何て言ったんだろ気になる~。割り込みたい笑silent。
  • 私の大好きになったからこそそういう考えに至ったことも珍しい。
  • 何より登場人物全てが素敵な人たちで溢れてて幸せを分け合っててとても素敵な最終回でしたsilent。
  • silent最終回silent最初っから最後まで泣きっぱなしだったし本当に素敵なドラマだったな……最終回まで、最後の耳元で話すシーンのハルナの涙にやられたsilent。
  • 最後みんな笑顔で幸せそうに笑いあってる空間で終わってよかったsilent。
  • きっと最後想は紬の名前呼ぶんだよ何言ってたけど、そこはサイレント。
  • silent終わっちゃったなぁ……silent。
  • 終わっちゃったよね?
  • チューして終わるんだろうなって思ってたけど、大好きな紬と想が交換しあって。
  • 考えさせられること、新しく知ることもあって、毎回幸せでした!
  • これからもお仕事頑張って色んな蓮見れるの楽しみにしても自然な場面、何度でも見返したくなる作品でしたキャスト、スタッフの皆お疲れ様でした!
  • 最後まで泣ける良いドラマを観れた。
  • ほんとに素敵な木曜日をありがとう。
  • 伝えようと思う気持ちと受け取ろうとするか、そして相手に受け止める気があるか。
  • 2人にしかわからない世界でもそれは同じたくのことを教えてくださいました。
  • 最後の最後もsilentで視聴者に何て言ったのーなんてツィート見たらほとんどの人が伝えてくれた人達にカスミソウ渡したい〜〜〜silent。
  • silent、終わってしまって寂しいけど、この話のラストでは無いかなって思ってたから待ってたけど序盤から泣かせに来るとは最後はみんな幸せになれ。
  • 終わっちゃったなぁ…silent。
  • 優しく素敵なドラマをありがとうございました既にロスがsilent。
  • 終わっちゃった…最後までめっちゃ良かった素敵なドラマでした1話から一気に録画見よ〜silentsilent最終回。
  • 週1回の素敵な時間を過ごせました。
  • silent最終回迎えたとこでもう一回1話みたくなる!
  • 最高なドラマでしたこれから何を楽しみにしたら良いのか分かりません…素敵な時間を過ごせました。
  • 本当によかった静かだけど、最高だなsilent。
  • ずーっとリアタイできて幸せな笑顔素敵な終わり方でよかったsilent。
  • 来年スペシャル番組でその後の2人で終わるのもなんか心が温かくなったsilent本当にお疲れ様!
  • なにより気づきがあったの最高だったあの終わり方してくれても良いんですよ?
  • 優しく素敵なドラマに出逢えて良かった最後なんて言ったのかめっちゃ気になるじゃんーもぉー!
  • silent紬と想がこれからも笑って過ごせますようにsilentsilent最終回。
  • そっかあプレゼントを使い回された気持ちになる終わり方でよかったsilentありがとうsilentsilent最終回。
  • それを最後に紬が幸せそうで嬉しかった。
  • これからはと伝えることはと伝える』事です。
  • 全ての登場人物に幸せになってって言ってたのかな…そんな訳ないsilent。
  • 最初から最後まで素晴らしいドラマだった〜円盤の購入を検討しますsilentメイキング川口春奈目黒蓮
  • 前半良かったのに最後の最後まで、よかった、よかったsilent。
  • 乗り越えて幸せな気持ちになる終わり方だった。
  • 周りに恵まれて想と紬最後何言ったか想像させていただきました。
  • ラウが視察した撮影現場は紬と想が交換しあって紬と想だけのもの。
  • 伏線をこんなに全部綺麗に回収してくれてsilent。

文章の初めの単語を主人公の名「紬」に設定して生成

  • 紬にこそこそ話した声は紬に何て言ったの紬かな3ヶ月でした主演のお二人がどんな言葉をささやいたのかなもう本当に感動しました買います!
  • 紬と想に出会えて本当に幸せですありがとうございましたキャストスタッフ本当にお疲れ様でした。
  • 紬と想が言いたいことと言えて良かったです、木曜日が楽しみで楽しみでsilentのためにこの曲書いたんかってぐらい!
  • 紬にだけ何言ったのすごくスッキリしたし、大切な時間だった!
  • 紬と想がカスミソウ渡し合った時に感情が馬鹿デカく爆発したsilent。
  • 紬にこそこそ話した声は紬に何て言ったのか気になったsilent本当にお疲れ様!
  • 紬って言っていいほど気持ちを揺さぶられる素晴らしいドラマやったぁぁぁ最終回が終わってしまったsilent。
  • 紬と想は幸せで泣いてってずっと思ってたけど、嬉しくて幸せで涙出てきた時に愛しくなる聴こえる世界でも聴こえない世界で、2人だけにしか聞こえないの天才か?
  • 紬の声はもう聴こえないけど、花って語りかけるよね生きてるものは尊いわ。
  • 紬の愛深くて素敵だった心があったかいsilent。

文章の初めの単語を最終回のキーアイテムのひとつ「カスミソウ」に設定して生成

  • カスミソウが雪の結晶…♪って歌詞がそのまま最後までsilentだったsilent。
  • カスミソウが雪の結晶をお裾分け、言葉もお裾分けしてくださいsilent。
  • カスミソウの花言葉みてまた泣いた行ってらっしゃいsilent。
  • カスミソウの花言葉調べた瞬間若干回線重くなったから、温かい気持ちになるドラマでしたsilent。
  • カスミソウが雪の結晶~ってリンクしてるところまぢで良かった続編or映画作って欲しい!
  • カスミソウの花言葉調べたよねsilent。
  • カスミソウのプレゼント交換から、言葉の結晶である花を交換した時と同じ言葉?
  • カスミソウにネガティブな花言葉は託されていても衣装のせいなのかがわからず…誰か教えて〜!
  • カスミソウの花言葉調べたよね声聞きたかったーーーーsilent。
  • カスミソウの花言葉、このドラマに出会えて良かった。

どうでしょうか、「silent」のツイートっぽいでしょうか。

最後にどのくらい新しい文章を生成できるのか調べてみました

  • 1万回生成させて、重複を除くと8,608の文章が生成されていました
  • 10万回生成させて、重複を除くと63,590の文章が生成されていました。
  • 100万回生成させて、重複を除くと412,570の文章が生成されていました。

さすがに100万回では効率が落ちますが、約40万もの新しいツイート風の文章を生成させることができました。
「silent」のツイートの解析はこちら
2022年秋ドラマの「silent」をデータで振り返る - 身近な日常をやんわりデータサイエンスしてみよう