身近な日常をやんわりデータサイエンスしてみよう

身近な情報や現象からデータを取り出して解析してみます。

2022年秋ドラマの「城塚翡翠」をデータで振り返る

 2022年秋に放送され様々な仕掛けで大変話題になったドラマの「霊媒探偵 城塚翡翠」と「invert城塚翡翠倒叙集」をツイートとグーグルトレンドのデータで振り返ります。
3冊の原作の複雑な構成と多くの伏線をドラマでも再現し、かつドラマオリジナルな要素もあるミステリドラマです。テレビ局としては視聴者に騙されることを楽しんでもらうことを企画したのかもしれません。
www.ntv.co.jp

 ドラマ視聴の感想などは下記のブログに多くの方が寄せていますので、そちらを御覧ください。原作の読後感想や、原作者の相沢沙呼氏による城塚翡翠のエピローグ的なブログ「城塚翡翠の平穏」と「城塚翡翠の転倒」も投稿されています。
note.com

"城塚翡翠"のグーグルトレンド

 グーグルトレンドはグーグル検索された頻度データです。視聴者が情報を調べたり、探したりする際の検索行動が集積されていて、ドラマ「城塚翡翠への関心の高さが反映されています。検索キーワードは”城塚 翡翠"です。
 グーグルトレンドのウエブページから手動で、またはPythonなどで作成したプログラムでオートに下記の情報を取得することができます。

  • トレンド推移: 検索キーワード "城塚翡翠" の検索頻度の時系列推移
  • 関心の高い関連キーワード: 該当のキーワード "城塚翡翠" を検索するユーザーはこれらのキーワードも検索しています。

トレンド推移

 全放送回ごとに検索頻度のピークが発生していますが、「霊媒探偵 城塚翡翠」の第5話が飛び抜けて関心が高くなっています。これは最終話と予告されたことと、第1話から4話に張り巡らされた数多くの、そして大きな伏線が一挙に回収されて多くの視聴者が驚かされたためです。このようなトレンドの動きは大変めずらしいです。後半は「invert城塚翡翠倒叙集」と題名もかわり、ドラマのスタイルと雰囲気も大きく変わりました。

google trends

全放送回通しての関心の高い関連キーワード検索頻度ランキング

 上位にはドラマの前半の題名が来ています。ドラマと原作に関する関心の高さが現れています。ミステリドラマらしく3位に”城塚翡翠ネタバレ”が来ています。前半の5話が最終話と予告されたことから”打ち切り”がかなり検索されました。またミステリの1分野(刑事コロンボ古畑任三郎が有名です)でもありますが、耳慣れない"倒叙”も良く検索されました。

  1. 霊媒 探偵 城塚 翡翠
  2. 城塚 翡翠 ドラマ
  3. 城塚 翡翠 ネタバレ
  4. 城塚 翡翠 打ち切り
  5. 城塚 翡翠 invert
  6. 倒叙
  7. 城塚 翡翠 倒叙

"城塚翡翠"のツイート

 ツイッターには視聴者の共感したい感情や共有したい情報などが投稿されています。
最終回の終了後15分ごろのツイート約1,000件を収集して頻出したキーワードを調べました。
最終回及びドラマ全体を通しての視聴者の感想が取得されています。

WordCloud

 ツイートに出現したキーワードを出現頻度に応じて大きく可視化する自然言語処理WordCloudで表しました。検索キーワードの”城塚翡翠”は削除してあります。パートナーの名前の”真”と、”面白い”、”騙す”が印象的です。

wordcloud

名詞頻度ランキング

”城塚翡翠”は削除しています。主役の清原果耶さんとパートナーの役名の(千和崎)真さんが上位にあります。
”原作”についての情報や、原作者、TV局への”続編”の希望もあります。”先生”は結構人気になって最終回でも現れた香月先生でしょうか。ドラマ最終回のサブタイタイトル「信用ならない目撃者」の回収となる重要な目撃者役の”岩戸”さんと演じた”若月”さんも頻出しています。

  1. 果耶、清原
  2. 倒叙
  3. 原作
  4. 続編
  5. 霊媒探偵
  6. 最終話、最後
  7. 風花、小芝
  8. 最高
  9. 先生
  10. 日曜
  11. 好き
  12. 目撃者
  13. 若月、岩戸

形容詞頻度ランキング

 最終回とドラマ全体への視聴者の感想が頻出しています。”面白い”が最上位です。続編が”欲しい”も上位にきています。

  1. 面白い、おもしろ
  2. 良い、いい、よい
  3. 楽しい
  4. 可愛い、かわいい
  5. 欲しい、ほしい
  6. すごい、凄い
  7. 寂しい
  8. 素晴らしい
  9. 嬉しい
  10. 尊い
  11. 温かい

関連キーワード

 Googleから公開された自然言語処理Word2Vecを用いたPythonのプログラムで、ドラマへのツイートのなかで該当キーワードに関連するワードを算出することができます。算出された関連ワードを眺めると、該当キーワードのこのドラマでの意味や位置づけが見えてきます。

  • ヒロイン役の”清原果耶”に関連するワードには、”主演””、”最強””、パートナー役の小芝風花、話題となった”衣装、洋服””メイキングの収録”が算出されました。
  • パートナーの"(千ヶ崎)真"の関連ワードには、"清原果耶""眼福""やり取り"癒やす""似合いすぎる""コンビ" などが算出され、主人公とパートナーの翡翠、真のやり取りに癒やされた視聴者が多かったようです。
  • "最高"の関連ワードには、"やりとり""癒やす""コンビ""かわいい"が算出され、翡翠と真のやりとりに癒やされ、最高と投稿したようです。
  • "凄い"の関連ワードには、"俳優""演技""演出""ストーリー""ドキドキ""はまる" など演技や演出、ストーリーへの感動として使われたようです。
  • ”面白い”の関連ワードには、”今季””今期””一番””草”と、今季一番の面白さとの声が多かったようです。

2022年秋ドラマの「silent」をデータで振り返る

 2022年秋に放送され見逃し配信数の記録を作って大変話題になったドラマの「silent」をツイートとグーグルトレンドのデータで振り返ります。

www.fujitv.co.jp

 ドラマ視聴の感想などは下記のブログに多くの方が寄せていますので、そちらを御覧ください。 
 私は、無音での対話の場面がとても印象的でした。音を介せないコミュニケーションへの一瞬の絶望感とそこからの再構築に見えてくる微かな希望が胸に刺さりました。
note.com

"silent"のグーグルトレンド

 グーグルトレンドはグーグル検索された頻度データです。視聴者が情報を調べたり、探したりする際の検索行動が集積されていて、ドラマ「silent」への関心の高さが反映されています。検索キーワードは”silent”です。
 グーグルトレンドのウエブページから手動で、またはPythonなどで作成したプログラムでオートに下記の情報を取得することができます。

  • トレンド推移: 検索キーワード "silent" の検索頻度の時系列推移
  • 関心の高い関連キーワード: 該当のキーワード "silent" を検索するユーザーはこれらのキーワードも検索しています。

トレンド推移

 全11回の放送回ごとに検索頻度のピークが発生しています。視聴中、視聴直後に関心が高まり検索されています。初回から3回めの放映と特に最終回の放映で関心が高くなっています。ピークの谷間、最終回のピーク後も高いトレンドで、見逃し視聴やSNSでの盛り上がりによるものと思われます。

グーグルトレンド

全放送通しての関心の高い関連キーワード頻度ランキング

 1位から3位までは3人のメインキャストです。4位の"twiiter silent" はツイッターでの盛り上がりが氣になっているということでしょう。5位の"silent 無料"は見逃しやリピート視聴できる配信サイトを探しているのでしょう。主人公二人が好きだったスピッツの曲だったり、音がない言葉としての花言葉への関心が現れています。

  1. 目黒 蓮 silent
  2. 川口 春奈 silent
  3. silent 鈴鹿 央 士
  4. twitter silent
  5. silent 無料
  6. 手話
  7. ドラマ サイレント
  8. silent 映画
  9. スピッツ
  10. スピッツ silent
  11. silent 花 言葉

"silent"のツイート

 ツイートには視聴者が共感したい感情や共有したい情報などが投稿されています。
最終回の終了後15分ごろのツイート約1,000件を収集して頻出したキーワードを調べました。
最終回及びドラマ全体を通しての視聴者の感想が取得されています。

WordCloud

 頻出したキーワードを頻度に応じて大きく表示するWordCloudで表しました。
”最後”と”素敵”が印象的です。

wordcloud

名詞頻度ランキング

 ドラマの最終回なので ”ドラマ”、”最後”、”最終” が頻出しています。
 二人の主人公の名前、 ”紬”と"想” も頻出しています。また、 "幸せ”と”言葉” はドラマ全体のキーワードですね。

  1. ドラマ
  2. 最後
  3. 素敵
  4. 最終
  5. 幸せ
  6. 言葉

形容詞頻度ランキング

 最終回とドラマ全体への視聴者の感想が頻出しています。
”温かい”、”あったかい”、”温かい” が、ドラマ全体の雰囲気を表していますね。
”寂しい”、”悲しい”、”切ない” は最終回への心情ですね。

  1. 良い、よい、いい
  2. 優しい
  3. 素晴らしい
  4. すごい、凄い
  5. 温かい、あったかい、暖かい
  6. 可愛い
  7. 寂しい、悲しい、切ない
  8. 楽しい

関連キーワード

 Googleから公開された自然言語処理Word2Vecを用いたPythonのプログラムで、ドラマへのツイートのなかで該当キーワードに関連するワードを算出することができます。算出された関連ワードを眺めると、該当キーワードのこのドラマでの意味や位置づけが見えてきます。

  • ヒロインの名前””に関連するキーワードには、名字の"青羽”と”可愛い”が、ドラマのキーとなる、“”、””、”耳打ち”、”聞く”、”聞こえる”、”囁く”などの表現が、また相手役の名前の””、””が並びました。
  • 素敵”に関連するキーワードには、”最高”、"出逢う”、”良い”、”待ち遠しい”、”素晴らしい”がありました。
  • 温かい”に関連するキーワードには、”切ない”、”穏やか”、”暖かい”、”胸がいっぱい”、”苦しい”などの視聴者のやや入り混じった心情を示すワードが並びました。

中島みゆきと松任谷由実の歌詞を言葉の出現頻度と高頻出ワードの類似ワードで比較してみる

 自然言語処理テキストマイニングに関するプログラムのライブラリが多く公開されてきて、PythonやRなどによるプログラミングのスキルさえ習得すれば、大量の文章から言葉と言葉の関係、文章と文章の関係などを誰でも容易く分析することができるようになっています。

 データサイエンスは情報と情報を科学的(統計解析など)に比較する手法です。好きな、個性的なミュージシャンの曲を比較するのは面白くもあり、楽しいです。

 

歌詞の頻出ワードをwordcloud表示

 今回は、私と同年代(やや年上ですが)の中島みゆき600曲と松任谷由実415曲の歌詞を、出現するワードの頻度でwordcloud表示してみました。出現頻度が高いほど大きく表示されています。

f:id:yamtakumol:20210111090010j:plain

中島みゆき松任谷由実の歌詞の頻出ワードで大きな違いは"人"です。

中島みゆきは"人"を歌っていらっしゃるようです。

 

頻出ワードランキング

 頻出ワードランク5位までを記します。中島みゆきの"人"を除くと、両者ともに、"私"、"あなた"、"ゆく" が上位にランクインしていました。

中島みゆきでは

1. 人

2. 私

3. あなた

4. ゆく

5. 誰

 

松任谷由実では

1. あなた

2. 私

3. ゆく

4. 今

5. きみ

 

頻出ワード"人"、"あなた"とそれぞれ関係が強いワード

 自然言語処理のライブラリword2vecを使って、頻出単語の関係ワードを分析することができます。二人の関係ワードの違いから、同じ言葉の意味合いの違いを読み取ることができます。

 

"人"の関係ワードを関係性の強い順に5つ記載しました。

中島みゆきは、関係するワードランクから "人”は変わる、見知った"人"、すれ違った"二人"、出会った"二人"などのフレーズが思い浮かびます。

1. 変わり

2. 見知る

3. すれ違う

4. 二

5. 出会う

 

松任谷由実では"人"は"二人"として多く使われています。 "二人"、若い"二人"、"二人"に教える、"二人"のメモリー、など、"二人"としてのフレーズが思い浮かびます。

1. 二

2. 若い

3. 教える

4. メモリー

5. 間にあう

 

 

"あなた"の関係ワード 

中島みゆきの"あなた"と関係の強いワード

1. 切る

2. 写真

3. かくす

4. 間違える

5. イヤ

 

松任谷由実の"あなた"と関係の強いワード

1. 私

2. 陽気

3. 笑う

4. 話す

5. 顔

 

松任谷由実の"あなた"は陽気で親しい話し相手というイメージでわかりやすいですが、中島みゆきの"あなた"はなかなか複雑そうなイメージです。

 

各曲を歌詞の違いで2次元マップ表示

 最後に、中島みゆき600曲と松任谷由実415曲を歌詞の違いで2次元マップ表示してみました。中島みゆきさんの曲の分布の広がりが大きくて、松任谷由実さんのワールド(クラスター)にも結構入り込んでいます。中島みゆきでは飛び地のような小さなクラスターもいくつか見られます。奔放な曲作りをされているようです。松任谷由美は自分のワールドをしっかり作っていますが、サブワールドが図の左上に見られます。このサブワールドの特徴を分析するのも面白そうです。

 

f:id:yamtakumol:20210131093653p:plain

 

 嵐と米津玄師との比較もしてみました。

www.yanwari-data.com

www.yanwari-data.com

 

参考: 解析のために作成したプログラムの開発環境

OS: Windows10

プログラム開発言語と使用した主なライブラリ

 Python 3.7

              歌詞のスクレイピング(Beautiful Soup)

              自然言語解析(janome, Word2Vec, Doc2Vec, Wikipedia学習済みモデル)

   R 4.0.2

             頻出ワードのビジュアル化(wordcloud)

             多次元データの次元圧縮マップ表示(UMAP)

 

             

カイトが舞うのは嵐の真っただ中?、それとも米津玄師ワールドとの際か? テキストマイニングでビジュアル化

  2014年に公開されたdoc2vecや、最近では2018年に公開されたBERTなどの自然言語解析のプログラムライブラリの登場で、大量の文章や歌詞の解析が誰でもできるようになりました。

以前、嵐の歌詞と米津さんの歌詞の違いを各単語の出現頻度によるビジュアル化をワードクラウドというプログラムを用いて解析しました。

www.yanwari-data.com

 

 今回は、米津玄師ワールドと嵐ワールドは分かれているのか、分かれていた場合に、米津さんが2020年に嵐に提供した"カイト"はどこのポジションにあるのか、興味があったので、解析してみました。

昨年2020年の8月に収集した嵐347曲、米津玄師89曲の歌詞を単語に分けて、各曲の歌詞の300次元での座標(ベクトル)を計算します。そして、それらを2次元のマップに縮約してビジュアル化することで、各曲のポジションを見ることができます。

 

グラフ1で嵐の曲と米津玄師の曲の色を分けて表示しています。嵐は横に幅広く分布しており、嵐の分布の右側に米津さんの曲がクラスター(米津ワールド)を形成していました。嵐の曲はさらにいくつかのクラスターに分けることができるかもしれません。後日解析してみます。

 

       グラフ1.  嵐347曲と米津玄師89曲の歌詞によるポジション

f:id:yamtakumol:20210103200349p:plain

 

 それでは、"カイト"の色を変えてポジションを確認しました。

"カイト"は嵐ワールドと米津玄師ワールドの境に位置していました。嵐感と米津感が両立している歌詞ということができそうです。

        グラフ2.  グラフ1に"カイト"の色を変えて表示

f:id:yamtakumol:20210103200453p:plain

 

参考: 作成したプログラムの開発環境

OS: Windows10

プログラム開発言語と使用した主なライブラリ:

      Python 3.7

                歌詞スクレイピング(Beautiful Soup)

                自然言語解析(janome, Doc2Vec, Wikipedia学習済みモデル)

      R 4.0.2

                多次元データの次元圧縮マップ化(UMAP)

 

嵐に愛と感謝を込めて

f:id:yamtakumol:20210101095354j:plain

嵐の応援うちわ



妻が大ファンの嵐は2021年から活動を休止します。

 そこで、下図のように「嵐」の文字からマスクシェイプを作成し、ワードクラウドというプログラムを用いて、そこに世界中の言語で"愛"または"感謝"のワードを詰め込んでみました。実際は嵐のロゴからマスクを作成しています。

ワードクラウド(wordcloud)とはあたかも雲のように、数多くの言葉を配置してビジュアル化するプログラミング技術です。各ワードの大きさは使用している人口の大きさに比例しています。

 

f:id:yamtakumol:20210101145046j:plain

"嵐"の文字とマスク

 

"嵐”を型として、世界中の言語の"愛"を並べてました。そのつもりで見れば、嵐のかたちに見えるでしょうか。

 

f:id:yamtakumol:20210102081223p:plain

同様に世界中の"thank you"を並べると

f:id:yamtakumol:20210102081427p:plain

 参考:  使用したプログラムの開発環境とコード

データサイエンスで良く使用されているプログラム開発言語のR、あるいはPythonを使うと、単語やフレーズとそれらの発現頻度、使用頻度などのデータを整理、解析した結果をビジュアル化することができます。

OS:  windows 10

Rstudio:  R4.02

packages:  ggwordcloud

dataset:  ggwordcloudに含まれている、

        love_words:  147の言語での"love"というワードとそれらを話している人口

  thankyou_words:  133の言語での"thank you"というワードとそれらを話している人口

スクリプトのコードは下記のサイトにアップしてあります。

qiita.com

 

2020年期待の食のヒットの種 - シュクメルリ -

f:id:yamtakumol:20200228192842j:plain

鶏モモ肉を細かく切りすぎたシュクメルリ

昨年の12月から松屋の一部の店舗で販売して、話題化したのがシュクメルリ。ジョージア料理だそうです。

グーグルトレンドで「バスク チーズケーキ」と比べて関心の高さを比較してみましょう。松屋で2月限定で全国発売が決定して大変な話題になったことが分かります。

f:id:yamtakumol:20200301182907p:plain

 

下記のクックパッドレシピを参考に調理してみました。 ホワイトソースは牛乳に、おろしにんにくたっぷり、バターたっぷり、溶けるスライスチーズたっぷり入れて作ります。とにかく濃厚で、美味しいです。家族に大好評でした。ごはんでも、パンでも。ハンバーグにかけても美味しそうです。

cookpad.com

 

グーグルニュースで検索されたニュースからいくつかピックアップしました。

松屋の公式レシピもクックパッドで公開されているそうです。

nlab.itmedia.co.jp

下記ニュースに松屋がシュクメルリにたどりついた経緯も記載されています。

松屋の【世界紀行メニュー】の第一弾。松屋といえば鶏肉がゴロゴロと入っている、ということで、鶏肉を使った世界の料理を探していて、シュクメルリにたどり着いた、とのことでした。

www.excite.co.jp

松屋では第二弾のメニュー「カチャトーラ」もテスト販売中とのことです。

こちらも注目ですね。

youpouch.com

 

美味しさの追求というだけでなく、新たな食体験をあの松屋が提供しようとする試みが注目される所以ですね。

 

グーグルトレンドのデータは下記のPyhonのスクリプトで取得しました。

qiita.com

 

 

 

2020年期待の食のヒットの種 -コーンフレークやないか! ハッシュドポテト-

f:id:yamtakumol:20200216154422j:plain

餡ボールとコーンフレーク・ハッシュドポテト

 昨年M-1グランプリを制した「ミルクボーイ」のネタで取り上げられ、現在も大ブレイク中の「コーンフレーク」。「コーンフレークやないか!」レシピがブレイクしないか注目しています。かつやが3月6日からコーンフレークのカツ丼を出すとツイッターで予告しているそうです。

「コーンフレーク」への関心の高まりをグーグルトレンドで確認してみました。M-1優勝の大きなピークの後も高い関心が継続しています。

f:id:yamtakumol:20200216161842p:plain

 

そこで、コーンフレークを衣にした揚げ物を検討してみることにしました。まずは簡単そうな揚げ物ということで、冷凍の「ハッシュドポテト」を溶き卵に潜らせてから、適当に砕いたコーンフレーク(プレーン)を衣にして揚げて「コーンフレークやないか!ハッシュドポテト」を作ってみました。ついでに、前回作ったチーズボールの白玉粉が残っているので、チーズならぬ餡子を入れた、「餡ボール」(揚げまんじゅう?)も揚げました。

 ポテトのほくほく感にカリッとした食感が加わってとても美味しかったです。塩コショウ、ケチャップ、ウスターソースなどをかけて楽しめました。「餡ボール」も浅草の揚げまんじゅうと張り合えそうな日本的なもちもち感と甘さがいっぱいの美味しさでした。

 ちなみに浅草の揚げまんじゅう

中富商店

浅草の揚げまんじゅうおすすめ店【金龍山浅草餅本舗】仲見世通り

あげまんじゅう 浅草九重 | 浅草寺から三軒目。あげまんじゅうの実演販売。

 

 

グーグルトレンドのデータは下記のPyhonのスクリプトで取得しました。

qiita.com