Youtube SummarizationYoutube要約

※ここにword cloudが表示されます。読み込みに数十秒かかります。

頻出単語(頻出順)

類似度

概要

youtubeの動画のコメントからword cloudを作成するAPIになります。

そして動画の主題の単語とコメント欄の単語同士で類似度計算を行い,類似度の高い単語10個を出力します。

使い方

  • 1.YoutubeのURLを入力します。 (https://youtube.com/watch?v=~~~ の形であること, &t=が最後についているとエラーを起こす)
  • 2.「要約する」のボタンを押します。 そうするとword cloudが表示されます。 同時に頻出単語が10個出力されます。
  • 3.10個の単語から1個選択して入力します。
  • 4.選択した単語と類似度が高い単語が10個出力されます。

  • 1.今回はGReeeeNの「たけてん」という歌のMVを使いました。↓
    https://www.youtube.com/watch?v=Z6H1-pok7R8
  • 2.「要約する」ボタンを押すと,下の画像が出力されました。
  • 3. 同時にコメント欄でよく使われている名詞が10単語出力されました。
    GReeeeN
    さんま
    MV
    最高
    こと
    歌詞
    ふみや
    笑顔
    高橋
    莉子
  • word cloudに明石家という単語があるため,このMVがさんまさんにかかわるものであることがわかります。 加えて笑顔がテーマであることも頻出単語よりわかります。
  • そして,「ふみや」「莉子」など名前が多いこともわかります。 この2人はMVに出演してる俳優になります。 よって,この2人に注目してMVを見ている人が多いことがわかります。
  • 3. 10単語のうちから1つ類似度計算がしたい単語を選択します。 すると選択した単語と類似度が高い単語を出力してくれます。今回は「歌詞」を選択したいと思います。
  • 5.以上の出力よりこの動画の主題がyoutube 開設であることが推測できます。
  • 「歌詞」と類似度が高い単語と類似度↓
    漁港:0.22
    全部:0.22
    感動:0.21
    永瀬:0.18
    出演:0.18
    エピそ―ド:0.17
    from:0.17
    ふみ:0.16
    俳優:0.14
    セレナーデ:0.14
  • 1番目に類似度の高い「漁港」はこの歌が映画「漁港の肉子ちゃん」の歌だからです。
    3番目に高い単語が「感動」でした。よって「たけてん」の歌詞は感動する歌詞であることがわかります。

解説

youtube API を使って動画のコメントをすべて取得します。 コメントから名詞のみを抽出してword cloudを作成します。 同時にコメントの名詞からword2vecモデルを作成します。 そのモデルを使って単語の類似度計算をします。 word cloudと動画の主テーマと類似度の高い単語を見ることで動画の概要を理解することができると考えました。

応用

コメントから動画を見ている層の分析などが可能です。 その分析を用いてターゲット層が多い動画に広告を出すことができます。