ヤフーが16万曲の歌詞から「ミスチル・TOKIO」「西野カナ・青山テルマ」等が似てると解析

ヤフーが16万曲の歌詞から「ミスチル・TOKIO」「西野カナ・青山テルマ」等が似てると解析


「アーティストクラスタリングチャート」
解散するSMAPはKinKi Kidsと似ていて、椎名へきるやHYなどとも歌詞の特徴が近いという結果

ヤフー株式会社は5日、16万曲分の歌詞データを元に国内アーティストの類似性を可視化したツール「アーティストクラスタリングチャート」を公開した。

本ツールは、ヤフーとGYAOが運営する映像配信サービス「GYAO!」で提供している16万曲分の歌詞データを解析し、約500アーティスト間の類似性・関連性をマッピングしたもの。歌詞の解析には、日本語処理手法のひとつ「形態素解析」を使用。歌詞を最小単位に分解して、単語の出現個数や曲あたりの出現頻度などを計算している。


「形態素解析」

その歌手ごとに頻出度の高い「特徴語」を比べて、歌詞が似ていると判断されたのは、「西野カナ・青山テルマ」「SMAP・KinKi Kids」「北島三郎・鳥羽一郎」などで、確かに同じ系統であると納得できる。ただ、「ミスチル・TOKIO」など、接点が思いつかないアーティストも存在しているのも面白い。

また、「植村花菜」「ウルフルズ」「クレイジーケンバンド」などは、似ている系統はあるものの、ピッタリ似ていると判断されるアーティストは無しという結果になり、独特な世界観がデータから明らかになるという結果になった。

ほかにも、『「自分」と「相手」をどう呼ぶのか』『「TUBE」の特徴語について』などが分析してまとめられ、邦楽好きには興味深い解析記事となっている。


「TUBE」の歌詞の特徴語上位20件

「アーティストクラスタリングチャート」
URL:http://docs.yahoo.co.jp/info/bigdata/special/2016/05/app/

発表資料
URL:http://docs.yahoo.co.jp/info/bigdata/special/2016/05/
2016/09/05

MdN DIのトップぺージ