実に面白い。歌詞のビッグデータ分析による、類似度・特徴語分析。
http://internet.watch.impress.co.jp/docs/news/1018470.html
実際の分析データを見れるURLはこちら。
http://docs.yahoo.co.jp/info/bigdata/special/2016/05/app/
実際に眺めて見たら、小田和正とOFF COURSE、椎名林檎と東京事変とかが一緒なのはご愛敬として、BEGINとTHE BOOMが類似してたり、浜田省吾と尾崎豊が類似してるなど、わりと合点がいく内容。
逆に意外というか、なるほどと思ったのは、佐野元春&井上陽水とか、高橋真梨子&中森明菜、ミスチル&TOKIO、美空ひばり&五木ひろし、とか。どこか頭の奥で近いなぁと思ってることがこうやって顕在化するのは妙なもの。
なお、記事にも解説してあるが、「形態素解析」というのは文章を単語(名詞や助詞など)に分割することで、Yahoo!は一般技術者向けにAPIとして無償提供している。
以前からこれを使って何か面白いことをやってみたいと思っていたので、時間があったら取り組んでみたい。例えば、青空文庫の小説を解析するとか、ね。
∧