うまい飯食いたい

うまい飯食えるようにガンバリマス

pixivのイラスト検索の結果を使う(その2)

前回のつづき
pixivのイラスト検索の結果を使う - うまい飯食いたい

pixivのタグを使ってネットワークを描きました
(データは,今から1ヶ月分くらい)
タグを認識する際には,以下の辞書をお借りして,
不足部分を埋めつつ,艦娘名の一覧を作ってマッチング
艦これ艦船辞書(IME/ATOK) | 今日のいの


最初,単純にタグの共起でネットワークを描いたが,
どうしても艦娘ごとのイラスト数に依存してしまった
赤城と加賀とか,北上と大井などの相対的に人気な組の関係性はとれるけど,
実装が遅めだった第17駆逐隊とかは出てこない

そこで,各タグを含むイラスト集合のjaccard係数を採用
色々試行錯誤して,0.1を閾値にして,
この値以上の場合,ネットワークを描いたら,いい見栄えになった

(本当は,Modularityとかでうまく決めたほうがいいのかな)

ビスマルクは多分辞書では,「Bismarck」になっているの影響で取れてないと思う
後,揺らぎ的な問題で,
同じ艦娘を指す場合でも,《艦娘名》(艦隊これくしょん)って,タグが結構あるので,
これを考慮したほうがもっといいものになりそう
(これ正規表現で書けば,すぐできそうな気がするけど)

以下気付いた点
・基本的に姉妹艦が顕著に出る 特に金剛型が密 潜水艦グループ
・史実的な関係性も現れる (初風と妙高姉さん,西村艦隊など)
・アニメの影響 (吹雪と睦月と夕立,睦月と如月)
・瑞加賀尊い
・千歳と千代田のエッジがない
・そして,千歳と秋月ちゃん!
阿賀野と那珂ちゃんのエッジ (軽巡棲鬼のせい?)
・ラブリーマイエンジェル夕張ちゃんは,五月雨と由良ちゃん

提督的に面白い結果になりました
やはりこういう試みをするとき,自分で解釈できる結果が見えると面白い