ModestCute

ModestCuteは「エロゲー×統計」な同人サークルです。

POVの入力傾向でエロゲーを9種類に分類してみた話

以前マーケ編で、POVを30の因子に縮約しましょうというネタをやりました。
その結果をつかって、マーケ編ではユーザーを分類しましょうという話をしましたが、消費者の分類だけでなく、商品の分類もできるのでは? という着想を得たのでやってみました。

 

2008/01~2018/04発売のPOV(A評価)登録数15を超えるものを対象として、kmeansクラスター分析を行いました。
今回クラスター数は適当に9でやってみました。
結果は↓から。(Googleスプレッドシートです)

エロゲーをkmeansクラスター分析で分類してみた

 

リンク先の表の値は、各クラスターに分類されたゲームの各Factorの平均値です。
数字の大小比較がしにくいので、セルや文字の色を変えてます。

 値を省略した結果は下の画像のようになります

f:id:tsubame30:20180526222730j:plain

 特徴がもっとも出ているのはクラスター4です。「ストーリー」「バトル」「インテリ」「不幸病弱」の値が非常に大きく出ています。燃えや考察や泣きなどがウリのシナリオ重視型のゲーム郡だと考えられます。


 クラスター5は、「恋愛」「絵」の値が非常に大きくなっている恋愛重視型のゲーム郡だと考えられます。「ストーリー」の値がさほど大きくないのがシナリオ重視型との決定的な違いですね。


 クラスター6は「ゲーム性」「バトル」の値が大きいゲーム性重視型と考えられます。「ファンタジー」との親和性が高いのも特徴的ですね。


 クラスター2は、シナリオ型・恋愛型・ゲーム性型の中間のような傾向が現れています。これらは非抜きゲーの中間層であると考えられます。


 ここからは抜きゲーがらみのクラスターになっています。
 クラスター3が「ハードエロ」「触手」「痴漢」で高い数値を示しています。エロ特化の中でもドS系のゲーム群であると考えられます。


 一方クラスター9は、「M要素」「妹・姉」が大きく、「アンチロリ」が最も低くなっています(つまりロリ傾向が最大)。エロ特化の中でもM系のゲーム群で、雰囲気が比較的明るいゲームが多くなっています。


 クラスター1は、これらの中間の傾向が現れており、抜きゲーの中間層と考えられます。


 残るクラスター7と8が数値だけ見ると解釈が難しく難解ですが、具体的なラインナップから後知恵的に読み解いてみましょう。
 クラスター7は、『euphoria』『媚肉の香り』『巨乳ファンタジー』など、エロとシナリオとのバランスで評価されているゲームが並んでいます。今回、POVの入力"割合"を使っているので、シナリオを評価するPOVとエロを評価するPOVがともに入力された結果、Factorの値の特徴的な部分が潰れてしまったと考えられます。
 クラスター8は、『ToHeart2AD』『つよきす2学期』『でにけり』など、ネガティブな評価が目立つゲームが並んでいます。「ネガティブ」が大きく出ているちょっと残念なゲーム群であると考えられます。

 

 

最近のゲームがこの9分類のどれにあてはまるかを見てみましょう。
2017・2018年それぞれについて、データ数で上位3つずつ並べて直感どおりかを確認します。

f:id:tsubame30:20180526221930j:plain

将軍様はお年頃』がゲーム性重視型なのは変な感じがしますけど、概ね感覚どおりに分類されているように思います。
今年はまだドS抜きゲーに分類されているものが出てきていません。今後に期待ですね。(あるけど、POVが15に到達していないだけかも・・・)


結構この時点でちゃんと分かれたなーと満足している部分もあるのですが、これはとりあえずやってみたってだけの結果です。
「ネガティブ」を説明変数として使うのが適切なのかというとあやしい感じがします。内容じゃなくて評価の傾向になっちゃってますし。
説明変数やクラスター数変えちゃうとまったく違う結果になることもあるので、もうちょっと試行錯誤が必要な気がしてます。

 

 


最後に詳しく解析方法を書いて終わりにします。

f:id:tsubame30:20180526222120p:plain

① 以下のSQLでゲームに登録されているPOVをすべて取得して、エクセルのピポッドテーブルで行列の形にします。行総数に対する割合で集計したものを用いました(行列A)。

SELECT p.game, p.pov
FROM povgroups p
JOIN gamelist g
ON p.game = g.id
WHERE p.rank = 'A'
AND g.sellday BETWEEN '2008-01-01' AND '2018-05-01'


② 行列Aと、マーケ編でのPOV縮約の結果(行列B)を掛け算して、ゲーム×30因子の行列を導きます(行列C)。これをRを用いてkmeansクラスター分析にかけました。