POVの入力傾向でエロゲーを9種類に分類してみた話
以前マーケ編で、POVを30の因子に縮約しましょうというネタをやりました。
その結果をつかって、マーケ編ではユーザーを分類しましょうという話をしましたが、消費者の分類だけでなく、商品の分類もできるのでは? という着想を得たのでやってみました。
2008/01~2018/04発売のPOV(A評価)登録数15を超えるものを対象として、kmeansクラスター分析を行いました。
今回クラスター数は適当に9でやってみました。
結果は↓から。(Googleスプレッドシートです)
リンク先の表の値は、各クラスターに分類されたゲームの各Factorの平均値です。
数字の大小比較がしにくいので、セルや文字の色を変えてます。
値を省略した結果は下の画像のようになります
特徴がもっとも出ているのはクラスター4です。「ストーリー」「バトル」「インテリ」「不幸病弱」の値が非常に大きく出ています。燃えや考察や泣きなどがウリのシナリオ重視型のゲーム郡だと考えられます。
クラスター5は、「恋愛」「絵」の値が非常に大きくなっている恋愛重視型のゲーム郡だと考えられます。「ストーリー」の値がさほど大きくないのがシナリオ重視型との決定的な違いですね。
クラスター6は「ゲーム性」「バトル」の値が大きいゲーム性重視型と考えられます。「ファンタジー」との親和性が高いのも特徴的ですね。
クラスター2は、シナリオ型・恋愛型・ゲーム性型の中間のような傾向が現れています。これらは非抜きゲーの中間層であると考えられます。
ここからは抜きゲーがらみのクラスターになっています。
クラスター3が「ハードエロ」「触手」「痴漢」で高い数値を示しています。エロ特化の中でもドS系のゲーム群であると考えられます。
一方クラスター9は、「M要素」「妹・姉」が大きく、「アンチロリ」が最も低くなっています(つまりロリ傾向が最大)。エロ特化の中でもM系のゲーム群で、雰囲気が比較的明るいゲームが多くなっています。
クラスター1は、これらの中間の傾向が現れており、抜きゲーの中間層と考えられます。
残るクラスター7と8が数値だけ見ると解釈が難しく難解ですが、具体的なラインナップから後知恵的に読み解いてみましょう。
クラスター7は、『euphoria』『媚肉の香り』『巨乳ファンタジー』など、エロとシナリオとのバランスで評価されているゲームが並んでいます。今回、POVの入力"割合"を使っているので、シナリオを評価するPOVとエロを評価するPOVがともに入力された結果、Factorの値の特徴的な部分が潰れてしまったと考えられます。
クラスター8は、『ToHeart2AD』『つよきす2学期』『でにけり』など、ネガティブな評価が目立つゲームが並んでいます。「ネガティブ」が大きく出ているちょっと残念なゲーム群であると考えられます。
最近のゲームがこの9分類のどれにあてはまるかを見てみましょう。
2017・2018年それぞれについて、データ数で上位3つずつ並べて直感どおりかを確認します。
『将軍様はお年頃』がゲーム性重視型なのは変な感じがしますけど、概ね感覚どおりに分類されているように思います。
今年はまだドS抜きゲーに分類されているものが出てきていません。今後に期待ですね。(あるけど、POVが15に到達していないだけかも・・・)
結構この時点でちゃんと分かれたなーと満足している部分もあるのですが、これはとりあえずやってみたってだけの結果です。
「ネガティブ」を説明変数として使うのが適切なのかというとあやしい感じがします。内容じゃなくて評価の傾向になっちゃってますし。
説明変数やクラスター数変えちゃうとまったく違う結果になることもあるので、もうちょっと試行錯誤が必要な気がしてます。
最後に詳しく解析方法を書いて終わりにします。
① 以下のSQLでゲームに登録されているPOVをすべて取得して、エクセルのピポッドテーブルで行列の形にします。行総数に対する割合で集計したものを用いました(行列A)。
SELECT p.game, p.pov
FROM povgroups p
JOIN gamelist g
ON p.game = g.id
WHERE p.rank = 'A'
AND g.sellday BETWEEN '2008-01-01' AND '2018-05-01'
② 行列Aと、マーケ編でのPOV縮約の結果(行列B)を掛け算して、ゲーム×30因子の行列を導きます(行列C)。これをRを用いてkmeansクラスター分析にかけました。
POV「声がいいゲーム」と結びつきが強い声優さん
POVとクリエイターを結びつけてなにかできないかなぁと考えて、ちょっとやってみました。
集計ルールは、以下のSQLで行いました(太字の部分でゲーム発売日の条件を適宜変えています)。
SELECT c.name, COUNT(c.name)
FROM povgroups p
JOIN shokushu s
ON p.game = s.game
JOIN createrlist c
ON s.creater = c.id
JOIN gamelist g
ON p.game = g.id
WHERE p.pov = 29
AND s.shubetu = 5
AND g.sellday BETWEEN '2015-01-01' AND '2017-12-31'
GROUP BY c.name
ORDER BY COUNT(c.name) DESC
LIMIT 20
わかりやすく言えば、ユーザー①がゲームXに対して「声のいいゲーム」POV入力をした場合、そのゲームXに出演されている声優さんすべてに1票が入るという形です。
これを全てのユーザーのPOV入力を声優さんへの票と考えて集計しています。
これをゲームの発売日年代を3年ごとに区切って集計しました。
■2003~2005年発売作品について
集計ルール上、特定タイトルの影響は出るとは思いますが、それにしてもなんという「つよきす」感。
■2006~2008年発売作品について
北都南さん、一色ヒカルさんの2強そのままに風音さん、安玖深音さんの支持が厚くなってきます。人気もあるかもしれませんが、出演数自体が違いますからね。
この区間は票数自体がめちゃめちゃ多くて、このころのErogameScape、ひいてはエロゲー業界全体の盛り上がりを感じさせます。
■2009~2011年発売作品について
ゆかり教育の時代。
■2012~2014年発売作品について
レジェンド桐谷華さん爆誕。
個人的にはこのくらいの感覚から時間が止まっています。
■2015~2017年発売作品について
ご存知秋野花さん、遥そらさんが強いですが、桐谷華さんと澤沢砂羽さん合せるとトップになっちゃうという恐ろしさ。
え? なんでその二人足したのって? ……な、なんででしょうかね……。
しかしPOV数全体、かなり少なくなってますね…。
コミケ93レポート
ちょっと旬はすぎてしまいましたが、コミケであったことを記録しておきたいなと思います。
コミケでのサークル参加も気付けばもう4回目ということで、優雅に松屋朝食をキメてからのんびり来たのですが、いざついたら、正面階段での入場制限がかかる5分前というギリギリの到着になって冷や汗かきました。
次回はもう30分早く起床しないといけないね。慢心ダメ。
今回は頒布物が5種類と多かったので、ダイソーのカラーボードで工作した本立てを準備していきました。
参考↓
ダイソーのカラーボード1枚で出来る同人用ディスプレイスタンドver3.2の図面公開です。ついでにボードの切り出し用配置も。軽くて安くて便利です。うまく使えば何回もイベントで活用出来るのでコスパ最強です。後ろにスペースがあるのでつり銭置き場にも出来ますhttps://t.co/MBfto0mryR pic.twitter.com/8RQNWPqQST
— 一休 (@ikkyu019) 2017年11月27日
作るのはめっちゃめんどくさかったけど、効果は高かったように思う。
やっぱ本を立てるのは、ディスプレイ的に大事だ。
開幕一番最初にいらっしゃったのが、緒乃ワサビさんの代理でいらっしゃったという方でした。
ワイの作った本が……原作者さまのところに……いく……だと……。同人作家的には本懐のひとつなのではないか思います。ふぉおおおおお。
ツイッターでお世話になっている方が来てくださったり、またご挨拶に伺ったりしてきました。これぞイベントの醍醐味です。既刊から追っかけてくださる方もいらっしゃるようで、ありがたい限りでございます。プリッツ差し入れてくださった方、ありがとうございます。おうちでお酒のおつまみにしています。
今回唯一女性で買ってくださった方がいたのですが、
なんだかどこかで見たことある方ような……。あれはラプラシアンの生放送…? 電妄…? いや、まさかそんな……。
などどゴチャゴチャ考えていたために、「もしかして水野七海さんですか?」の一言が出ませんでした。
後日、水野七海さんのツイッターの写真にウチの新刊を発見し、どうやらご本人だったらしい……と、もうびっくりでありました……。
イケメンな外国人の方が流暢な日本語で新刊を2部買ってくださったことが印象に残っています。こんなこと過去にはなかったですよ。
キックスターターのときも思いましたけど、ニューリンの海外人気、想像以上にすごいですね。気になってアクセス解析してみたところ、ウチのブログの訪問者の12%は海外からみたいです。
今回、初の東7のスペースを頂いたのですが、もうこれが寒い!マッハ寒い!
まだ内側でマシな方とはいえ、多方面に入り口があり風通しがめっちゃよくて寒いのなんの。冬で7・8配置されたらマフラー&ブランケット必須です!
とまあそんな感じで、いろいろな方に来ていただけて、びっくり&びっくりでありました。毎回修羅場するたびに、もう次は無いな……と思いながら作業してて、引退詐欺みたいな感じでやっていますが、原稿はしんどくてもイベントはやっぱ楽しいんですよね。
次回のことは何にもわからないですけど、いいネタみつかったらまた何かやりたいですね。
C93頒布物の委託&再販について
改めまして、あけましておめでとうございます。
2018年も、当サークルをよろしくお願いいたします。
C93頒布物の委託&再販についてのお知らせです。
■C93新刊
エロゲーマーのための統計学 with ニュートンと林檎の樹
こちらは、コミケでの残部をCOMIC ZINさんにて委託することを予定しています。
まだ、COMIC ZINさんのほうに全く連絡をしていないので、いつからになるかはまだわかりません。しばしお待ちいただけたらと思います。
■サンクリ2017夏新刊
エロゲー業界を読み解く時系列分析
こちらは、完売してしまったのですが、イベント会場でもご要望を頂いたので、
思い切って再販して、同様にCOMIC ZINさんにて委託をしようと思います。
印刷所にはこれから依頼するので、こちらも少しお待ちいただけたらと思います。
あまり数は刷らないので、お早めにお求め頂けたらと思います。
■エロゲー統計学 マーケティング編・因子分析編・テキストマイニング編
こちらは再販分も完売してしまいました。再々販の予定はありません。
DLsiteさんにて電子書籍(pdf)でのDL販売をしようかなと画策しています。
正直なところ、既刊がすべて捌けることを全く想定していませんでした。
ありがたい反面、手に入らなかった方への対応が少し遅れますことをご容赦ください。
C93で『エロゲーマーのための統計学 with ニュートンと林檎の樹』を頒布します。
入稿が済んだので告知をば。
コミケで統計の本を頒布します。
日時:12月31日(日)3日目
場所:東7ホール さ-07a
サークル:Modest Cute
■新刊■
『エロゲーマーのための統計学 with ニュートンと林檎の樹』
A5サイズ88ページ 頒布価格 1000円
統計解析の結果を載せていた既刊とは違い、今回は統計学やSQLの入門書のような内容になっています。レベル感としては、「標準偏差の意味がわかる」「SQLでとりあえずデータを表示する」くらいの内容で、ErogameScapeの情報を活用するという目的に絞っています。
こんな感じ↓の対話形式で、四五がラビに統計学を教えていきます。
理論派の四五と感覚派のラビのコンビで、数理的な背景も押さえつつもわかりやすくを目指しました。せっかくニューリンをネタにしているので、数学史の話もすこししています。
より詳しいサンプルはこちら↓
当日は既刊も持っていきます。特にサンクリ夏新刊の『エロゲー業界を読み解く時系列分析』はコミケ初登場になります。
こちらもよしなに。
エロゲーが好きな方も、統計に興味がある方も、どっちもあんまり良く知らない方もどうぞお越しくださいませ。
既刊の詳しい内容は、以下のリンクから。
エロゲー業界を読み解く時系列分析
■『エロゲー業界を読み解く時系列分析』
●サンクリ2017夏新刊
●B5サイズ58ページ 頒布価格 700円
●表紙イラスト/結城結
ErogameScapeのデータを用いて、ゲームの本数、POVの入力割合、声優の出演数などを時系列に集計しました。
また、自己回帰モデルを導入して、ゲームの発売本数と、ErogameScapeでのレビュワー数の予測をしました。
わかりやすくをモットーに頑張って書きました。
表紙&本文サンプル↓
目次は以下のようになってます。
まえがき
第1章 年別集計で過去を振り返る 基礎データ編
1-1.発売されたゲームタイトル数の推移
1-2.レビュー数およびレビュワー数の推移
◎統計コラム:時系列分析を劇的にラクにするextract関数
第2章 年別集計で過去を振り返る 発展編
2-1.POV入力数の推移
2-2.タイトルに使われている文字の推移
2-3.声優出演数の推移
◎エロゲーコラム:あの素晴らしいエロゲー原体験をもう一度
第3章 自己回帰モデルで未来を予測する
3-1.分析の流れについて
3-2.ゲーム発売本数のモデル化と予測
3-3.レビュワー数のモデル化と予測
3-4.この章のまとめ
資料
参考文献
あとがき
エロゲー統計学 [マーケティング編] with 波間の国のファウスト
■『今日から始めるエロゲー統計学 [マーケティング編] with 波間の国のファウスト』
●C91新刊
●B5サイズ58ページ 頒布価格 800円 (WebでDLできるエクセルデータ付属)
●表紙イラスト/狗尾
マーケティングに活かせる統計解析をやってみました。
具体的には、
① 因子分析で、ゲームを数値化してユーザーのデータを集める。
② クラスター分析で、ユーザーの分類する(セグメンテーション)。
③ ロジスティック回帰で、買いやすい人の傾向を調べる。
の3段階で解析をしています。
マーケットの話なので、『波間の国のファウスト』をもじりました。
今回はこれまでになくビッグなデータになっており、紙面でデータを示すことが難しくなっていますので、解析結果をまとめたエクセルデータもセットで頒布いたします。シリアルコードを書いたカードを本と一緒に頒布します。対面電書の作品ページにアクセスしていただき、シリアルコードを入力すればダウンロードできるようになっています。
表紙&本文サンプル↓
対面電書作品ページ↓
目次は以下のようになってます。
まえがき
序 章 エロゲー会社を立て直せ!
第1章 ユーザーの情報を集めろ! with 因子分析
1-0 マーケティングの2つのステップ
1-1.解析手法
1-2.POVを要約する
1-3.ゲームを数値化する
1-4.ユーザーを数値化する
第2章 ユーザーを分類しろ! with kmeansクラスター分析
2-1.解析手法
2-2.エロゲーマーを7つに分類する
2-3.7タイプのゲームプレイ率
2-4.7タイプ別の支持ブランド
第3章 買う人・買わない人の違いを見つけろ!with ロジスティック回
3-1.解析手法
3-2.セグメントごとのオッズ比とP値
(1)恋愛重視型
(2)エロ×シナリオ型
(3)ゲーム性重視型
(4)エロS特化型
(5)エロM特化型
(6)恋愛×シナリオ型
(7)シナリオ重視型
終 章 波間の国のファウスト
参考文献・補遺
解析結果Excelファイルダウンロード方法
あとがき