ModestCute

ModestCuteは「エロゲー×統計」な同人サークルです。

サークルModestCuteについて

■お知らせ ------------------------------------------------

(2019/12/19)

 コミックマーケット97に出ます。
 日時:12月30日(月)3日目
 場所:西2ホール く-34b

f:id:tsubame30:20191219221440p:plain

 

詳細な頒布物情報はこちら↓

tsubame30.hatenablog.jp

 


■既刊情報 -----------------------------------------------

 【C96新刊】

【C96】七烏未奏 幸せの言葉 自分を好きになる6つのヒントwww.pixiv.net

 

 

【C94新刊】

【C94】エロゲー統計学[マーケティング編2]www.pixiv.net

 

 

■ModestCuteとは? -----------------------------------

同人サークル「ModestCute」はエロゲー×統計な同人サークルです。
ErogameScape-エロゲー批評空間-のデータを解析してコミケで本を出したりしてます。

 


■中の人のTwitterはこちら --------------------------------------------

なにかご連絡あればこちらまでどうぞ
twitter.com

 

劇場版SHIROBAKOのざっくり感想

劇場版SHIROBAKOみてきました。ざっくり感想を。

そんな突っ込んだ話はしてませんが、一応未視聴の方はご注意ください。

一言で言うと、おれも頑張らないとなぁと思わされました。


あの頃のまま、ゴタゴタしつつも、アニメづくりに励んでいるのだろうと思っていたのですが、世の中そうはうまくはいかない。車のエンストといい会社の概観といい、十分にフリはあったんですけどね。昇り調子だった頃を知っている分、序盤の凋落したムサニや、頑張ってる仲間に合わせる顔がないといった感じの宮森の姿は堪えました。

 

作監のキャリアは積んでいても、ダメ出しはされる(うえに、まだ収入苦しそう。生々しい)。売れてきてはいても、評価されるプレッシャーや将来への不安は消えないし、やりたい仕事が来るとは限らないし。

 

物語はめでたしめでたしになって終わる。でも現実は、一度めでたしとなっても常にその次がある。その次その次とやっていく中で別の苦しみがやってきたり停滞感が襲ってきたり。
じゃあどうすんの? というと、結局のところはなんとか頑張るしかないよね、とそういう映画だったように思った。

 

杉江さんのアニメ教室での「初心」に立ち返るようなエピソードがよかったなと。
めでたしの先での苦しみや停滞感になんとか立ち向かうときに、そこから気付かされたり励まされたりするんだろうなとか。

 

僕の個人的なリアルは公私共に順調なのですが、またどこかで下り坂に出会うんだろうななどと、映画館から自宅へ車を運転してて思いました。永遠に勝ち続けるギャンブラーはいない。満ちた潮は必ず引いていく。と言ったのは「銀と金」の森田だったか。

 

いつか来る落ち目にあったとき、それでも頑張らないといけない。
精一杯ものをつくる人間に、やっぱり憧れを感じてしまいますね。
TV版とはまた違う味でしたが、やっぱSHIROBAKO好きですね。

 

余談だけど、権利の関係で作品が頓挫したりお金掠め取られたりとかいう胸糞展開は現実のゲーム業界等等でもいっぱいあるんだろうな、とか思った。ごらんの有様だよ、とか?


あと、宮森の妄想がやたら作画カロリー高いの草。

 

 

 

【3日目】コミケ97について【西く35b】

■場所&おしながき

 日時:12月30日(日)コミックマーケット97 3日目
 場所:西2ホール く34b
 サークル:ModestCute

 f:id:tsubame30:20191219221440p:plain

 

■新刊

エロゲー機械学習[推薦システム編]with 景の海のアペイリア」
B5サイズ 54ページ 700円

 

【C97新刊】エロゲー機械学習[推薦システム編]【3日目】www.pixiv.net

サンプルはpixivリンクよりどうぞ

(念のためテキストリンク↓)

https://www.pixiv.net/artworks/78373607

エロゲーのレコメンドを目的とした機械学習の実装に挑戦した本です。
ErogameScapeのデータと、ライブラリscikit-surpriseを使いました。協調フィルタリングとか行列分解とかです。
機械学習とはなんぞやよくわからんという人にも伝わるように頑張って文章ひねりだしました。怖くないのでよろしくお願いします。
前回のコピー本(エロゲー機械学習[暫定版])と説明内容の重複があります。ご了承ください。


■既刊とBOOTHについて

#コミケ 【C94】エロゲー統計学[マーケティング編2] - ModestCuteのイラスト - pixiv

#エロゲー 【C96】七烏未奏 幸せの言葉 自分を好きになる6つのヒント - ModestCuteのイラスト - pixiv

こちらの2つの在庫を持ち込みます。
在庫および僕が移動する関係で、12/25(水)以降は既刊のBOOTH受注を停止します。

  

 

お知らせは以上です。なにとぞよろしくお願いいたします!
寒さ対策やらインフルやらいろいろ気をつけて、よいイベントにしましょう(`・ω・´)フンス!

 

 

【3日目】コミケ96について【南ソ06a】

もう今週末はコミケでございます。はやいですねぇ……。
直前の情報公開になりました。


■場所


 日時:8月11日(日)コミックマーケット96 3日目
 場所:南1ホール "ソ"-06a
 サークル:Modest Cute

 

■新刊その1

ネガゼロ10周年記念企画
七烏未奏 幸せの言葉 自分を好きになる6つのヒント」
A5サイズ 54ページ 500円

 f:id:tsubame30:20190806011939p:plain

 StarTRain』『絶対幸せ宣言っ!』『Nega0』から元気の出る言葉を抜粋しました。
ネガゼロ10周年ということと僕の思い入れが特に強いことから、言葉のチョイスには『Nega0』に少し偏ってますが、七烏未奏作品のメッセージを横断的に俯瞰できるようにしたつもりです。あの素晴らしい七烏未節をもう一度
七烏未ファンのみならず、強くあれない、前が向けない人にもなにかが残るであろう
本に仕上ってると思います。七烏未奏を知らずとも、今を変えたいと願うあなたに手にとっていただきたいです
よろしくおねがいします。

サンプルはピクシブへ↓

www.pixiv.net

 

 

■新刊その2

「今日から始めるエロゲー機械学習【暫定版】」
A5サイズコピー本 16ページ(予定) 200円(予定)f:id:tsubame30:20190806012213p:plain


ウチに求められていることは「エロゲー×データサイエンス」だよなぁ、と思うところもあり、ErogameScapeのデータで遊ぶ本を出す予定です(絶賛執筆中)
「POVの入力数からゲームが抜きゲーか非抜きゲーかを判定する」という内容です。決定木を使っています。
コピー本です。いかんせん現在進行形で作業しているので、仕様の確定だとかサンプルだとかは、イベント前日にツイッターで言及する程度になると思います。
よろしければチェックのほどお願いします。

 


■既刊について

エロゲー統計学マーケティング編2] with 枯れない世界と終わる花』
B5サイズ 62ページ 800円
サンプル↓

www.pixiv.net


エロゲーマーのための統計学 with ニュートンと林檎の樹』
A5サイズ 88ページ 1000円
サンプル↓

www.pixiv.net

 

これらの既刊も持ち込みます。
現在BOOTH通販を行っていますが、在庫および僕が移動する関係で、
既刊の受注を8/8(木)に一旦停止します。
その時点の在庫分をイベントに持ち込むことになりますので、
確実に入手したい方は、恐縮ですがお早目の注文をお願いします。

 

 

お知らせは以上となります。
暑さ対策と体調管理に十分注意しまして、楽しいイベントにしましょう!

 

 

 

機械学習で抜きゲーか非抜きゲーかを判断させる試み お試し版

ErogameScapeの欠損を機械学習で補完できないかという試み。名づけて、エロスケ欠損補完計画!
今回は単層パーセプトロンにより、gamelistのokazu列の欠損の補完を試みます。つまりは、抜きゲーか非抜きゲーかの判定をさせようというわけです。
まだまだ機械学習pythonもビギナーなので、探り探りのお試し版です。


特徴量にはPOV入力割合を使います。
過去の同人誌の結果も踏まえつつ、今回は
「女の子に襲われちゃう」「SMのあるゲーム」の入力割合の和
「シナリオがいいゲーム」「キャラを取り巻く世界観がよいゲーム」の入力割合の和
の2つを特徴量として使います。

 

学習の対象データは「どちらの特徴量もその値が0でない」「okazuがNULLでない」ものとしました。該当が5891件あり、このうち、300件を学習データに、残る5591件をテストデータとして使います。
5891件について特徴量をSQLで入手し、値を標準化。ランダムに300件を抽出して学習データとしました。

 

学習データ300件について散布図をみてみましょう。

f:id:tsubame30:20181002214724p:plain


横軸は「女の子に襲われちゃう」「SMのあるゲーム」のPOV入力割合の基準値縦軸は「シナリオがいいゲーム」「キャラを取り巻く世界観がよいゲーム」のPOV入力割合の基準値です。
青い○は抜きゲー橙の△は非抜きゲーを指します。
シナリオ系のPOVが多い右側は、青い非抜きゲーが多く、
エロ系のPOVが多い上側は、橙の抜きゲーが多くなっています。

 

ここで、抜きと非抜きを分けれるような境界線をパーセプトロンで探します。
アルゴリズムおよびソースコードは、『夢見る機械学習 回帰・パーセプトロンpython実装入門』(著:金城俊哉/秀和システムのダウンロードデータをほぼそのまま拝借しました。重みの更新ループ数を変えたくらいでほとんどそのままです。相場もよくわからないので適当に3000回ループさせてます。

 

データがはっきり線形分離できるようなものでないからなのか、はたまたそういうものなのか、3000回更新しても値に再現性はありません。ひとまず3000ループでの学習を3回個別に記録しました。

f:id:tsubame30:20181002215535p:plain

f:id:tsubame30:20181002215625p:plain

f:id:tsubame30:20181002215627p:plain


毎回微妙に傾きが異なり、再現性はないですが、まあそれっぽく分けれそうなところに境界線を引くことができました。

 

 

得られた境界線で、テストデータ5591件を分類し、正解率を調べます。

f:id:tsubame30:20181002220109p:plain

 

各回とも微妙に傾きは違いますが、正解率やF値に劇的に変化はありません。
正解率は75%程度、F値は78%程度です。相場はわかりませんが、たぶんこのままでは使い物にならんでしょう。

でも、正直もっと正解率は低いと思っていました。
特徴量を工夫すれば、もっと高い正解率は出せそうな気がします。


ただ、単層パーセプトロンで粘るよりは、いろんな手法を一通り経験したほうがいろいろとよさそうです。ロジスティック回帰か、ニューラルネットか、SVMか、ランダムフォレストか……。

 オレはようやくのぼりはじめたばかりだからな このはてしなく遠い機械学習坂をよ……。

 

 

 

C94新刊は『エロゲー統計学[マーケティング編2] with 枯れない世界と終わる花』です。

コミケまであと2週間を切りました。

かろうじて修羅場を乗り越えたので告知です。

 

 日時:8月12日(日)コミックマーケット94 3日目
 場所:東5ホール "ホ"-27b
 サークル:Modest Cute

 

■新刊■
エロゲー統計学マーケティング編2] with 枯れない世界と終わる花
 B5サイズ62ページ  頒布価格 800円

 

f:id:tsubame30:20180731001640p:plain

 

ErogameScapeのデータを使った統計解析をまとめた、当サークルおなじみのスタイルの本です。

今回はマーケティング編2と銘打って、シナリオ重視、イチャラブ好き、S型抜きゲーマー、M型抜きゲーマーなどさまざまなタイプがあるエロゲーマーが何を好み何を語るのかを統計解析で解き明かします。

 

具体的には、

ここ10年のエロゲーのトレンドを時系列順に追ったり

f:id:tsubame30:20180730224131p:plain

                ↑「キャラ」「ストーリー」系のPOV登録が減少し、

                  「年上おっぱい」「寝取られ」系のPOVが増加しているの図

 

ユーザーを7タイプに分けてどんなゲームとマッチングしているかを調べたり、

f:id:tsubame30:20180730224653p:plain

                   ↑「ゲーム×シナリオ型」のユーザーはアリスソフト

                    「恋愛×シナリオ型」のユーザーはHARUKAZE、

                    「エロ型」のユーザーはアトリエかぐやをやっているの図

 

ユーザーの7タイプごとに長文感想をテキストマイニングにかけたり、

f:id:tsubame30:20180730224849p:plain

                     ↑「ゲーム×シナリオ型」のユーザーは、”プレイ時間”

                      「エロ型」ユーザーは”Hシーン”の”シーン数”が

                      「シナリオ型」は”ネタバレ”が気になるの図

 

と、いろいろなことをやっています。

今までの集大成のような1冊になったと思っています。

本のサンプルは以下のPixivリンクから。

 

www.pixiv.net

 

 

というわけで、当日はよろしくお願いします。

今年は暑さが異常なので、体調管理的なところに不安を感じております。

みなさんもお気をつけて良いイベントにしましょう。

後日BOOTHでも取り扱いますので、イベントに来れないという方もぜひよろしくおねがいします。

 

 

POVの入力傾向でエロゲーを9種類に分類してみた話

以前マーケ編で、POVを30の因子に縮約しましょうというネタをやりました。
その結果をつかって、マーケ編ではユーザーを分類しましょうという話をしましたが、消費者の分類だけでなく、商品の分類もできるのでは? という着想を得たのでやってみました。

 

2008/01~2018/04発売のPOV(A評価)登録数15を超えるものを対象として、kmeansクラスター分析を行いました。
今回クラスター数は適当に9でやってみました。
結果は↓から。(Googleスプレッドシートです)

エロゲーをkmeansクラスター分析で分類してみた

 

リンク先の表の値は、各クラスターに分類されたゲームの各Factorの平均値です。
数字の大小比較がしにくいので、セルや文字の色を変えてます。

 値を省略した結果は下の画像のようになります

f:id:tsubame30:20180526222730j:plain

 特徴がもっとも出ているのはクラスター4です。「ストーリー」「バトル」「インテリ」「不幸病弱」の値が非常に大きく出ています。燃えや考察や泣きなどがウリのシナリオ重視型のゲーム郡だと考えられます。


 クラスター5は、「恋愛」「絵」の値が非常に大きくなっている恋愛重視型のゲーム郡だと考えられます。「ストーリー」の値がさほど大きくないのがシナリオ重視型との決定的な違いですね。


 クラスター6は「ゲーム性」「バトル」の値が大きいゲーム性重視型と考えられます。「ファンタジー」との親和性が高いのも特徴的ですね。


 クラスター2は、シナリオ型・恋愛型・ゲーム性型の中間のような傾向が現れています。これらは非抜きゲーの中間層であると考えられます。


 ここからは抜きゲーがらみのクラスターになっています。
 クラスター3が「ハードエロ」「触手」「痴漢」で高い数値を示しています。エロ特化の中でもドS系のゲーム群であると考えられます。


 一方クラスター9は、「M要素」「妹・姉」が大きく、「アンチロリ」が最も低くなっています(つまりロリ傾向が最大)。エロ特化の中でもM系のゲーム群で、雰囲気が比較的明るいゲームが多くなっています。


 クラスター1は、これらの中間の傾向が現れており、抜きゲーの中間層と考えられます。


 残るクラスター7と8が数値だけ見ると解釈が難しく難解ですが、具体的なラインナップから後知恵的に読み解いてみましょう。
 クラスター7は、『euphoria』『媚肉の香り』『巨乳ファンタジー』など、エロとシナリオとのバランスで評価されているゲームが並んでいます。今回、POVの入力"割合"を使っているので、シナリオを評価するPOVとエロを評価するPOVがともに入力された結果、Factorの値の特徴的な部分が潰れてしまったと考えられます。
 クラスター8は、『ToHeart2AD』『つよきす2学期』『でにけり』など、ネガティブな評価が目立つゲームが並んでいます。「ネガティブ」が大きく出ているちょっと残念なゲーム群であると考えられます。

 

 

最近のゲームがこの9分類のどれにあてはまるかを見てみましょう。
2017・2018年それぞれについて、データ数で上位3つずつ並べて直感どおりかを確認します。

f:id:tsubame30:20180526221930j:plain

将軍様はお年頃』がゲーム性重視型なのは変な感じがしますけど、概ね感覚どおりに分類されているように思います。
今年はまだドS抜きゲーに分類されているものが出てきていません。今後に期待ですね。(あるけど、POVが15に到達していないだけかも・・・)


結構この時点でちゃんと分かれたなーと満足している部分もあるのですが、これはとりあえずやってみたってだけの結果です。
「ネガティブ」を説明変数として使うのが適切なのかというとあやしい感じがします。内容じゃなくて評価の傾向になっちゃってますし。
説明変数やクラスター数変えちゃうとまったく違う結果になることもあるので、もうちょっと試行錯誤が必要な気がしてます。

 

 


最後に詳しく解析方法を書いて終わりにします。

f:id:tsubame30:20180526222120p:plain

① 以下のSQLでゲームに登録されているPOVをすべて取得して、エクセルのピポッドテーブルで行列の形にします。行総数に対する割合で集計したものを用いました(行列A)。

SELECT p.game, p.pov
FROM povgroups p
JOIN gamelist g
ON p.game = g.id
WHERE p.rank = 'A'
AND g.sellday BETWEEN '2008-01-01' AND '2018-05-01'


② 行列Aと、マーケ編でのPOV縮約の結果(行列B)を掛け算して、ゲーム×30因子の行列を導きます(行列C)。これをRを用いてkmeansクラスター分析にかけました。