2017年6月26日月曜日

AIがベストセラーを当てる?「ベストセラーコード」

【このテーマの目的・ねらい】
目的:
 AIでベストセラーになるかどうかを見分けられるということを
                           知っていただきます。
 どういう本が売れるのかを知っていただきます。


ねらい:
 又吉さんの新作がベストセラー条件を満たしているかどうか、
                どなたか試してみていただけませんか。
 (1作目は有名なお笑い芸人が書いたということで人気になったのですが、
 今度はそうはいかないでしょう。売れる作家の実力が評価されます)


ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
「ベストセラーコード」とは分かりにくい書名ですが、
AIでベストセラーを見分けるのです。
スゴイことです。


これは本当にAIらしいAIの活用法です。



著者のお二人であるジョディー・アーチャーとマシュー・ジョッカーズは
大学の教授ではありません。
スタンフォード大学中に知り合ったようです。

ベストセラーになった本とならなかった本、
5千冊をコンピューターに読ませて、その差異を発見したのです。
概ね80%の精度で見分けられるといいますから、
目利きのできる編集者等の能力をはるかに上回っています。

差異の領域を、
以下の4つに分けてベストセラー条件を見出しています。
 
  1.  テーマ
  2.  プロット
  3.  文体
  4.  キャラクター


それぞれ、結論をご紹介します。

1.テーマ

1)主テーマが三つか四つあり全体の30%を占める。

2)サブテーマもいくつかあるがウェートが低い。


3)受け入れられているテーマ
 もっとも受け入れられているのは親密な人間関係
 結婚、死、税金、
 テクノロジー(最新の技術で、かすかに不穏な空気を感じるものがいい)、
 葬儀、銃、医者、仕事、学校、社長、新聞、子ども、母親、メディア、など


4)受け入れられていないテーマ
 セックス、ドラッグ、ロックンロール、誘惑や肉体を表現する言葉
 (「肉体」は、犯罪行為の時や痛みをあらわすときは別)

 タバコ、アルコール、神、情熱的な愛などの激しい感情、


 絶望、苦悩、社会の大変革、政財界における駆け引き、
 逗留、ディナー・パーティ、カード遊び、
 ドレスアップした女性たち、ダンス


→ということは、
 冗談や軽薄な言動よりも小火器やFBI、
 人間の顔よりも株式市場を好むらしい。
 教会よりも実験室、宗教よりも精神性、
 パーティーよりも大学、猫よりも犬らしい。


5)場所
 町や街を好む。
 想像力を一所懸命働かせなければならない場所はダメ
 砂漠、海、ジャングル、牧場などがダメ


6)登場人物
 普通の人間がよい。
 小人、君主、戦士、女司祭、軍曹、公爵、魔法使いを
 登場させてはいけない。
 (唯一の例外はハリーポッター)


上野コメント
 ベストセラーは多くの人が受け入れるということですから、
 身近であって、少し非日常性を取り入れるということが
 いいのでしょう。


 このモデルが適合するのは、80%の確率なので
 「ハリーポッター」のような
 20%の特別なベストセラーがあるということです。

2.プロット

プロットとは、
ハッピーな状態、明るい状態などポジティブな感情状態と
暗い、追い詰められているネガティブな感情状態との
交互の展開のことを言っています。


過去のベストセラーの分析では、
以下の7パターンが見つかっています。
いずれも基本的な3幕構成のどれかをとっているのですって。


この7パターンは実際にベストセラーで存在するのですから
どんな展開なのか想像してみてください。
単純なハッピーエンドではないものが結構あるということです。


 
 
 
 
 
 
 


3.文体

こういうことなのだそうです。
事実だとして告げられると、
「なるほどそうなのか」と思います。



 do:ベストセラーはそうでない本に比べ2倍登場
 thing:6倍
 very:半分  安易すぎる。
 n’t:4倍   日常会話型
 ‐’d(例 I would):12倍  〃
 ‐’re(例 You are):5倍   〃
 ’m:5倍   〃
 okay:3倍  くだけた表現
 疑問符は多い 登場人物がよく質問する。
 感嘆符は少ない うっとうしい
 .(ピリオド):多い
 ;や: 少ない
 省略符号(・・・・・):多い  読者に想像させる。
 
【上野要約】 日本語に変換するとこうなるでしょう。
 行動を記述する
 「コト」を記述する
 日常会話を使う。
 疑問符、省略符号を使う。 →読者に考えさせる。
 感嘆符、強化副詞は使わない。 →うっとうしい。
 文章を切る。 

4.キャラクター

以下、この項の主たる部分をそのまま転載しご紹介します。
たいへんおもしろい結果ですね。

------------------------------------------------------------------------------

わたしたちは、その小説のなかで使われている
キャラクターの名前と代名詞をコンピューターに探させて、
それからそれらといっしょに使われる動詞を調べるという手法を取った。
 
その結果、キャラクターの行為主体性を
かなりの程度までつかむことができることがわかった。
 
「ダニエラが立つ」「彼女が読む」といったデータにより、
小説のなかでキャラクターがどのように行動しているかを調べ、
それをもとにその小説が売れるかどうかを予測したところ、
72パ‐セントの確率で正しく予測することができたのである。
 
判定に使う動詞は基本的なものに限定したが、
そこから浮きぼりになったのは、ベストセラーのキャラクターは、
非ベストセラーのキャラクターがしないことをしている、ということだった。

日常的な動詞は重要な意味を持っていたのだ。
 
ベストセラーの主人公は男女問わず、かならず何かを必要(need)
としていてそれを表明している。
 
かならず何かをほしがって(want)いて、
読者は主人公が求めているものを知る。
 
needとwantは、ベストセラー小説には欠かせない動詞なのだ。

あまり売れていない小説の場合、needとwantが使われる回数は明らかに少なくなる。
 
ベストセラー小説の世界では、登場人物は自らの行為主体性を自覚し、
コントロールし、表現する。
使われる動詞は迷いがなく、自信が伴っている。

彼らはつかんで(grab)、実行し(do)、考えて(think)、訊いて(ask)、
見て(look)、離さない(hold)。そして、愛する(love)。
 
彼らは自分をよくわかっている。
自分自身を好きであるとは限らないが、自分をしっかりと持っている。
自分の人生を生きて、ことを起こす。
 
ベストセラーのキャラクターは男女問わず、
伝えて(tell)、好み(like)、見て(see)、聞いて(hear)、笑って(smile)、
達成する(reach)。
 
そこにはエネルギーがある。
引いて(pull)、押して(push)、何かをはじめ(start)、
働いて(work)、知り(know)、そして到達する(arrive)。
 
ニューヨーク・タイムズのベストセラーリストに載るキャラクターは、
目的と能力と自信を持ちあわせている。
 
一方、リストに載らなかった小説では、
これらの動詞が見られる回数は少なくなる。
 
自信を持って行動するキャラクターとは
対照的なキャラクターを見てみよう。
 
モデルが抽出した結果によれば、彼らはあまり何かを必要とせず、
求めず、行動せず、語らず、達成しない。
 
そのかわり、立ちどまり(halt)、あきらめる(drop)。
 
ところが読者は、
一方的に要求(demand)しながら、見かけだけではっきりせず(seem)、
じっと待って(wait)、邪魔をする(interrupt)
キャラクターにはつきあいたくはないと思っている。
 
読者は、
見かけだけではなくて、はっきりさせてほしいと思っている。
待つのではなく、行動してほしいと思っている。

要求して邪魔をするのではなく、自信と品格を持ってほしいと思っている。

 
魅力のないキャラクターは、男でも女でも、
声を張りあげて(shout)、放り投げ(fling)、
突然向きを変えて(whirl)、相手を押しのける(thrust)。
 
勘弁してほしいと思うだろう。
 
さらには、ぶつぶつと文句を言い(murmur)、
抗議して(protest)おきながら、ためらう(hesitate)。
読者はあきれるに違いない。

これらの動詞は物語の主人公というより、ぐずる子どものためのものだ。

「ためらう者は機会を逃す」というが、小説にもあてはまるようだ。
「ためらい」はページをめくらせない。
 
あなたが小説の登場人物で、立ちどまったり、あきらめたり、
ためらってばかりいるとしたら、それは空白のページを生みだしているに等しい。
 
データは、ベストセラー小説における
男女の役割には違いがあることを示している。
 
行動することはするのだが、その行動には違いがある。
 
何かを費やして(spend)、歩いて(walk)、祈る(pray)のは共通しているが、
男はキスをして(kiss)女は抱きしめる(hug)。
 
男は女よりも飛んで(fly)、運転して(drive)、殺す(kill)。
女は男よりもおしゃべりをして(talk)、読んで(read)、想像する(imagine)。

男は旅をして(travel)、女はとどまる(stay)。
(上野注:これは原始の狩猟時代の人間生活のパターンの名残りです)

男は仮定して(assume)女は決断する(decide)。

男は約束して(promise)、女は信じる(believe)。
どちらも愛する(love)が、どちらも憎む(hate)のは女。

どちらも眺める(see)が、見つめる(stare)のは男で、
見つめる先にはたいてい女がいる。
 
女は悲鳴をあげて(scream)、突き飛ばす(shove)。
男はくよくよと悩んで(worry)、殴る(punch)。
 
このようにベストセラーには伝統的な男女の役割を示すパターンがあるが、
もうひとつ男女に共通する注目ポイントがある。
 
 わたしたちが集めた小説すべてから精神や感情に関する動詞を
すべて抜きだしてみた結果、
実存的な経験はベストセラーのほうに多いということがわかった。
 
ベストセラーに顕著に見られる動詞は22あり(上野注:前掲)、
それ以外の小説では8つしかなかった。
 
ベストセラーのキャラクターが感情を表現するときに使う動詞の上位4つは、
必要とする(need)、ほしい(want)、寂しく思う(miss)、愛する(love)
だった。
 
これらを分析するだけで、古典の名作や大ヒット作を見分けることが
できるかもしれない。

ベストセラーのキャラクターは、非ベストセラーのキャラクターにくらべて、
平均して、needとwantを2倍、missとloveを1.5倍の頻度で使っている。
 
ヒットしない小説のキャラクターの感情は受動的に表現される傾向がある。
 
まわりの環境に受動的にかかわることを示す動詞が使われるため、
みずから世界をつくるのではなく、世界がそのキャラクターをつくる、
という印象を読者に与えてしまう。
 
閉鎖的で、ネガティブなキャラクターである。
 
彼らは、受けいれて(accept)、嫌悪し(dislike)、はっきりせず(seem)、
仮定して(suppose)、償う(recover)。
それから、願う(wish)。
 
needやdoが能動性を失ったらwishになるのではないだろうか。

非ベストセラーのキャラクターは、ベストセラーのキャラクターにくらべて、
平均してwishを1.3 倍、supposeを1.6倍、
dislikeにいたっては2倍使っている。

------------------------------------------------------------------------------

そうやって、ベストセラーの条件が分かってくると、
コンピュータが小説を書けるようになるのか、という疑問が生じます。

最後の章で、
コンピュータに「書かせる」ことについての試みや事例等の紹介があります。
著者たちの結論は、感動を与えるような創造性のあるものは無理だろう、
ということでした。

なお、この本の解説者が、こういうことを言っていました。
「これはアメリカのことである。日本にそのままあてはまると思うな」
「今の社会状況を反映しているので、変わっていく可能性がある」

この本を読む人であればそのくらいの見識はお持ちでしょうに。

0 件のコメント: