【書評】『誰もが嘘をついている』
近年、「ビッグデータ」という言葉がしきりに喧伝されている。
しかし、データは集めるだけでは意味はない。
ビッグデータの効用を理解し、使いこなしてようやく意味を成すのだ。
本書を要約すると以上のようになる。
本書はビッグデータの効用として以下の4点を挙げている。
- 新種のデータをもたらすこと
- 正直なデータをもたらすこと
- 小さな部分集合に絞り込めること
- 簡単にさまざまな因果関係試験ができること
アダルトサイトの検索データなど、これまで研究には用いられてこなかったデータを集めてビッグデータとして活用することで、新たな事実が浮かび上がってくる。
人間はアンケート調査のようなものに対しては意識的に、あるいは無意識のうちに嘘をつくが、たとえばGoogleの検索クエリはほとんど嘘が混じっていないデータとして使用できる。
非常にニッチなグループ、たとえば1978年生まれのニューヨーク・メッツファンの男性に関する、分析に堪えうる量のデータをアンケートで入手するのは困難であるが、ビッグデータを駆使すれば手に入る。
A/Bテストに代表されるような、リアルの世界でやろうとすると手間や資金のかかる無作為抽出対照試験も、ビッグデータを使えば簡単だ。
筆者はこれら4点についてそれぞれ独立の章を設け、豊富な事例を挙げて解説し、続く章でビッグデータにできないこと、およびやってはいけないことを述べて本書を結んでいる。
事例がそれぞれ身近であり、知的好奇心を刺激されるような内容であるため非常に読みやすい。
ビッグデータという考え方で私が好きなのは、「国民性」というようなぼんやりした概念を目に見える形で明らかにできることだ。
国民性と聞くと思い浮かべやすい「イタリア人は女好き」のような話はおおむね個人差のようなものだろうと、私は話半分に考えている。
しかし、データで目に見える形で表される地域間の違いも存在する。
本書215ページには次のようなデータが載っている。
「妊婦は……をしてもよいか」という検索を調査し、「……」の部分に何が入るかをランキングにした国別のデータなのだが、
英国3位「チーズケーキを食べてもよいか」、同4位「モッツァレラチーズを食べてもよいか」、オーストラリア1位「クリームチーズを食べてもよいか」、同4位「サワークリームを食べてもよいか」、同5位「フェタチーズを食べてもよいか」、シンガポール2位「アイスクリームを食べてもよいか」など、乳製品を食べることに関する疑念を表す検索結果が上位に入る国が見られる一方で、
ナイジェリア、アメリカ、スペインなどは乳製品に関する検索が上位に入っておらず、ナイジェリアの1位は「冷水を飲んでもよいか」となっている。
妊婦が加熱処理されていないチーズを食べることについては避けるべき医学的な理由が存在するそうなので、乳製品一般に対しても疑念を示すのはよくわかる。
一方、地域によっては妊婦が冷水を飲むと胎児が肺炎になるという迷信があるそうで、やはりこれに対する懸念は納得できるものである。
こうしてデータとして示されると、それを国民性と呼ぶかどうかはともかく、やはり国ごとの違いというのはあるのだと実感させられる。
そして、ここで集められたデータはあくまでも個人の志向や関心の集積体であり、上位に来なかった考えを否定するものではないというのもまた私の気に入っているところである。
本書はビッグデータの力というものが実感できるような内容になっているのだが、それと同時に、ビッグデータの分析にはノウハウや知識が必要であることも実感させられる。
先日、大手アダルト動画サイトのFANZAがビッグデータを公開していたが、素人レベルでできるのはせいぜい上位に何が入っているかを眺めたり、表面的な特徴をなぞったりするくらいであり、深い意味を見出すのは難しい。
ビッグデータが現代の金脈であることは間違いないだろうが、ただ集めるだけでは価値がないというところも鉱石と同じようである。
« 【書評】『世界一シンプルで科学的に証明された究極の食事』 | トップページ | 【書評】『スッキリ中国論』 »
「書籍・雑誌」カテゴリの記事
- 【書評】『ファクトフルネス』(2020.05.09)
- 【書評】『母さん、ごめん。』(2019.04.21)
- 【書評】『スッキリ中国論』(2018.12.31)
- 【書評】『誰もが嘘をついている』(2018.11.08)
- 【書評】『世界一シンプルで科学的に証明された究極の食事』(2018.10.14)
この記事へのコメントは終了しました。
コメント