闇の側面という意味では現在ではなく未来の可能性として示されています。
まずビッグデータはその名前の通り、膨大なデータを分析することを意味するわけですが、一つ僕も勘違いしていたのは一般的な統計の無作為抽出ではなく、文字通り「すべてのデータ」をもれなく処理することを意味します。
これが、本書で何度も繰り返される「N=全て」の世界です。
そしてそのビッグデータを解析することにより今まであった常識が覆されることになります。それは「量さえあれば精度は重要ではない」という点と、「原因と結果を求める古い体質からの脱却」です。
人間はどうしても因果関係を求める傾向がありますが、本書で示されている様々な事例を見るとビッグデータを解析することにより、データ同士の間に何らかの相関関係を見つけられれば、そこから新しいひらめきが生まれることになります。
「結論」さえわかれば、「理由」はいらないのです。
大量のデータを分析することによって導き出される、数値データによる物事の判断は、人間の判断を補完し、時に上回ることもある・・・これがビッグデータの最大の衝撃であると本書で筆者は述べています。
現在インターネット上で台頭している巨人たちは、データを重要視して、次々と新しいサービスを展開したり、新しいデザインを試したりしていますが、最近であればGoogleがGoogle Anayticsの「ベンチマーク」と称して、今までAnalyticsデータは一切利用しないし、検索にも有利に働かないと明言されていた部分が揺らいで見える状況になったことを思い浮かべてしまいました。
Googleは検索精度、検索結果の満足度がKPIになっていると思われますが、リンクのクリック箇所やクリックしてから次のアクションに移るまでの時間、すなわちクリックされたページにとっては直帰だったり離脱になるわけですが、その時間さえもデータとして取得しているはずです。
ある特定の業界の標準データさえGoogleが自由に利用できるのであれば、そのデータと照らし合わせて、クリックされたページがユーザーにとって便利なページ、有益なページであるのか、それとも役に立たないページなのかの判断は自ずとできるようになります。
この点について、誰も指摘せず、「新サービス導入!」と騒ぎ立てている業界関係者には、ちょっと悲しくなったりします。
まぁそれはともかく、Google日本語入力や検索サービスの「もしかして」機能など、Google自身も様々なインターネット上のデータを駆使して自社サービスの向上を図っていることは言うまでもありません。
このビッグデータによって一番の懸念点となるのは、やはりサードレール問題の「プライバシー」です。
本書ではプライバシーについては個別同意方式のプライバシーは破綻するため、データ利用者責任制へのシフトを主張しています。
日本ではSuica問題、すなわち「k-匿名性尺度」問題と言われるものですが、海外でも"良かれ"と思って公開されたオープンデータを集計することによって、データのいわゆる個人情報に当たる名前や住所情報などは匿名化されていたにもかかわらず、行動パターンから個が特定されてしまうという問題が以前から発生しています。
今日本ではこの問題に関しては規制を緩和し、個別同意方式の対象外としようとしていますが、データ利用者責任制というわけでもなく、解析するのは自由という流れになりそうです。
この部分は大いに議論の余地があり、もしかすると何か事件が起きるとも限りません。
その他の闇の部分については、ビッグデータを解析する要因が数百や天気予測のように数千、数万の指標が利用されるようになったり、またデータの要因分析が数式で埋め尽くされていくと、それを作成した本人または数名しかわからない状況となり、ブラックボックス化していく懸念があります。
この部分に関しては「アルゴリズミスト」と呼ばれる人を作るべきという主張が本書ではなされています。
何はともあれ、全データを解析するとなると、今までゴミだと思っていたデータが有益な情報へ化けることが予想され、将来的にはオープンデータ市場が形成されるのだろうと感じました。
「ビッグデータは2次利用にデータの価値の大部分がある」と本書で述べられている部分がありますが、今後データが取引されるようになったとしても、データの購入に対して対価が発生するというよりは、発生した利益に対して1件あたりいくらという対価が発生するという方が事業者の提供側や利用側の双方にとってメリットのある状況になるだろうとは思いました。
ある特定の人にとってはゴミであっても、別の人に言わせれば宝の山になるものって沢山世の中にありますよね。その中に「情報」というものが付け加わるというイメージです。
ビッグデータ時代において、データが未来を予測し、特定の行動やリスク、可能性を示す時代になると、人間の選択の自由が奪われる結果になりかねず、より「人間性とはなにか?」を意識しなければなりませんが、本書の最後の方でヘンリーフォードについての言葉が載っていますが、これは示唆を与えてくれます。
ヘンリーフォードには「車がない時代に、『欲しいものは何か』と人々に尋ねたら『もっと速い馬が欲しい』と答えただろう」という有名な発言がありますが、おそらくフォードが消費者の欲しいものをビッグデータのアルゴリズムで調べたとしても、きっと「速い馬」という答えが帰ってくるだろうというものです。
スティーブ・ジョブズの「製品をデザインするのはとても難しい。多くの場合、人は形にして見せて貰うまで自分は何が欲しいのかわからないものだ。」という言葉にも通じるものがありますが、人間の独創性、直感、知的野心といった人間らしい特質をいかに育てるかが重要になってくるのです。
0 コメント:
コメントを投稿