明治大学の教授陣が社会のあらゆるテーマと向き合う、大学独自の情報発信サイト

ビッグデータの活用に向けて秘匿化技術の確立に取り組む – ビッグデータの活用には賛成です。ただし安全管理を徹底することが大前提になります。 –

明治大学 総合数理学部 先端メディアサイエンス学科 教授 菊池 浩明

ビッグデータの活用に向けて秘匿化技術の確立に取り組む

●ビッグデータの活用には充分な技術的、法的な配慮が必要になる。
●データを暗号化したまま分析ができる「プライバシー保護データマイニング」に期待。
●一般ユーザもサイバー空間の最低限のルール、リテラシーを身につけることが求められる。

日本政府もビッグデータ活用に積極的

 ビッグデータの活用に注目が集まっています。安倍内閣が先日閣議決定した「世界最先端IT国家創造宣言」でも、ビッグデータを産業や経済の活性化に積極的に役立てる方向性が示されました。
 しかし、ビッグデータの商用利用においては、データが組織を越えて行き交うことが想定されるため、プライバシー保護に配慮した新たな技術を投入したり、制度や法を整備することが急務となっています。
 私が参加している内閣府主催の「パーソナルデータに関する検討会技術検討ワーキンググループ」においても、ネットワーク技術、統計、法律、情報セキュリティなど各方面の専門家が、さまざまな角度からデータ活用の検討・評価を行いました。
 検討会では、主にJR東日本がSuicaの乗降データを外部に提供した事例をもとに、技術的に、また、法的に果たしてどこまで安全にデータを利用できるかを詳細に議論しました。乗降データの例では名前と日付、運賃のデータを削除したことで個人情報には当たらないと判断したわけですが、検討の結果、わずか数駅分のデータを用いることで個人が再識別されてしまう危険性があることが分かっています。

匿名化、暗号化の技術について

研究上、しばしば問題になるのが処理時間です。コンピュータの処理速度を上げることも今後の課題です
研究上、しばしば問題になるのが処理時間です。コンピュータの処理速度を上げることも今後の課題です。
 こうしたデータを安全に活用するためには、匿名化や暗号化などデータの秘匿性を上げる技術が必要ですが、特に匿名化の技術については、まだ歴史も浅く、いわゆる匿名化の定番と言えるほど確立した技術はないのが現状です。
 匿名化の技術的な困難さは、ビッグデータの多様性に一因があります。クルマのGPSデータや通販サイトの購買履歴、ネット上のつぶやきなど、データごとに特性があり、それらに合わせた匿名化の技術が必要となることから、なかなか方式を決定しづらいわけです。また、もとになるデータ(例えば、どの駅で降りたか)を重要なプライバシーと感じるかどうかは、人によってまちまちなため、その主観的な度合をどう定量化するかは非常に困難です。他方、こうしたデータを購入し解析する企業には、匿名化されたデータがあちこちから集まることが想像され、単体では安全なはずのデータも、他のデータと突き合わせてしまえば、個人を特定できるという問題もあります。

法やルールの整備が急務

東日本大震災の被災者に契約可能な住宅を推薦する総務省のプロジェクトに暗号化技術で協力した菊池教授。
東日本大震災の被災者に契約可能な住宅を推薦する総務省のプロジェクトに暗号化技術で協力した菊池教授。
 では、プライバシーを保護するために匿名化のレベルを上げたとしたら、どうなるでしょうか。匿名化措置によりデータの劣化や誤差が大きくなり、今度は商用で利用する意味が乏しい情報しか得られない可能性があります。再び鉄道の乗降データの例で言うと、特殊な行動(つまり乗降客が非常に少ない駅で乗り降りするなど)をしたデータは個人を特定できる危険性が高いため、削除する方式がいくつか提案されていますが、そうして削除していくと、かなり大量のデータを捨てなければならないことが分かりました。匿名化の技術革新を待つか、現時点でビッグデータの活用を進めるとすれば、目的外使用や異なるデータの照合を厳しく制限するなど、法整備によって安全性を担保する仕組みが不可欠でしょう。

プライバシー保護データマイニングという技術

PPDM技術では暗号化したデータ同士を照合することができる。比較するデータを整えることに時間がかかるなど課題もある。
PPDM技術では暗号化したデータ同士を照合することができる。比較するデータを整えることに時間がかかるなど課題もある。
 匿名化したデータでも、組み合わせによって個人が特定できてしまうという問題に対し、有効な方法として期待されているのが、私が研究を進めている「プライバシー保護データマイニング」(PPDM:Privacy-Preserving Data Mining)という技術です。
 PPDMは、プライバシーを守りつつ、データを解析するために、暗号化の技術を応用します。例えば、千葉がんセンターと共同で行った実証実験では、がん患者とピロリ菌保有者の相対危険度を調べるため、双方のリストというセンシティブなデータを暗号化したままで照合しました。こうすれば、対象者名を秘匿したままで、その原因とされる要素と疾病との関連を計算することができます。実験ではピロリ菌の保有者のがんになる確率はそうでない人の9.7倍という結果が得られ、がんセンターの医師の経験値とほぼ一致することが認められました。医療情報はもともと疫学目的での利用が想定されており、学術利用に限って言えば、比較的使いやすい仕組みができているプライバシーデータです。しかし、一般にはまだデータ利用に関するルールが整備されていません。簡単にデータを買ってきて解析できるという状況が実現するにはまだまだ時間が必要ですが、PPDMが実用化できれば、プライバシーを維持しながら企業が蓄積しているデータをビジネスに活用しやすくなります。さまざまなデータアナリシスへの応用が考えられるため、産業界の期待も大きいと感じています。

ビッグデータの可能性と危険性を理解すること

暗号化したデータならば、個人情報に触れずに因果関係や相関関係を解析することが可能です。
暗号化したデータならば、個人情報に触れずに因果関係や相関関係を解析することが可能です。
 法や制度の整備については私たちも条文を理解する必要がありますし、逆に弁護士や法律の専門家に対して、匿名化や暗号化の技術に何ができて何ができないか、どのような危険が想定されるかをきちんと説明することが大切だと感じています。
 最も危惧していることは、ビッグデータの有用性と危険性が一般に正しく理解されないまま、技術だけが先行してしまうことです。鉄道の乗降データ一つとっても、最近のストーカー事件などを見るに、人によっては非常に深刻な個人情報であることを痛感します。一般のネットワークユーザも、スマートフォンやSNSの利用に際して、サイバー空間の最低限のルール、リテラシーを培っていくことが求められるでしょう。

グローバルな競争で優位に立つために

 ビッグデータの活用において、どういうルールを作るかはまだまだ議論しなければならない課題です。しかし、時間をかけすぎてはビジネスチャンスを逃すことにもなりかねません。今後、日本が国際的なビジネスで優位に立てる領域であることは間違いなく、競争力の源泉にするためにも、各企業が蓄積しているデータを、安全を確保した上で流通・活用できる仕組みを可能な限り早く構築すべきだと考えています。

ビッグデータ時代のビジネス改革の関連記事

データから答えを導く力、統計学 – 統計学は経済や物理、生物、医療、防災など広い分野の研究に役立てられています。 –

2013.12.1

データから答えを導く力、統計学 – 統計学は経済や物理、生物、医療、防災など広い分野の…

  • 明治大学 総合数理学部 現象数理学科 准教授
  • 中村 和幸
もっと速く、もっと効率の良いコンピューティング環境へ。- 目の前のプログラムを速く動かす環境や手法づくりが一貫したテーマ。-

2013.12.1

もっと速く、もっと効率の良いコンピューティング環境へ。- 目の前のプログラムを速く動かす環…

  • 明治大学 総合数理学部 ネットワークデザイン学科 准教授
  • 秋岡 明香

Meiji.netとは

新着記事

2017.09.20

「改正・個人情報保護法」から、個人情報のビッグデータ化が本格化する

2017.09.13

女性が活躍する未来の農村のために

2017.09.06

使えないロボットはもういらない。できるロボットを世に送り出す

2017.08.30

「共謀罪」法が問題だらけになったのは、オリンピックのせい!?

2017.08.23

GPS捜査をめぐる最高裁判決の意義

人気記事ランキング

1

2014.09.01

緊急提言、人口減少社会に歯止めをかける ―方策は少子化対策、社会…

2

2013.09.01

少子化問題を斬る ―原因は、未婚化・晩婚化・晩産化にあり―

3

2017.09.13

女性が活躍する未来の農村のために

4

2017.03.29

「留学生30万人計画」が抱えている将来的課題とは

5

2016.10.19

スポーツビジネスの功罪を考えると、社会の未来が見える

Meiji.net注目キーワード

【注目!】連載コラム