情報倫理

AIと情報倫理とは

AI(Artificial Intelligence:人工知能)とデータサイエンスの進歩に伴い、情報倫理ということが言われるようになってきた。
最近、AIやデータサイエンスという言葉がよく聞かれるようになってきた。
AIの進歩で顔の認証制度が上がったり、翻訳の精度が上がるなど、コンピュータをつかってできることが増えている。
一方、AIやデータサイエンスも使い方によっては危ない部分をある。
こういうものを使いこなすためには、その負の側面を知っておく必要がある。

情報倫理は英語で Information Ethics ということから、IEと呼ばれることもある。
また倫理だけにとどまらず、データサイエンスの倫理的・法的・社会的課題についても議論されるようになった。
倫理的・法的・社会的課題は英語でEthical, Legal and Social Issuesということから、ELSIと呼ばれることもある。

"倫理"というと、"悪いことはしてはいけない"ということを思い浮かべるかもしれないが、本質は正義の実現である。
何かを禁止するというのではなく、どうしたら正義が実現できるのかという積極的な行動である。
明確な悪意がある場合は、むしろ簡単である。
難しいのは、明確な悪意はないが行為者の無知ゆえに不正義状態が生じてしまう場合がある。
以下で実例を交えながら、実際に悪意がないにも関わらず、よくない状態が発生してしまった事案を紹介する。

情報倫理には、知的所有権の尊重、SNSにおける誹謗中傷や誤情報の拡散、プライバシーと個人情報の保護なども含まれ、インターネットの普及でこれらについては長年議論されてきた。
しかし、ここでは特にAI倫理について考えていきたい。
AI倫理についてはまだ議論が始まったばかりで、いろいろな考え方があるが、現状におけるいくつかの問題点を説明する。
AIの限界や問題点を紹介するので、各自でAIをどのように使えばいいのかを考えて欲しい。

人工知能学会の倫理指針(PDF)

AIの原理と注目ポイント

情報倫理に入る前に、AIの原理と注目ポイントを述べる。
AIというのは、
  1. あらかじめ大量のデータをコンピュータに読み込ませて、
  2. コンピュータが自動的に判断基準を作成して
  3. その後、新しいデータを見せたときに、コンピュータが自分で作った判断基準を基に、何らかの出力をする
というものである。
例えば、あらかじめ大量のみかんの写真を見せて、コンピュータが"みかん"に共通する特長を探し出す。
そのあと、新しいみかんの画像をみせると、「これはみかんです」と認識するというものである。


それに対して
  1. 学習させるためにあらかじめ用意するデータは適切だろうか?、
  2. コンピュータが自動的に判断基準を作成するため、学習後はAIがブラックボックス化してしまうが大丈夫だろうか?
  3. AIが示したデータを、人間が正しく解釈できるだろうか?
  4. 悪意をもって作られたAIが出現したとき、どのように対処すればいいのか? 悪意をもってAIを使う人間に対して、どのように対処すればいいか?
  5. 悪意はないが、AIが何らかの期待していない動作をした場合、どのように対処すればいいか? 誰が責任をとるのか?
などが考えられる。

これらの問題について、詳しく考えていきたい。

統計の危うさ

情報倫理について説明する前に、統計の危うさについて述べる。
統計的なデータ処理の結果は、絶対に正しいわけではない。
統計というのは、データ処理の結果によっては非常におかしな結論を導いてしまうことがある。
二つの例で、情報倫理の大切さを説明する。
パンの危険性について

例えば、パンの危険性についてのジョークというものがある。

パンの危険性について

ある食べ物が身体にいいという話はよく聞きますが、アメリカの調査結果 によれば、パンは危険な食べ物だということがわかりました。
その驚愕の事実をご紹介します。
  1. 犯罪者の98%はパンを食べている
  2. パンを日常的に食べて育った子供の半数はテストが平均点以下である
  3. 暴力的犯罪の90%はパンを食べてから24時間以内に起きている
  4. パンは中毒症状を引き起こす。
    被験者に最初はパンと水を与え、後に水だけを与える実験をすると、2日もしないうちにパンを異常にほしがる
  5. 新生児にパンを与えるとのどをつまらせて苦しがる
  6. 18世紀、どの家も各自でパンを焼いていた頃、平均寿命は50歳だった
  7. パンを食べるアメリカ人のほとんどは、重大な科学的事実と無意味な統計の区別がつかない

ここに述べていることは事実であるが、"パンが危険な食品である"という結論がおかしいことは明らかであろう。
説明するまでもないが、優良な市民の98%もパンを食べているので、パン食と犯罪は関係ない。
しかし、「優良な市民の98%もパンを食べている」ということを隠して、「犯罪者の98%はパンを食べている」という事実だけを述べると、パンが犯罪を誘発する危険な食品のように思えてしまうのである。
こういう有害性の調査のようなものは、パンを食べている人とパンを食べてない人を比較しないといけないのだが一方だけの特徴を調査すると、このような間違った結論を導いてしまうことがある。

これは、話としては面白い。
しかし、例えば統計のことをよく知らない人が、"パンの危険性"のようは論理で特定の商品の悪口を書いてネットで拡散したとしよう。
それを読んだ大部分の人は、そのおかしさに気づくだろう。
しかし、統計をよく知らない一部の人はそれを信じて、さらに拡散してしまうかもしれない。
そうして、その商品のメーカーにダメージを与えることになる。
ここには、悪意はない。
統計に対する無知があるだけである。
しかし、結果的にメーカーにダメージを与えて、不正義が生じてしまう。
こうなってしまうと、「面白い話だ」ではすまない

AIの話に関して言えば、例えばAIにどういう人が犯罪に走りやすいかを分析させたとしよう。
そのとき、犯罪者のデータだけを揃えて、それでAIに分析させると「犯罪者に共通の特徴として、パンを食べている」という分析をするかもしれない。
だから犯罪者の分析をするとき、犯罪者だけに偏ったデータをAIに与えるのはだめなのである。
AIは万能ではない。
偏ったデータで教育されたAIはおかしな結論を出してしまうかもしれないが、あるAIが偏ったデータで教育されたおかしなAIだというようなことは、簡単に見抜けるものなのだろうか?
写真の迷信

最近はあまり聞かなくなったが、明治、大正期に「3人で写真を撮ると、真ん中の人は早死にする」という迷信があった。

実際の統計調査はないが、実は本当にそうなっていた可能性がある。
だからこの迷信が広がったのだろう。

では、なぜ3人で写真を撮ると真ん中の人は早死にするのだろうか?

明治、大正期では今ほど気楽にスナップ写真が撮れるような時代ではなかった。
記念写真のような、あらたまった写真がほとんどである。
3人で写真を撮る場合、普通は一番えらい人が真ん中に来る。
そして、多くの場合、一番偉い人は一番年上の人である。
一番年上の人は、3人の中で最初に寿命を迎える可能性が高い。
だから、3人の中で、最初に死ぬのは真ん中の人である。

ということである。
(だから、正確には"早死にする"ではなく"3人の中で最初に死ぬ"であろう。)
この話で重要なのは、写真の真ん中に入ることと、その人が最初に死ぬことは関連はあるが、

写真の真ん中に入る(原因)→その人が最初に死ぬ(結果)

というような、原因、結果の関係ではないということである。
この話を、原因、結果の関係と考えてしまうと、オカルト的な間違った結論になってしまう。

何か、二つの現象に関連があることはデータ処理で見つけることができるかもしれないが、それが原因・結果の関係なのか、原因は別にあって、原因・結果の関係ではないのか、ということはデータ処理だけでは判断しにくいことが多い。

何かある現象AとBに関係があることがわかったとする。
そして、現象Bが社会に大して、何か悪い効果をもたらしたとする。
もし、AとBが原因・結果の関係なら、現象Aに関わる人がその悪い効果の原因ということになり、何らかの責任を取らせられるだろう。
しかし、現象Aは現象Bの原因ではないなら、現象Aに関わる人はその悪い効果の責任を取る必要がない。
現象Aは現象Bの原因ではないにも関わらず、あやまったデータ解釈で現象Aは現象Bの原因であるとされてしまうと、それは冤罪ということになる。

次から、実例を基に考えていこう。

:実例1