ディープラーニングの社会実装に向けて (G検定)
[履歴] [最終更新] (2021/07/16 23:46:43)
最近の投稿
注目の記事

概要

G検定のシラバスにおける「ディープラーニングの社会実装に向けて」に関連する事項を記載します。

プロジェクト管理

CRISP-DM

CRISP-DM (CRoss-Industry Standard Processing for Data Mining) は、機械学習やデータサイエンスのプロジェクトを進めるにあたり、指針となる 6 つの段階からなるモデルです。

Uploaded Image

What is CRISP DM?

MLOps

  • Machine Learning と Operations を合成した造語です。
    • DevOps から派生した概念です。
  • AI を本番環境で開発しながら運用するまでの概念です。
    • AI をビジネスに活用する際に必要となります。
    • システム運用開始後も、継続して推論精度が高く安定したシステムとなるように開発運用のプロセスを回す必要があります。

オープンデータセット

アノテーション

  • 教師データの作成作業です。
  • 通常は人間によって行われます。

XAI (Explainable AI)

  • こちらのページに記載の概念です。
  • 出力に関する判断根拠や解釈を説明できるようなモデルの AI です。

フィルターバブル

インターネットの検索サイト等が、各ユーザが見たくないような情報をフィルタリングして遮断することにより、まるで自分が見たい情報の泡に包まれたようになることです。

法律と倫理

Privacy by Design (PbD)

開発段階からプライバシー侵害の予防を指向する考え方です。

Security by Design

開発段階からセキュリティに配慮します。

Value sensitive design

価値全般に配慮した設計思想です。

著作権法

  • 論文や写真など著作物にあたるデータを利用する場合は、著作権者から許諾を得ることが必要です。
  • ただし、日本の著作権法では、「情報解析の用に供する場合」に著作物を利用することが、営利・非営利を問わず適法とされています。
    • インターネット上または他の媒体の写真を利用する際に、著作権者一人一人に許諾を得ずに、無断で複製しても適法となります。
    • 第三者と共有、一般に販売、ネット上に公開 することも一定の条件下で適法です。
    • 「著作権者の利益を不当に害する」場合はその限りではありません。

不正競争防止法

営業秘密にあたるデータや、限定提供データ。

個人情報保護法

  • 購買履歴や位置情報などのパーソナルデータ。
  • 個人情報を取り扱う際には、利用目的をできる限り特定しなければなりません。
    • 利用目的が変更になる場合は、原則として事前の本人の同意が必要となります。
    • また、利用目的を本人に通知する、または公表する必要があります。

機微情報

人種、犯罪の経歴、病歴 などのデータ。金融分野におけるデータの区分です。

「金融分野における個人情報保護に関するガイドライン」

機微情報について、利用や第三者提供だけでなく、取得についても原則禁止とされています。

個人情報保護法における「要配慮個人情報」の取り扱い原則よりも厳しい規律となっています。

「AI・データの利用に関する契約ガイドライン」

  • 経済産業省が 2018年に策定しました。
  • 2019年に改定版を公表しました。

匿名加工情報

個人情報保護法に記載されています。特定の個人を識別できないように、個人情報を加工した情報です。

仮名加工情報

  • 2020年6月の個人情報保護法の改正によって提示されました。
  • 匿名加工情報は、2015年の改正によって創設されました。
  • その情報自体から特定の個人を識別できなければよく、他の情報と組み合わせることで、元の個人情報を復元できても良いとされます。
  • 第三者への提供は禁止されていますが、委託先に提供することは許可されています。

「カメラ画像利活用ガイドブック」

  • 経済産業省、総務省、IoT推進コンソーシアムが2017年に第一版を公開しました。
  • 2018年に改定版を公開しました。
  • 倫理的、法的、社会的影響を一体のものとして検討する試みです。
  • 生命科学の領域で使われていた用語ですが、AI開発でも重要視されるようになっています。

ACM FAT (Fairness, Accountability, and Transparency)

  • FAT (Fairness, Accountability, and Transparency) は、プライバシーや公平性の問題について取り組む研究領域です。
  • ACM は計算機科学の国際学会です。
  • ACM FAT は ACM が主催しており、様々な研究発表や議論が行われています。

GDPR (General Data Protection Regulation)

知的財産

  • 収集・生成したデータや学習済みモデルは、一定の条件を持たせば知的財産として保護されます。
  • 特許法、著作権法、不正競争防止法。
  • AIが生み出した「作品」の権利や保護のあり方については、いまも議論が行われています。

蒸留

教師役の出力と同じようになるように、生徒用 AI のパラメータを調整していくことを繰返すことです。教師役の学習済みモデルのエッセンスが蒸留されて、生徒役に移ることになりますが、リバース・エンジニアリングにおける非破壊検査に近いものであり、技術的手段によっては阻止しにくいと言われています。

Partnership on AI (PAI)

  • 2016年に組織されました。
  • Amazon、Google、Facebook、IBM、Microsoft などアメリカのIT企業が中心となっています。

その他のガイドライン

  • 「倫理的に調和された設計」
    • 2019年、学術団体の IEEE。
  • 「アシロマAI原則」
    • Future of Life Institute (NPO法人)
    • 技術開発における、安全性の検証や透明性の確保。
  • 「信頼性を備えたAIのための倫理ガイドライン」
    • 2019年4月、欧州委員会。
  • 「AI白書」
    • 2020年2月、欧州委員会。
    • AIのレギュレーションの枠組みの方向性。
  • 「北京AI原則」
    • 2019年5月、中国政府。
  • 民間部門におけるAI技術の開発等に関する10項目の原則
    • 2020年1月、アメリカ政府。
  • 「人間中心のAI社会原則」
    • 2019年、日本の内閣府。

その他

データサイエンティストのスキルセット

  • ビジネス力
  • データサイエンス力
  • データエンジニアリング力

ディープ・ブルー

1997年、チェス世界チャンピオンを破った IBM が開発した AI です。

ドローンの飛行規制

人または物件との間に 30m 以上の距離を保って飛行させることが必要です。そうでない場合は、国土交通大臣の承認が必要となります。

End-to-End Learning

ロボットの一連の動作を人手を介さずに、単一のニューラルネットワークで表現して学習します。

決定係数

回帰分析などで、データに対する推定された回帰式の当てはまりの良さを表します。

AAAI アメリカ人工知能学会

米国で開催されている、人口知能分野における国際学会の名称です。

グリッドサーチ

学習モデルに用いられるハイパーパラメータのチューニング方法の一つです。

関連ページ