機械学習(ML)とは何か?その定義と重要性

Acronis
Acronis Cyber Protect Cloud
サービスプロバイダー向け

人工知能(AI)、機械学習(ML)、その他の高度なコンピューティングの概念などの用語の違いを理解していない人は少なくありません。説明を求めている方や、これらの技術が現代のサイバーセキュリティ・ソリューションで使用される理由と方法を知りたい方は、この記事をご参照ください。

●      機械学習の定義

●      機械学習は誰が、なぜ使うのか

●      機械学習の仕組み

●      人工知能と機械学習の違い

●      機械学習の利点とその重要性

●      機械学習とサイバーセキュリティ

●      機械知能(MI)の定義

●      Acronis Cyber Protect Cloud:Advanced Security Pack

機械学習(ML)の定義とは?

機械学習(ML)は、データから学習できる人工知能(AI)の一種です。機械学習は、システムに特定の指示を与えることなく、ラベル付けされたデータ、アルゴリズム、統計モデルを用いて、パターンの決定、評価、モデルの精度と性能の向上のための継続的な再学習を行うことができます。データとは、テキストファイル、画像、ビデオなどであるが、MLアルゴリズムがデータから学習できるように、文脈を特定する情報タグを追加することによってラベル付けされたものです。

MLは知識や専門性を高めるが、その応用には限界があります。例えば,猫と犬を認識するモデルを訓練しても,ケーキを焼く方法はMLの知識とは異なるので学習できないのです。

機械学習は、誰が何のために使うのか?

MLは様々なアルゴリズムを用いて、意思決定、結果予測、結果のクラスタリング、異常の検出を行う。データクラスタとは、他のデータクラスタには存在しない類似の特性を持つデータのグループです。異常検出は、異常値、つまり、任意のクラスターで識別されるデータとは異なるデータを識別します。

例えば、MLモデルが犬と猫の画像を分析し、犬用と猫用の2つのクラスタを作成するとします。もし、モデルが鳥の画像を解析すれば、この画像は異常であると検出されるでしょう。

金融、保険、医療、小売、政府、軍事、農業など、あらゆる産業でMLは数え切れないほど利用されています。皆さんは日常生活でMLの多くの例を体験しています。今日、MLがどのように利用されているかの例としては、以下のようなものがあります。

●      携帯電話やMicrosoft Wordに文章を入力する際、手入力や入力ミスを減らすために、MLは言葉を推奨するために使われています。

●      検索エンジンは、特定の情報や特定のサイトを探すときに、MLを使って提案します。

●      電子メールフィルタはスパムを特定するためにMLを使います。

●      銀行のアプリケーションでは,不正な取引を特定したり,個人の信用度を評価するためにMLが使われています。

●      保険会社では、保険金請求の不正を特定し、保険料や保険金の損失を予測するためにMLが使用されています。

●      ヘルスケアでは、MLはDNAの塩基配列決定に使用され、病気のパターンを特定し、早期の健康問題を検出し、医療の質を向上させます。

●      軍事分野では、MLは標的の識別や軍人と装備の輸送の精度を向上させるために使用されています。

●      自動車メーカーは、自動車やトラックの画像認識にMLを使用しています。

●      Netflixは、あなたが次に見たいものを推薦するためにMLを使用しています。

●      音声認識では、個人の音声のパターンを特定し、認識を細かくするためにMLが使われています。

機械学習の仕組み?

機械学習(ML)には様々な仕組みがあります。以下は,MLの最も単純な動作の例です。

ステップ0:ビジネスはデータをラベル付けし、分類する必要があります。データの分類は,データのラベルから特徴を抽出し,ファイルの種類,内容,その他のメタデータによってデータを整理した結果です. 例えば、データは部署、ユーザー、機密保持レベルなどによって分類することができます。このようなタスクは、ラベル付きデータで学習させた教師付きモデルを用いることで実現されます。

ステップ1:分類されたデータを使って、トレーニングセットのデータでモデルを構築します。

Acronis
機械学習の学習セットとその仕組み

ステップ2:このステップは、ステップ1と交互に行われます。モデルは学習するためにデータのトレーニングセットを使用します。これは反復プロセスであり,適切に分類されなかった場合のフィードバックループやエラー関数を含み,エラーは再分類のためにStep 1に戻ります。このプロセスのために,MLでは,逐次的な決定プロセスに基づく構造である二分木を開発します。モデルは,根から始めて,ある特徴を評価し,2つの枝のうち1つを選択します。この手順は、最終的な葉に到達するまで繰り返されます。

Acronis
機械学習の二項決定ツリー

ステップ3:新しい分類データをモデルに送り込み、再トレーニングを行い、性能の向上と精度の検証を行います。この時点で、モデルは誤検出の割合を特定します。何パーセントの誤検出を許容できるかは、事業者の判断に委ねられます。もし誤検出が許容できない場合は、許容できる誤検出レベルを満たすようにモデルを再トレーニングするために、システムにさらにデータを供給するか、データからさらに特徴を抽出する必要があります。

ステップ4:オプションとして、MLは使用するアルゴリズムに応じて、生成されたモデルをコンパクトにしたり、最適化したりすることができます。例えば,複数のステップを組み合わせたり,並列処理を行ったりすることができます。

人工知能(AI)と機械学習(ML)の違いは何ですか?

Acronis
マシンインテリジェンス

AIとは、機械を使って人間の知能を模倣する科学分野です。真のAIとは、機械が知識を持つだけでなく、推論や演繹的論理を用いてその知識を応用する方法を機械が知っていることです。AIには3つのサブセットがあります。

●      狭域AIとは、機械がチェスのように一つのことに長けていることを意味します。

●      一般的なAIとは、機械がいくつかのことを得意とするが、認知的な存在ではないことを意味します。

●      スーパーAIは、学習し、自ら問題を定義し、さらに学習し、自己認識の感覚を持つことができます。ターミネーターシリーズに登場する架空の人工神経ネットワークベースの意識的集団心理・人工一般超知能システム「スカイネット」は、スーパーAIの一例です。

幸か不幸か、私たちは狭義のAIしか実現していません。

AIの目的は人間の思考をシミュレートできる知的な機械を作ることですが、MLは特にプログラムされなくてもデータを使って機械が自ら学習することを可能にするAIのサブセットです。

機械学習技術のメリットとは?

機械学習(ML)には、次のような点で大きなメリットがあります。

●      大規模なデータの解析に適しています。MLは、人間の頭脳では不可能な、非常に大きなデータセットを高速に処理することができます。

●      異常値や外れ値を素早く特定できます。MLは、人間のように特定のものを探すのではなく、あるはずのないものを探すので、異常や異常値を検出するのに優れています。

●      傾向やパターンを素早く特定します。MLは人間が識別できない傾向やパターンを識別することができるため、データマイニングに適したアプリケーションと言えます。

●      継続的に結果を改善します。MLは静的な結果を出すのではなく,継続的に再トレーニングを行い,モデルや結果を改善し続けます。

●      意思決定の自動化 をします。継続的な再トレーニングによって性能を向上させるMLは,意思決定を迅速に自動化することが得意です。例えば、MLはあなたのオンライン行動を分析し、あなたが欲しいと思う適切なウェブサイト、製品、サービスを推薦することができます。MLは、CX(カスタマー・エクスペリエンス)を向上させるために特に重要なコンポーネントです。

機械学習の代表的な手法

機械学習(ML)の分野では、様々な種類の学習があります。

●      インストラクターによる学習は、ラベル付けされたデータを使ってモデルを学習(または指導)させ、結果を正確に予測します。ラベル付けされたデータを使用して、モデルは時間の経過とともに学習し、予測とパフォーマンスを向上させます。

●      インストラクターのいない学習は、人間の介入なしに(unsupervised)データの分析、クラスタリング、パターンの発見、ラベル付けを行う一連の技術を使用します。

●      セミ・インストラクター付き学習はラベル付けされたデータとラベル付けされていないデータの両方を使用します。一般的には、少量のラベル付きデータと大量のラベルなしデータを使用します。音声解析やテキスト文書には大量のラベル無しデータ、音声ファイル、書籍、スクリプト、ブログなどがあり、これらを全て手作業でラベル付けするのは時間とコストがかかります。半教師付き学習は、少数のラベル付きデータがあれば、関連する特徴を抽出することができます。

●      強化学習は機械学習の一種で、システムが試行錯誤を繰り返しながら学習し、各決定ステップの後にその戦略を適応させるフィードバックループを利用するものです。アルゴリズムの目標は、報酬を最大化するバランスの取れた解を見つけることである。強化学習は、ゲームアプリでよく使われています。

機械学習とサイバーセキュリティ

次世代の高度なサイバーセキュリティ・ソリューションは、様々なタスクにMLを使用しています。いくつかの例を挙げます。

●      ファイルをマルウェアとクリーンなファイルに分類します。

●      フィッシングメールやスパムメールの識別をします。

●      時間帯とユーザーの所在地を分析・比較することにより、ユーザーがシステムにログオンした際の異常を特定します。例えば、あるユーザーが通常午前8時から午後5時の間にニューヨークからログオンしている場合、このユーザーIDが午前2時に中国からログオンしていることがシステムで確認できれば、これは攻撃である可能性があります。

MLは、このようなタスクに集中することで、大量のデータを大規模に素早く分析し、異常や潜在的な攻撃を人間よりも早く特定できるため、データセキュリティを大幅に向上させることができます。このスピードは、攻撃をより早く阻止するのに役立ち、攻撃が起こってから企業が攻撃に気づくまでの時間を短縮することができます。

機械知能(マシンインテリジェンス:MI)とは?

Acronis
機械学習、機械知能、人工知能の比較イメージ

機械知能(MI)はMLのスーパーセットであり、比較的新しい用語です。MIは、まだ定義されていない複数の入力と環境からより多く対話し、学習し、古典的なフィードバックループや回帰テスト(失敗から学習する)を使って新しい入力を処理し適応させることができます。

フォーブスによると、機械知能とは「学習、問題解決、優先順位付けなど、人間の知能の一部(すべてではない)を機械にプログラムしたときに生まれるもの」だと言います。

「機械知能は、さまざまな機械学習の手法と自動化技術のバッテリーを備えており、特定のビジネス目標を達成するために、適切な順序とタイミングで、一連の手法に賢く優先順位を付けて展開します。機械知能は、優先順位付けと目標が追加された機械学習の上位進化、つまり真のAIへの道のりの足がかりと考えることができます。」    出典は フォーブス (2019年) 「機械知能とは一体何なのか?」                                                              

例えば、あるシステムは、複数の機械学習アルゴリズムを持つことができます。

●   あるアルゴリズムは、各メールに含まれるテキストに基づいてメールを分類します。

●  別のアルゴリズムでは、メールに含まれるあらゆるURLを検出し、悪意のあるリンクを探します。

●  3つ目のアルゴリズムは、画像認識を用いてメールに含まれるあらゆる画像を分析します。

それぞれ単独でもMLですが、正しい順序で組み合わされ、優先的に動作するようになると、機械知能が実現します。

Acronis Cyber Protect Cloudの高度なセキュリティ

Acronis Cyber Protect Cloudは、サイバーセキュリティ、データ保護、管理をネイティブに統合し、エンドポイント、システム、データを保護する、マシンインテリジェンスによって強化された唯一のソリューションです。この相乗効果により複雑さが解消されるため、サービスプロバイダはコストを抑えながら顧客をよりよく保護することができます。以下を提供します。

●      フルイメージとファイルレベルのバックアップとリカバリにより、20以上のプラットフォーム上のワークロードをほぼゼロのRPOとRTOで保護する業界最高水準のバックアップとリカバリができます。

●      クライアントのエンドポイントやシステムに対するマルウェア、ランサムウェア、ゼロデイ攻撃を阻止する高度なMIベースの行動検出エンジンによる本質的なサイバー保護が追加コストなしで実現します。

●      MSPのために構築された保護管理により、インシデント発生後の徹底的な調査と適切な修復を可能にし、デジタル証拠を収集して安全な中央リポジトリに保存することでコストを抑制します。

Advanced Security packは、Acronis Cyber Protect Cloudのアドオンで、MSPが提供するセキュリティを以下のように拡張することが可能です。

●      複数の防御レイヤーですべての攻撃ベクトルをカバーするフルスタック、リアルタイムのマルウェア対策。

●      悪意のあるURL、Webベースの攻撃、およびCOVID-19詐欺をブロックするURLフィルタリング。

●      行動ベースの検出ヒューリスティックを使用したエクスプロイト防止機能により、メモリーエクスプロイトやインジェクションなど、未知の脆弱性の悪用を防止します。

●      Acronis Cloudにあるデータのマルウェア対策スキャンにより、クライアントエンドポイントへの影響をオフロードし、より積極的なスキャンを可能にし、マルウェアのないバックアップを保証します。

●      バックアップ内のフォレンジックデータにより、デジタル証拠を迅速に収集し、修復コストを削減します。

●      CPOC脅威フィードにより、新たな脅威への反応性を高め、改善提案を得ることができます。

●      自動許可リスト作成機能により、誤検知を減らし、より積極的なスキャンを可能にします。

●      マルウェアの再感染防止機能:復元中にマルウェアをスキャンし、AVの定義を更新して脅威の再発を防止します。

Acronis Cyber Protect Cloud with Advanced Securityにより、サービスプロバイダは管理負担を軽減しながら、より多くのサイバーセキュリティサービスを顧客に提供することができます。非統合型のアンチウイルスツールを、データ保護と統合された完全なエンドポイントセキュリティに置き換えることができます。

※このblogはAcronis.comの2021年6月24日付What is marchine learning - Definition and Importanceの抄訳です。

アクロニスのその他の情報