Qu'est-ce que l'apprentissage automatique ? Le guide ultime par Acronis

Acronis Cyber Protect Cloud
pour les fournisseurs de services

De nombreuses personnes ne comprennent pas la différence entre des concepts tels que l'intelligence artificielle (IA), l'apprentissage automatique (ML pour Machine Learning en anglais) et d'autres termes utilisés en matière d'informatique de pointe. Si vous cherchez des éclaircissements et souhaitez apprendre pourquoi et comment ces technologies sont utilisées dans les solutions de cybersécurité modernes, cet article vous éclairera sur ces points :

  • La définition de l'apprentissage automatique
  • Qui utilise le machine learning et pourquoi ?
  • Comment fonctionne l'apprentissage automatique
  • La différence entre l'intelligence artificielle et l'apprentissage automatique
  • Les avantages du machine learning et son importance
  • L'apprentissage automatique et la cybersécurité
  • La définition de l'intelligence artificielle
  • Acronis Cyber Protect Cloud: Advanced Security Pack

Quelle est la définition du Machine Learning ? (ML) 

L'apprentissage automatique (ML pour Machine Learning en anglais) est un type d'Intelligence Artificielle (IA) qui peut apprendre à partir de données. Sans fournir d'instructions spécifiques à un système, le ML peut déterminer des modèles, faire des évaluations et réapprendre continuellement pour améliorer sa précision et ses performances en utilisant des données étiquetées, des algorithmes et des modèles statistiques. Les données - qu'il s'agisse de fichiers texte, d'images, de vidéos, etc. - sont étiquetées en ajoutant des balises informatives qui identifient le contexte afin que les algorithmes ML puissent en tirer des enseignements.

Le ML développe des connaissances et une expertise mais est limité dans son application. Par exemple, si vous entraînez un modèle à reconnaître les chats et les chiens, le ML ne peut pas apprendre à faire cuire un gâteau car cette tâche est trop différente de son champ de connaissances.    

Acronis
Qu'est-ce que l'apprentissage automatique ?

Qui utilise l'apprentissage automatique et pourquoi ?

Le ML utilise une variété d'algorithmes pour prendre des décisions, prédire des résultats, regrouper les résultats et détecter des anomalies. Les clusters de données sont des groupes de données qui présentent des caractéristiques similaires qui ne sont pas présentes dans d'autres clusters de données. La détection des anomalies permet d'identifier les données atypiques, c'est-à-dire celles qui sont différentes des données identifiées dans un cluster donné. 

Par exemple, un modèle d'apprentissage automatique analysera des images de chiens et de chats et créera deux clusters - un pour les chiens et un pour les chats. Si le modèle analyse l'image d'un oiseau, il détectera que cette image est une anomalie.

Il existe d'innombrables utilisations du Machine Learning dans tous les secteurs d'activité, notamment les services financiers, les assurances, les services de santé, la vente au détail, l'administration, l'armée, l'agriculture, etc. Vous rencontrez de nombreux exemples d'apprentissage automatique dans la vie quotidienne. Voici quelques exemples de l'utilisation de Machine Learning aujourd'hui :

  • Lorsque vous tapez du texte sur votre téléphone portable ou dans Microsoft Word, le Machine Learning est utilisé pour recommander des mots afin de réduire la saisie manuelle et les erreurs de frappe.
  • Les moteurs de recherche utilisent le ML pour faire des suggestions lorsque vous recherchez des informations spécifiques ou un site bien précis.
  • Les filtres de courrier électronique utilisent l'apprentissage automatique pour identifier le courrier indésirable.
  • Les applications bancaires utilisent le ML pour identifier les transactions frauduleuses et évaluer la solvabilité d'une personne.
  • Les organismes d'assurance utilisent la technologie ML pour identifier les fraudes en matière de sinistres et pour prédire le montant des bonus et des malus pour leurs contrats.
  • Dans le domaine de la santé, le Machine Learning est utilisé pour le séquençage de l'ADN, afin d'identifier les pathologies, de détecter les problèmes de santé à un stade précoce et d'améliorer la qualité des soins.
  • Dans le domaine militaire, l'apprentissage automatique est utilisé pour améliorer la précision de l'identification des cibles ainsi que pour le transport du personnel et des équipements militaires.
  • Les constructeurs automobiles utilisent l'apprentissage automatique pour la reconnaissance d'images à bord des voitures et des camions.
  • Netflix utilise le Machine Learning pour vous recommander ce que vous pourriez vouloir regarder ensuite.
  • La reconnaissance vocale utilise le ML pour identifier des modèles et affiner la reconnaissance vocale d'un individu.

Comment fonctionne l'apprentissage automatique ?

La ML peut fonctionner de nombreuses façons. Voici l'un des exemples les plus simples de ML en action.

Étape 0 : L'entreprise doit étiqueter et classer les données. La classification des données est le résultat de l'extraction de caractéristiques à partir des étiquettes des données et de l'organisation des données par type de fichier, contenu et autres métadonnées.  Par exemple, les données peuvent être classées par service, utilisateur, niveaux de confidentialité, etc. Ces types de tâches sont accomplis en utilisant des modèles d'apprentissage automatique supervisés qui sont formés sur des données étiquetées. 

Étape 1 : Utiliser les données classées pour construire le modèle avec un ensemble de données d'entraînement.

Acronis
Ensemble de tests pour l'apprentissage automatique et son fonctionnement

Étape 2 : Cette étape est liée à l'étape 1. Le modèle utilise l'ensemble de données d'apprentissage pour apprendre. Il s'agit d'un processus itératif qui comprend une boucle de rétroaction ou une fonction d'erreur si quelque chose n'est pas correctement classé et l'erreur renvoie alors à l'étape 1 pour une reclassification. Pour ce faire, l'apprentissage automatique développe un arbre de décision binaire, qui est une structure basée sur un processus de décision séquentiel. En partant de la racine, le modèle évalue une caractéristique et sélectionne l'une des deux branches. Cette procédure est répétée jusqu'à ce qu'une feuille finale soit atteinte.  

Acronis
Arbre de décision binaire de l'apprentissage automatique

Étape 3 :  Les nouvelles données classifiées sont maintenant introduites dans le modèle pour un réentraînement afin d'améliorer les performances et de contrôler la fiabilité. À ce stade, le modèle identifiera le pourcentage de résultats faussement positifs. C'est à l'entreprise de décider quel pourcentage de faux positifs est acceptable. Si le pourcentage de faux positifs est inacceptable, le système doit être alimenté avec davantage de données ou extraire davantage de caractéristiques des données pour réentraîner le modèle afin d'atteindre un taux de faux positifs acceptable.

Étape 4 : Si nécessaire, l'apprentissage automatique peut compacter ou optimiser le modèle généré en fonction de l'algorithme utilisé. Par exemple, il peut combiner plusieurs étapes ou effectuer un traitement parallèle. 

Quelle est la différence entre l'intelligence artificielle et l'apprentissage automatique ?

Acronis
L'intelligence artificielle

L'IA (abrégé AI en anglais pour Artificial Intelligence) est le domaine de la science qui utilise une machine pour imiter l'intelligence humaine. La véritable IA ne consiste pas seulement à ce qu'une machine ait des connaissances, mais aussi à ce qu'elle sache comment appliquer ces connaissances en utilisant un raisonnement et une logique déductive. Il existe trois sous-ensembles d'IA :

  • L'IA étroite signifie que la machine est capable de faire une seule chose, par exemple jouer aux échecs.
  • L'IA générale signifie que la machine est douée pour certaines choses mais ne constitue pas un être doté de facultés cognitives.
  • La super IA peut à la fois apprendre, définir ses propres problèmes, poursuivre son apprentissage et avoir une conscience de soi. Skynet, l'esprit de groupe conscient fictif basé sur un réseau neuronal artificiel et le système de superintelligence générale artificielle de la série Terminator, est un exemple de super IA.

Heureusement, ou malheureusement, nous n'avons réussi à développer qu'une IA étroite.

Alors que l'objectif de l'IA est de créer des machines intelligentes capables de simuler la pensée humaine, le Machine Learning est un sous-ensemble de l'IA qui permet aux machines d'apprendre par elles-mêmes en utilisant des données sans être spécifiquement programmées pour cela.

Quels sont les avantages des technologies d'apprentissage automatique et pourquoi sont-elles importantes ?

Les avantages du Machine Learning sont considérables, notamment pour :

  • Son efficacité pour l'analyse de grands ensembles de données. Le Machine Learning peut travailler rapidement avec des ensembles de données extrêmement volumineux, ce que l'esprit humain est incapable de faire.
  • Identifier rapidement les anomalies et les valeurs atypiques. L'apprentissage automatique est plus efficace pour détecter les anomalies et les valeurs atypiques, car il ne cherche pas un élément spécifique, comme le fait l'esprit humain, mais ce qui ne devrait pas se trouver là. 
  • Identifier rapidement les tendances et les schémas. Le Machine Learning peut identifier des tendances et des modèles que les humains ne peuvent pas identifier, ce qui fait du ML une bonne application pour l'exploration des données.
  • Améliorer continuellement les résultats. L'apprentissage automatique ne produit pas de résultats statiques mais améliore continuellement ses modèles et ses résultats grâce à un réentraînement continu.
  • Automatiser la prise de décision. Avec son apprentissage continu pour améliorer ses performances, l'apprentissage automatique est doué pour automatiser rapidement les prises de décision. Par exemple, il peut analyser votre comportement en ligne et vous recommander des sites web, des produits ou des services appropriés. Le Machine Learning est un composant particulièrement important pour améliorer l'expérience client (CX en anglais pour Customer experience).

Les méthodes populaires d'apprentissage automatique

Dans le domaine du Machine Learning, il existe différents types d'apprentissage :

  • L'apprentissage supervisé utilise des données étiquetées pour former (ou superviser) le modèle et prédire avec précision les résultats. En utilisant des données étiquetées, le modèle réapprend au fil du temps pour améliorer ses prédictions et ses performances.
  • L'apprentissage non supervisé utilise une famille de techniques pour analyser, regrouper, découvrir des modèles et étiqueter des données sans intervention humaine (non supervisé). 
  • L'apprentissage semi-supervisé utilise à la fois des données étiquetées et non étiquetées. Typiquement, il utilise une petite quantité de données étiquetées et de grands ensembles de données non étiquetées. L'analyse vocale et les textes ont tous deux un grand volume de données non étiquetées - fichiers audio, livres, scripts, blogs, etc. -L'étiquetage manuel de toutes ces données peut être long et coûteux. Avec seulement un petit volume de données étiquetées, l'apprentissage semi-supervisé peut extraire les caractéristiques pertinentes.
  • L'apprentissage par renforcement est une sorte d'apprentissage automatique qui permet à un système d'apprendre par expérimentation et erreurs - en utilisant une boucle de rétroaction - pour adapter sa stratégie après chaque étape de décision. L'objectif de l'algorithme est de trouver une solution équilibrée qui maximisera ses récompenses. L'apprentissage par renforcement est souvent utilisé dans les applications de jeu.

L'apprentissage automatique et la cybersécurité

Les solutions de cybersécurité de pointe de nouvelle génération utilisent le ML pour une multitude de tâches. Quelques exemples :

  • Classification des fichiers en deux catégories : les fichiers malveillants et les fichiers sains.
  • Identification des courriels de phishing et de spam
  • Identifier les anomalies lorsqu'un utilisateur se connecte à un système en analysant et en comparant l'heure de la journée et la localisation de l'utilisateur. Par exemple, si un utilisateur se connecte habituellement entre 8 et 17 heures depuis New York et que le système constate que cet identifiant se connecte à 2 heures du matin depuis la Chine, il peut s'agir d'une attaque. 

En se concentrant sur des tâches telles que celles-ci, le ML peut améliorer considérablement la sécurité des données, car il peut analyser rapidement de grandes quantités de données à grande échelle et identifier les anomalies et les attaques potentielles plus rapidement que les humains. Cette vitesse permet de stopper les attaques plus rapidement et peut donc réduire le délai entre le moment où une attaque se produit et celui où une entreprise s'en rend compte.

Dans ce cas, qu'est-ce que l'intelligence artificielle ?

Acronis
Image qui montre la comparaison entre l'apprentissage automatique, l'intelligence machine et l'intelligence artificielle.

L'intelligence artificielle est un sur-ensemble du Machine Learning et est un terme relativement nouveau. L'intelligence artificielle interagit et apprend davantage à partir de multiples entrées - qui ne sont pas encore définies - et de l'environnement, et peut traiter et adapter de nouvelles entrées en utilisant une boucle de rétroaction classique ou des tests de régression (où elle apprend de ses erreurs). 

Selon Forbes, l'intelligence machine est "ce qui est créé lorsque les machines sont programmées avec certains (mais pas tous) aspects de l'intelligence humaine, y compris l'apprentissage, la résolution de problèmes et l'établissement de priorités".

"L'intelligence artificielle bénéficiera d'une suite de différentes méthodes d'apprentissage automatique, ainsi que d'une batterie de techniques d'automatisation, et établira intelligemment des priorités et mettra en œuvre une séquence de ces méthodes dans le bon ordre et au bon moment pour atteindre des objectifs professionnels spécifiques. On peut considérer l'intelligence artificielle comme une évolution avancée de l'apprentissage automatique à laquelle s'ajoutent la hiérarchisation et les objectifs - un tremplin vers la véritable IA."                                    Source: Forbes. (2019) What exactly is machine intelligence?

Par exemple, un système peut être doté de plusieurs algorithmes d'apprentissage automatique :

  • Un algorithme classe les courriels en fonction du texte qu'ils contiennent.
  • Un autre algorithme détecte toutes les URL contenues dans les emails et recherche les liens malveillants.
  • Un troisième algorithme analyse toutes les images contenues dans les courriers électroniques en utilisant la reconnaissance d'images.  

Indépendamment, chacun de ces éléments est de l'apprentissage automatique, mais lorsqu'ils sont regroupés et hiérarchisés pour fonctionner ensemble dans le bon ordre, on obtient une intelligence artificielle.

Acronis Cyber Protect Cloud - une sécurité évoluée

Acronis Cyber Protect Cloud est la seule solution enrichie par l'intelligence artificielle qui intègre nativement la cybersécurité, la protection et la gestion des données pour protéger les terminaux, les systèmes et les données. Cette synergie permet de limiter la complexité, afin que les fournisseurs de services puissent mieux protéger leurs clients tout en réduisant leurs coûts.  Cette solution inclut  :

  • La meilleure sauvegarde et restauration du secteur avec une sauvegarde et une restauration par image complète et par fichier pour protéger les charges de travail sur plus de 20 plateformes - avec des RPO et RTO proches de zéro.
  • Une cyberprotection essentielle sans coût supplémentaire avec un moteur de détection comportementale avancé basé sur l'IA qui bloque les logiciels malveillants, les ransomwares et les attaques de type "zero-day" sur les terminaux et systèmes de vos clients.
  • La gestion de la protection, conçue pour les MSP, permet de mener des enquêtes approfondies après un incident et de prendre des mesures correctives appropriées, tout en limitant les coûts grâce à la collecte de preuves numériques et à leur stockage dans un référentiel central sécurisé.

Le pack Advanced Security est un module complémentaire d'Acronis Cyber Protect Cloud qui permet aux MSP de compléter leur offre de sécurité avec :

  • Une protection anti-programmes malveillants complète et en temps réel couvrant tous les vecteurs d'attaque avec plusieurs couches de défense.
  • Le filtrage des URL pour bloquer les URL malveillants, les attaques en ligne et les escroqueries liées au COVID-19.
  • La protection contre l'exploitation des vulnérabilités à l'aide d'une heuristique de détection basée sur le comportement afin d'empêcher l'exploitation de vulnérabilités inconnues, y compris les injections et les attaques visant la mémoire.
  • Les analyses anti-programmes malveillants des données dans Acronis Cloud pour soulager l'impact sur les terminaux des clients, permettre des analyses plus agressives et garantir des sauvegardes sans programmes malveillants.
  • Les données à caractère juridique dans les sauvegardes afin de recueillir des preuves numériques plus rapidement et de réduire le coût de la remise en état.
  • Les flux de menaces CPOC pour améliorer la réactivité aux menaces émergentes et obtenir des suggestions de remédiation.
  • Une liste automatique d'autorisations pour réduire les faux positifs et permettre une analyse plus agressive.
  • La prévention de la réinfection par des logiciels malveillants, qui recherche les logiciels malveillants et met à jour les définitions antivirus pendant la restauration pour éviter qu'une menace ne se répète.

Acronis Cyber Protect Cloud associé à Advanced Security permet aux fournisseurs de services d'offrir davantage de services de cybersécurité à leurs clients tout en allégeant les tâches de gestion, en remplaçant les outils antivirus non intégrés par une sécurité complète des terminaux, intégrée à la protection des données.

Plus de contenu Acronis