June 24, 2021 — Acronis

Qué es el aprendizaje automático? - Definición e importancia

Cyber Protect Cloud

Muchas personas no comprenden la diferencia entre términos como Inteligencia Artificial (AI, por sus siglas en inglés), Aprendizaje Automático (ML, por sus siglas en inglés) y otros conceptos informáticos avanzados. Si busca una aclaración y quiere saber por qué y cómo se utilizan estas tecnologías en las soluciones modernas de seguridad cibernética, este artículo cubrirá:

  • La definición de aprendizaje automático
  • Quién usa el aprendizaje automático y por qué
  • Cómo funciona el aprendizaje automático
  • La diferencia entre inteligencia artificial y aprendizaje automático
  • Ventajas del aprendizaje automático y por qué es importante
  • Aprendizaje automático y seguridad cibernética
  • La definición de Inteligencia de Máquina (MI, por sus siglas en inglés)
  • Acronis Cyber Protect Cloud: Paquete de Seguridad Avanzada

Cuál es la definición de Aprendizaje Automático (ML, por sus siglas en inglés)? 

El aprendizaje automático es un tipo de Inteligencia Artificial (AI, por sus siglas en inglés) que puede aprender de los datos. Sin proporcionar un sistema con instrucciones específicas, el ML puede determinar patrones, realizar evaluaciones y volver a aprender continuamente para mejorar la precisión y el rendimiento del modelo utilizando datos etiquetados, algoritmos y modelos estadísticos. Los datos, ya sean archivos de texto, imágenes, videos, etc., se etiquetan agregando etiquetas informativas que identifican el contexto para que los algoritmos de aprendizaje automático puedan aprender de ellos. 

El ML desarrolla conocimientos y experiencia, pero está limitado en la forma en que se aplica. Por ejemplo, si entrena a un modelo para reconocer gatos y perros, el ML no puede aprender a hornear un pastel porque esa tarea es demasiado diferente de su campo de conocimiento.   

Acronis
What is Machine Learning?

Quién usa el aprendizaje automático y por qué?

El ML utiliza una variedad de algoritmos para tomar decisiones, predecir resultados, agrupar los resultados y detectar anomalías. Los grupos de datos son conjuntos de datos que tienen características similares que no están presentes en otros grupos de datos. La detección de anomalías identifica los datos que son valores atípicos, es decir, que son diferentes de los datos identificados en un clúster determinado. 

Por ejemplo, un modelo de ML analizará imágenes de perros y gatos y creará dos grupos: uno para perros y otro para gatos. Si los modelos analizan una imagen de un pájaro, detectarán que esta imagen es una anomalía.

Existen innumerables usos para el ML en todas las industrias, incluidos los servicios financieros, los seguros, la atención médica, el comercio minorista, el gobierno, el ejército, la agricultura, etc. Experimenta muchos ejemplos de ML en la vida cotidiana. Algunos ejemplos de cómo se usa el ML en la actualidad incluyen:

  • Al escribir texto en su teléfono móvil o en Microsoft Word, el ML se utiliza para recomendar palabras para reducir la escritura manual y los errores de escritura.
  • Los motores de búsqueda usan el ML para hacer sugerencias cuando busca información específica o un sitio específico.
  • Los filtros de correo electrónico utilizan ML para identificar los correos no deseados.
  • Las aplicaciones bancarias utilizan el ML para identificar transacciones fraudulentas y evaluar la capacidad crediticia de un individuo.
  • Las organizaciones de seguros usan el ML para identificar fraudes en reclamos y predecir primas y pérdidas para sus pólizas.
  • En el cuidado de la salud, el ML se utiliza para la secuenciación del ADN, para identificar patrones de enfermedades, detectar problemas de salud en etapa temprana y mejorar la calidad de la atención.
  • En el ejército, el ML se utiliza para mejorar la precisión de la identificación de objetivos y el transporte de personal y equipo militar.
  • Los fabricantes de automóviles utilizan el ML para el reconocimiento de imágenes en automóviles y camiones.
  • Netflix usa el ML para recomendar lo que es posible que desee ver a continuación.
  • El reconocimiento de voz utiliza el ML para identificar patrones y afinar el reconocimiento del habla de un individuo.

Cómo funciona el aprendizaje automático?

Hay muchas formas en que el ML puede funcionar. Este es uno de los ejemplos más simples del ML en acción.

Paso 0: la empresa debe etiquetar y clasificar los datos. La clasificación de datos es el resultado de extraer características de las etiquetas de datos y organizar los datos por tipo de archivo, contenido y otros metadatos. Por ejemplo, los datos se pueden clasificar por departamento, usuario, niveles de confidencialidad, etc. Estos tipos de tareas se logran mediante el uso de modelos de ML supervisados que se entrenan en datos etiquetados. 

Paso 1: use los datos clasificados para construir el modelo con el conjunto de datos de entrenamiento.  

Acronis
Training set of machine learning and how does it work

Paso 2: este paso está entrelazado con el paso 1. El modelo usa el conjunto de datos de entrenamiento para aprender. Es un proceso iterativo e incluye un ciclo de retroalimentación o una función de error, si algo no está clasificado correctamente y el error vuelve al Paso 1 para su reclasificación. Para este proceso, el ML desarrolla un árbol de decisión binario, que es una estructura basada en un proceso de decisión secuencial. Comenzando desde la raíz, el modelo evalúa una característica y selecciona una de las dos ramas. Este procedimiento se repite hasta alcanzar una hoja final. 

Acronis
Binary decision tree of machine learning

Paso 3:  los nuevos datos clasificados ahora se introducen en el modelo para reentrenamiento a fin de mejorar el rendimiento y verificar la precisión. En este punto, el modelo identificará el porcentaje de resultados falsos positivos. Depende de la empresa decidir qué porcentaje de falsos positivos es aceptable. Si el porcentaje de falsos positivos es inaceptable, el sistema debe recibir más datos o extraer más características de los datos para volver a entrenar el modelo para que cumpla con el nivel aceptable de falsos positivos.

Paso 4: opcionalmente, el ML puede compactar u optimizar el modelo generado según el algoritmo utilizado. Por ejemplo, puede combinar varios pasos o realizar un procesamiento en paralelo. 

Cuál es la diferencia entre inteligencia artificial y aprendizaje automático?

Acronis
Machine Intelligence

La inteligencia artificial es el campo de la ciencia que utiliza una máquina para imitar la inteligencia humana. La verdadera AI no se trata solo de que una máquina tenga conocimiento, sino también de que la máquina sepa cómo aplicar ese conocimiento utilizando el razonamiento y la lógica deductiva. Hay tres subconjuntos de AI:

  • La AI estrecha significa que la máquina es buena para hacer una cosa, como jugar al ajedrez.
  • La AI general significa que la máquina es buena en algunas cosas, pero no es un ser cognitivo.
  • La súper AI puede aprender, definir sus propios problemas, aprender más y tiene un sentido de autoconciencia. Skynet, la mente de grupo consciente basada en una red neuronal artificial ficticia y el sistema de superinteligencia artificial general de la serie Terminator, son ejemplos de súper AI.

Afortunadamente, o desafortunadamente, solo hemos logrado una AI limitada.

Si bien el objetivo de la AI es crear máquinas inteligentes que puedan simular el pensamiento humano, el ML es un subconjunto de la AI que permite que las máquinas aprendan por sí mismas utilizando datos sin estar programadas específicamente.

Ventajas de las tecnologías de aprendizaje automático y por qué es importante

El aprendizaje automático tiene importantes beneficios que incluyen:

  • Bueno para analizar grandes conjuntos de datos. El ML puede funcionar rápidamente con conjuntos de datos extremadamente grandes, algo que la mente humana es incapaz de hacer. 
  • Identifica rápidamente anomalías y valores atípicos. El ML es mejor para detectar anomalías y valores atípicos porque no busca una cosa específica, como lo hace la mente humana, sino lo que no debería estar allí. 
  • Identifica rápidamente tendencias y patrones. El ML puede identificar tendencias y patrones que los humanos no pueden identificar, lo que hace que el ML sea una buena aplicación para la minería de datos.
  • Mejora continuamente los resultados. El ML no produce resultados estáticos, pero mejora continuamente sus modelos y resultados con un reentrenamiento continuo.
  • Automatiza la toma de decisiones. Con su reentrenamiento continuo para mejorar el rendimiento, el ML es bueno para automatizar decisiones rápidamente. Por ejemplo, el ML puede analizar su comportamiento en línea y recomendar sitios web, productos o servicios adecuados que desee. El ML es un componente especialmente importante para mejorar la Experiencia del Cliente (CX, por sus siglas en inglés).

Métodos populares de aprendizaje automático

Dentro del campo del ML, existen diferentes tipos de aprendizaje:

  • El aprendizaje supervisado utiliza datos etiquetados para entrenar (o supervisar) el modelo y predecir los resultados con precisión. Con datos etiquetados, el modelo vuelve a aprender con el tiempo para mejorar las predicciones y el rendimiento.
  • El aprendizaje no supervisado utiliza una familia de técnicas para analizar, agrupar, descubrir patrones y etiquetar datos sin intervención humana (sin supervisión). 
  • El aprendizaje semisupervisado utiliza datos etiquetados y no etiquetados. Por lo general, utiliza una pequeña cantidad de datos etiquetados y grandes conjuntos de datos sin etiquetar. Tanto el análisis de voz como los documentos de texto tienen un gran volumen de datos sin etiquetar (archivos de audio, libros, guiones, blogs, etc.), todos los cuales pueden llevar mucho tiempo y ser costosos de etiquetar manualmente. Con solo un pequeño volumen de datos etiquetados, el aprendizaje semisupervisado puede extraer las características relevantes.
  • El aprendizaje por refuerzo es un tipo de aprendizaje automático que permite que un sistema aprenda por ensayo y error, utilizando un ciclo de retroalimentación, para adaptar su estrategia después de cada paso de decisión. El objetivo del algoritmo es encontrar una solución equilibrada que maximice sus recompensas. El aprendizaje por refuerzo se usa a menudo en aplicaciones de juegos.

Aprendizaje automático y seguridad cibernética

Las soluciones de seguridad cibernética avanzadas de próxima generación utilizan el ML para una variedad de tareas. Algunos ejemplos incluyen:

  • Clasificación de archivos en malware y archivos limpios
  • Identificación de correos electrónicos de phishing y spam
  • Identificación de anomalías cuando un usuario inicia sesión en un sistema mediante el análisis y la comparación de la hora del día y la ubicación de los usuarios. Por ejemplo, si un usuario normalmente inicia sesión entre las 8 a.m. y las 5 p.m. desde Nueva York y el sistema ve que este ID de usuario inicia sesión a las 2 a.m. desde China, esto podría ser un ataque.

Al centrarse en tareas como estas, el ML puede mejorar significativamente la seguridad de los datos porque puede analizar rápidamente grandes cantidades de datos a escala e identificar anomalías y posibles ataques más rápido que los humanos. Esta velocidad ayuda a detener los ataques más rápido y puede reducir el tiempo entre el momento en que ocurre un ataque y el momento en que una empresa se da cuenta de que ha ocurrido un ataque.

Entonces, qué es la Inteligencia de Máquina?

Acronis
Image that shows comparison between machine learning, machine intelligence, and artificial intelligence

La Inteligencia de Máquina (MI, por sus siglas en inglés) es un superconjunto de ML y es un término relativamente nuevo. La MI interactúa y aprende más de múltiples entradas, que aún no están definidas, y del entorno, y puede procesar y adaptar nuevas entradas utilizando el ciclo de retroalimentación clásico o las pruebas de regresión (donde aprende de sus errores). 

Según Forbes, la inteligencia de máquina es “lo que se crea cuando las máquinas se programan con algunos (pero no todos) aspectos de la inteligencia humana, incluido el aprendizaje, la resolución de problemas y la priorización.

“La inteligencia de máquina tendrá un conjunto de diferentes métodos de aprendizaje automático disponibles, así como un conjunto de técnicas de automatización, y priorizará e implementará inteligentemente una secuencia de ellas en el orden correcto, en el momento adecuado para lograr objetivos comerciales específicos. Puede pensar en la inteligencia artificial como una evolución superior del aprendizaje de máquina con priorización y objetivos agregados: un trampolín en el camino hacia la verdadera AI".                                    Fuente: Forbes. (2019) ¿Qué es exactamente la inteligencia de máquina?

Por ejemplo, un sistema puede tener varios algoritmos de aprendizaje automático:

  • Un algoritmo clasifica los correos electrónicos en función del texto contenido en cada correo electrónico.
  • Otro algoritmo detecta cualquier URL dentro del correo electrónico y busca enlaces maliciosos.
  • Un tercer algoritmo analiza las imágenes contenidas en el correo electrónico mediante el reconocimiento de imágenes. .

Independientemente, cada uno de estos es ML, pero cuando se ensambla y prioriza para trabajar juntos en el orden correcto, se obtiene la inteligencia de máquina.

Acronis Cyber Protect Cloud: Paquete de Seguridad Avanzada

Acronis Cyber Protect Cloud es la única solución mejorada por la inteligencia de la máquina que integra de forma nativa la seguridad cibernética, la protección de datos y la gestión para proteger los puntos finales, sistemas y datos. Esta sinergia elimina la complejidad, por lo que los proveedores de servicios pueden proteger mejor a los clientes mientras mantienen bajos los costos. Proporciona:

  • La mejor copia de seguridad y recuperación de la industria con copia de seguridad y recuperación de imagen completa y a nivel de archivo para proteger las cargas de trabajo en más de 20 plataformas, con RPO y RTO casi nulos.
  • Protección cibernética esencial sin costo adicional con un motor avanzado de detección de comportamiento basado en MI que detiene el malware, el ransomware y los ataques de día cero en los puntos finales y sistemas de su cliente.
  • Gestión de protección creada para los MSP para permitir investigaciones exhaustivas posteriores al incidente y la corrección adecuada, al tiempo que mantiene bajos los costos mediante la recopilación de pruebas digitales y su almacenamiento en un repositorio central seguro.

El Paquete de Seguridad Avanzada es un complemento de Acronis Cyber Protect Cloud que permite a los MSP ampliar su oferta de seguridad con:

  • Protección antimalware de pila completa en tiempo real que cubre todos los vectores de ataque con múltiples capas de defensa
  • Filtrado de URL para bloquear URL maliciosas, ataques basados en web y estafas de COVID-19
  • Prevención de vulnerabilidades mediante heurísticas de detección basadas en el comportamiento para evitar la explotación de vulnerabilidades desconocidas, incluidas las vulnerabilidades y las inyecciones de memoria
  • Análisis antimalware de datos en Acronis Cloud para descargar el impacto en los puntos finales del cliente, permitir análisis más agresivos y garantizar copias de seguridad libres de malware
  • Datos forenses en copias de seguridad para recopilar evidencia digital más rápido y reducir el costo de reparación
  • Alimentación de amenazas de CPOC para aumentar la reactividad ante amenazas emergentes y obtener sugerencias de remediación
  • Listado de permisos automático para reducir los falsos positivos y permitir un análisis más agresivo
  • Prevención de reinfección de malware que busca malware y actualiza las definiciones de AV durante la recuperación para evitar que vuelva a ocurrir una amenaza

Acronis Cyber Protect Cloud con Seguridad Avanzada permite a los proveedores de servicios ofrecer más servicios de seguridad cibernética a los clientes, al tiempo que reduce la carga de administración, reemplazando las herramientas antivirus no integradas con seguridad completa para puntos finales que está integrada con la protección de datos.