Machine Learning: ¿Qué es y por qué importa?

Machine Learning: ¿Qué es y por qué importa?

Es un método de análisis de datos  que le permite a las computadoras aprender por sí solas sin que se les indique explícitamente qué hacer. Las computadoras buscan iterativamente aprender a partir de un set de datos sin que un humano le indique dónde buscar.

El Machine Learning como tal, existe desde los 50s como un sub-campo de la Inteligencia Artificial pero empezó a convertirse en un término popular por sí mismo en la década de los 90 y es muy popular en la actualidad debido a la explosión de datos del Big Data y el abaratamiento del procesamiento de los mismos.

Las personas que trabajan con Machine Learning se dedican a generar algoritmos que puedan aprender de un set de datos y hacer predicciones sobre los mismos. Actualmente sus técnicas son usadas por investigadores, ingenieros, científicos de datos, estadísticos y analistas. La variedad de profesiones que lo utilizan dan luz sobre las capacidades requeridas en la disciplina; se usan cotidianamente  optimización matemática, programación, probabilidad y estadística.

Para ser claros, debemos indicar que a veces los términos Machine Learning y Minería de Datos se usan de forma intercambiada porque ambas disciplinas utilizan técnicas muy similares. Existe un debate respecto a las similitudes y diferencias entre ambas pero para el propósito de este post, no nos vamos a detener en esta discusión.

Los métodos más usados en Machine Learning son:

  • Aprendizaje supervisado: Al algoritmo se lo entrena con datos “etiquetados”, se conocen tanto los datos de entrada como los de salida. Esto es, el entrenador sabe cuál debería ser el resultado final y le proporciona esta respuesta a la computadora para refinar su aprendizaje, generado reglas que le permita acercarse de forma más adecuada al resultado esperado. Los algoritmos de este tipo son los más utilizados y se estima que representan el 70% del total.
  • Aprendizaje no supervisado: No se proporcionan etiquetas. El algoritmo debe aprender por sí mismo las reglas y estructuras basándose en los datos de entrada, no se le proporcionan las respuestas correctas. Se utilizan cuando no sabemos qué esperar de los datos y queremos conocer patrones o estructuras en la información que tenemos en mano.

 

Como usuarios de internet interactuamos de forma rutinaria con algoritmos de machine learning y proporcionamos diariamente información que se utiliza para entrenar y perfeccionar los modelos sin que nos demos cuenta.

Algunos de sus usos más populares son:

  • Filtrado de spam en emails: La máquina usa una algoritmo como el Naive Bayes para clasificar el correo entrante en bueno y spam.  A la máquina se la entrena para procesar los emails, eliminar palabras que no aportan valor al análisis y reconocer aquellas palabras que tienen probabilidad muy alta de ser spam. Luego aplica lo aprendido cada vez que recibe un nuevo correo electrónico.
  • Detección de fraude: Algoritmos de machine learning como clasificador lineal, redes neuronales o deep learning son utilizados individualmente o en forma conjunta  por bancos, empresas de tarjeta de crédito, PayPal entre otros, para  decidir en una fracción de segundo si a un cliente se lo clasifica como de confianza o si por el contrario se lo etiqueta como malo y la transacción como fraudulenta.
  • Búsquedas en la web: Los buscadores de Google y Microsoft tienen incorporado algoritmos de clasificación, Clustering, Querying understanding, Learning to Rank para detectar patrones en las búsquedas así como para personalizar el resultado.
  • Recomendaciones de compras: Amazon alimenta a los algoritmos con nuestro historial de compras para que traten de hacer match entre nuestros intereses y el contenido a publicitar, también usan otros algoritmos que tratan de encontraron similitudes con nosotros y otros usuarios e items para darnos las mejores recomendaciones de productos a comprar.

Otros usos populares son:

Reconocimiento Óptico de Caracteres (OCR)

Vision Artificial

El vehículo autónomo de Google

Análisis de sentimiento basado en texto.

Anuncios en tiempo real en la web y en los móviles.

Score crediticio

Predicción de falla de equipamiento

Modelos de precios.

Reconocimiento de imágenes y patrones.

 

Por último, en futuros posts vamos a ir profundizando en las técnicas más conocidas y usadas en Machine Learning:

  • Árboles de decisiones
  • Reglas de Asociación
  • Redes Neuronales
  • Deep Learning
  • Support Vector Machine
  • Clustering
  • Bayes
  • Reinforced Learning
  • Representation Learning.

One thought on “Machine Learning: ¿Qué es y por qué importa?

  1. Luis Carrión

    También tiene aplicación en el campo de la medicina, por ejemplo pronosticar o predecir si un tumor es benigno o maligno a partir de ciertas variables.

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *