La verdad sobre el uso del Machine Learning

POR: ALBERTO LUGO

El Machine Learning, llamado también aprendizaje automático, la Inteligencia Artificial y Big Data son temas que se han vuelto importantes en la labor de las principales compañías a nivel mundial, pero ¿qué significan en realidad estos términos? y ¿cómo forman parte de la vida cotidiana?.

Muchas personas relacionan los temas referidos con películas de ciencia ficción como la ya antigua “Inteligencia Artificial” de Steven Spielberg, o con la muy bien desarrollada personalidad de Jarvis en Avengers. Quizá, también entren a colación el temor a conspiraciones y las teorías planteadas por Asimov en sus libros sobre “Las máquinas y su sublevación”. No obstante, para algunos, resulta desalentador el hecho de que actualmente nos encontremos en un punto muy lejano de aquel en que las máquinas puedan alcanzar siquiera la capacidad intelectual de un niño de 4 años. A pesar de esto, los avances obtenidos por el Machine Learning, la Inteligencia Artificial y Big Data son innegables y convivimos con ellos diariamente. En el presente artículo centraremos la atención en el Machine Learning, aunque es invitable que aparezcan los términos Inteligencia Artificial y Big Data, pues están estrechamente relacionados.

Definiendo el Machine Learning y sus aplicaciones

Es pertinente aclarar que el Machine Learning es una disciplina dentro del ámbito o contexto de la Inteligencia Artificial. Se trata de un conjunto de técnicas y herramientas altamente funcionales que en teoría permitirían a las máquinas ser capaces de “aprender” automáticamente. Es decir, a partir de una retroalimentación general de sus insumos, obtener resultados que varían según el tipo de interacción que exista con éstos.

En el contexto actual, el Machine Learning se está desarrollando vertiginosamente formando parte de nuestras vidas. Sus aplicaciones son diversas, abarcando aspectos desde la seguridad bancaria, detección de fraudes y herramientas para protección de datos, hasta cosas más cotidianas, por ejemplo el método de recomendación utilizado por empresas como Youtube o Netflix, que según el histórico de búsquedas que realiza el usuario, automáticamente diseña una lista de sugerencias que potencialmente pudiese gustar al consumidor.

Allí está la base del “aprendizaje” en el Machine Learning, ocurre mediante algoritmos que detectan patrones repetitivos y segmentan la información, para que los sistemas tengan una respuesta según la petición del individuo. Cuando un usuario realiza la búsqueda de una canción en alguna plataforma que utilice Machine Learning, la misma forma parte de una categoría específica y existe información adicional relacionada con ella, tal como el género, el intérprete, la cantidad de reproducciones, la fecha de publicación o la calificación en opinión de otros usuarios, por ejemplo. Todas estas características se encuentran almacenadas en una Base de Datos, y algunas o muchas de esas particularidades musicales ciertamente coinciden con las de otras canciones. Después de una cantidad significativa de búsquedas, el sistema automáticamente elabora una lista de sugerencias para el tipo de usuario según las coincidencias que se amoldan con su perfil.

Si la persona desea ubicar una canción que se sale de los patrones comunes, la máquina inmediatamente genera un tipo de búsqueda diferente, asociando otros datos, para tener una respuesta que se ajuste nuevamente al perfil del usuario. Es allí donde la funcionalidad de este tipo de tecnología destaca. Con los análisis para películas, deportes, entretenimieto diverso y mercadeo de distintos productos, se procede de forma similar y por consiguiente esta información puede ser empleada para realizar predicciones de mucha utilidad para la empresas que desarrollen el Machine Learning.

En otro contexto un poco más complejo, el Machine Learning avanzado está siendo desarrollado para apoyar la seguridad. La protección de finanzas e información es algo sumamente importante, los mejores matemáticos e ingenieros en sistemas y computación, trabajan en conjunto para crear algoritmos que se anticipen a posibles fraudes electrónicos o al ataque de hackers. Noticias como el juicio sobre la implicación de Mark Zuckerberg por el manejo indebido de información en Facebook, no son ficción y las consecuencias pueden ser muy graves. Para la persona común, el problema pudiese ser algún manejo indebido de fondos, robos a cuentas electrónicas o hurto de información personal; mientras que en el caso de las empresas, podría representar pérdidas de millones de dólares.

Con las terribles consecuencias que los mencionados ataques pueden significar, existen empresas específicamente dedicadas a desarrollar software de protección que, basados en el Machine Learning, la Inteligencia Artificial y Big Data, son capaces de reconocer diferentes amenazas y clasificarlas según su tipo, incluso segmentar parte de la información para anticiparse a ataques de diversos tipos.

El método más común empleado por los algoritmos  del Machine Learning avanzado para este tipo de protección es el de clasificación, se aplica para Sistemas de Detección de Intrusos (IDS) que, dependiendo del nivel de programación, pueden coadyuvar en la solución de problemas como el malware, el spyware o el spoofing, entre otros. Por ejemplo, a nivel de usuario, esto puede traducirse en la prevención del phishing es decir, determinar si la identidad en un correo electrónico es legítima o si hubo suplantación de la misma.

Este tipo de aprendizaje puede ser supervisado o no. En el primer caso, ocurre cuando se tiene una idea de la búsqueda, o se desea algo en específico y se cuenta con información para identificar ciertos grupos, mientras que en el caso contrario se busca evitar el sesgo que puede causar la manipulación humana, a la vez de ahorrar tiempo y esfuerzos al personal encargado.

Lo anterior es sólo una muestra del uso del Machine Learning. Lamentablemente, no todo son buenas noticias y así como el Machine Learning se aplica para la seguridad, también está siendo utilizando para identificar los patrones de protección y quebrantarlos. Si bien es cierto que entre un 80% o 90% de las amenazas son detectables, éstas también varían, mutando y adaptándose a los mismos sistemas de seguridad para violentarlos. Es decir, que el avance del Machine Learning en sí mismo, también representa una amenaza importante.

Los retos por superar del MACHINE LEARNING

Aunque actualmente el Machine Learning se ha convertido en uno de los pilares de lo que muchos denominan “la cuarta revolución industrial”, en conjunto con la Inteligencia Artificial y Big Data, ciertamente tiene algunas limitaciones que atrasan la llegada de los asistentes automatizados, completamente funcionales, que deseamos.

En primer lugar, la información es generada por los sistemas a partir de cantidades inmensas de datos, los cuales deben ser almacenados en equipos servidores altamente costosos para las economía de muchos países, a pesar del procesamiento y almacenaje distribuido utilizado por la Big Data, y no cualquier empresa tiene acceso a ellos. Adicionalmente, la migración de datos a Big Data, requiere de procesos locales de adaptación tecnológica y esto aún no ha sido realizado por muchas compañías.

Otra gran dificultad existente es que aún las matemáticas no pueden representar lo que muchas veces se desea hacer con el Machine Learning. Los algoritmos para predecir ciertas respuestas, y en consecuencia generar soluciones adecuadas, son bastante complejos. En muchas situaciones, los códigos creados por los matemáticos e ingenieros deben ser más eficientes para manejar las enormes cantidades de variables a considerar, y puedan generar respuestas oportunas y más ajustadas con la realidad.

Adcionalmente, otro obstáculo por superar es que la comprensión de los resultados no es tarea fácil, en ocasiones la interpretación o decodificación de la información, ya sea por humanos o por los propios algoritmos usados por el Machine Learning, no logra descifrar adecuadamente la respuesta. Incluso, hay casos en que se logra la respuesta, pero no se puede determinar por qué o cómo se obtuvo, debido a lo intrincado y compleja que es la red de rutas potenciales de solución. Esto aumenta con la capacidad multitarea que tienen las máquinas.

En todo caso, a pesar de estar muy lejos de alcanzar lo prometido por el Machine Learning y explotar todo su potencial, las empresas están apostando fuertemente por esta tecnología. No es casualidad que compañías como Microsoft, Netflix y Amazon inviertan grandes sumas de dimero en su desarrollo, y nadie puede negar que todos los sectores productivos como el de la banca internacional, industrias de seguridad, medicina, farmacéutica y salud, por mencionar algunos, estén siendo infiltrados inevitablemente por el Machine Learning, la Big Data y la Inteligencia Artificial.

Puede que muchas de sus potencialidades se vean aun lejanas, pero también es cierto que pueden llegar a ser ilimitadas y que falta mucho por desarrollar y ver sobre el Machine Learning.