Apostar por un enfoque holístico, adoptar un sistema de ensayo y error, elegir la tecnología adecuada o adaptar la estructura de la organización al aprendizaje automático son acciones clave
El Machine Learning (ML) funciona mediante algoritmos informáticos que mejoran automáticamente, a través de una experiencia basada en patrones y desviaciones de datos. Su uso adecuado puede generar un impacto positivo en las empresas en forma de ahorro de tiempo y dinero.
Muchos expertos consideran al ML una parte de la Inteligencia Artificial. Sus algoritmos construyen un modelo matemático, basado en datos de muestra, que hacen predicciones o toman decisiones sin estar explícitamente programados para ello. Gracias a su utilización, es posible predecir un valor futuro, estimar una probabilidad, clasificar un objeto, agrupar objetos similares, detectar asociaciones o identificar valores atípicos.
En este contexto, Cloudera, la empresa de la Enterprise Data Cloud, presenta un decálogo de recomendaciones con el fin de hacer más eficiente el uso del Machine Learning. La compañía fue nombrada por el informe de Forrester, Notebook-Based Predictive Analytics and Machine Learning, Q3 2020, líder en predicción analítica y Machine Learning y recibió las puntuaciones más altas posibles en los criterios de código abierto, seguridad, gobierno, aplicaciones, implementación e infraestructura de plataforma.
1. Adopción de un enfoque holístico. Es necesario considerar el aprendizaje automático como una parte integral de la estrategia de empresa. Ejecutándolo junto a los entornos, procesos, aplicaciones y flujos de trabajo tecnológicos existentes se obtienen mejores resultados.
2. Ensayo y error. Estar dispuesto a experimentar y a fallar es fundamental. Los modelos y algoritmos de ML tienen una base científica, pero no siempre generan resultados exactos. En muchas ocasiones, es necesario realizar varias pruebas hasta alcanzar el objetivo deseado.
3. Construcción de un equipo multidisciplinario. Los miembros de la plantilla no deben estar encajonados en una posición. El gobierno y la seguridad de los datos tienen un papel crucial en este contexto.
4. Iterar rápidamente, optimizar más tarde. Los científicos de datos deben ser capaces de utilizar las herramientas que deseen y tener la libertad de iterar rápidamente. No hay que preocuparse por obtener un modelo que sea impecable la primera vez. De hecho, en ocasiones, se puede perder demasiado tiempo perfeccionando algo que no sea realmente alcanzable mediante el ML.
5. Elegir la tecnología adecuada para mejorar el ciclo de vida. Es fundamental escoger una plataforma que dé prioridad a la colaboración holística y agilice el flujo de trabajo de ML, desde los datos hasta la producción, de una manera segura, interpretable y escalable. Hay que tener cuidado con las soluciones puntuales y con la caja negra.
6. Adaptar la estructura de la organización al ML. En algunas empresas parece haber un muro entre la experimentación y la producción a gran escala. Solo haciendo la configuración de la empresa más flexible para la adopción del aprendizaje automático, es posible derribar esa frontera e incluir el desarrollo, la producción y el mantenimiento del ML en todos los procesos.
7. Proteger la integridad de los modelos. A medida que los datos subyacentes cambian y se desplazan debido a que sus propios modelos tienen un impacto en los datos, estos deben actualizarse y mejorarse. Mantener la integridad exige vigilancia para evitar que esos modelos se desvíen y sean inexactos.
8. Cerrar la brecha de habilidades. Las empresas deben buscar candidatos que tengan las competencias básicas necesarias para realizar las tareas más importantes: ingeniería de datos, ciencia de datos y desarrollo de software. Después, es recomendable que apuesten por la interacción entre los distintos profesionales para que aprendan unos de otros y potenciar de ese modo el talento diverso.
9. Tratamiento de los modelos de producción como software vivo. Para proteger los modelos de producción es necesario tener la capacidad de mantenerlos seguros. Esto implica tener el control sobre quién puede acceder a la información y realizar cambios en esos modelos.
10. Comprensión y cumplimiento de las obligaciones éticas. Las compañías deben asegurarse de tener el consentimiento de los clientes, y de otras partes interesadas, para aplicar los datos necesarios en un modelo de aprendizaje automático. Es muy recomendable que las empresas pongan en marcha controles de ética de datos en el desarrollo de prácticas de machine learning.
Por Cloudera
En Cloudera creemos que los datos pueden hacer lo que es imposible hoy, posible mañana. Queremos dar la capacidad a todas las personas para que transformen datos complejos en información útil. Es la única plataforma de Streaming, Machine Learning y Analítica de Datos que está optimizada para la nube y el datacenter.