Errores a Evitar en la Analítica Predictiva

Los análisis predictivos pueden producir resultados asombrosos. Los beneficios que se pueden lograr basando decisiones futuras en patrones de acontecimientos históricos puede superar con creces cualquier cosa que se pueda lograr confiando sólo en una corazonada.

Hay numerosos ejemplos que demuestran el incremento potencial en todas las industrias posibles, pero una prueba que hicimos recientemente en el sector minorista demostró que la aplicación de modelos predictivos estables nos dio un aumento de cinco veces en la preferencia de un producto, en comparación a alguna muestra aleatoria. Afrontémoslo, no habría tanto foco en la analítica predictiva y en el Machine Learning si los resultados no fueran impresionantes.

Pero los modelos predictivos no son infalibles. Pueden ser un poco como los caballos de carreras: algo sensible a los cambios y con una propensión a dejar al jinete en el suelo, preguntándose todos qué diablos pasó.

La comodidad de la tecnología actual está haciendo que la ciencia de los datos sea cada vez más accesible que nunca para aquellos no-especializados en datos. Con esto en mente, les dejamos una lista con los errores a evitar para mantener un modelo funcionando como se esperaba:

  • Hacer asunciones incorrectas de los datos subyacentes
    Apresurarse y asumir demasiado a partir de la data puede llevar a desafortunados desenlaces. Es necesario comprender los datos y tendencias en las distribuciones, información faltante, outliers, etc.
  • Trabajar con bajos volúmenes
    Bajos volúmenes es el lugar que debes evitar como científico de datos. Esto lleva a resultados estadísticamente débiles, inestables y modelos poco confiables.
  • Sobreajustar el modelo
    Ajustar demasiado a un modelo para resultados que son conocidos puede dar la idea de explicar mejor una variable, sin embargo, si se abusa de esto, puede darse el caso de que el resultado este ajustado a unas características muy específicas de los datos, omitiendo o fallando en situaciones más generales
  • Parcialidad en los datos de práctica
    Un ejemplo, si le ofreces sólo un producto a un grupo de control (digamos «los jóvenes»), adivina que, el modelo arrojara una enorme aceptación de parte de los jóvenes hacia el producto (no tienen otra opción para elegir)
  • Incluir datos de prueba en los datos de práctica
    Al hacer esto se puede dar la ilusión de que el modelo funciona fantásticamente, fallando terriblemente después. En el mundo de la analítica predictiva, cuando los resultados son «demasiado buenos», vale la pena revisar y validar nuestros resultados ( una segunda opinión tampoco viene mal)
  • Esperar que las máquinas comprendan tu problema
    Las maquinas no pueden(aún) entender algún problema, por tanto no puedes esperar que te digan cómo resolverlo.
  • Usar la métrica incorrecta para evaluar el desempeño de un modelo
    Ejemplo, de 10.000 casos, tienes que dos son fraudes, y 9.998 no lo son. Si evaluamos el modelo en función de su capacidad para predecir los casos que NO SON FRAUDE, su precisión seria de un 99,98%, pero no serviría si lo que se desea es predecir cuantos casos son fraudulentos.
  • Olvidarse de los outliers.
    Estos casos por lo general merecen una atención especial o deben ser ignorados por completo, algunos métodos de modelado son extremadamente sensibles a los valores atípicos, lo que puede causar un mal rendimiento en el modelo.
  • No estandarizar los datos.
    Es crucial estandarizar los datos para que todos estén en la misma escala. De otra manera, las distorsiones en los resultados pueden inutilizar el modelo.
  • No tener en cuenta el ambiente real en el que se desempeñará el modelo
    Los profesionales a veces pueden distraerse al intentar construir el modelo más perfecto, pero cuando se trata de implementación, esta puede llegar a ser tan compleja que no se pueda integrar en el sistema operativo.
  • No considerar las implicaciones del mundo real y las posibles consecuencias de aplicar analíticas predictivas eficaces.
    El minorista estadounidense Target acaparó la atención del público hace cuatro años cuando el reportero del New York Times, Charles Duhigg, reportó un incidente de los modelos analíticos de Target que predecía el embarazo de un adolescente. La empresa envió ofertas para futuras madres a la hija antes de que su padre lo supiera. Como pueden imaginar, sólo porque uno puede, no significa que uno debe.

Hemos aprendido colectivamente algunas lecciones valiosas usando la analítica predictiva a lo largo de los años. Entonces, ¿Por qué no tomar ventaja? ¿Por qué no aprovechar el conocimiento y la información que se genera constantemente? Cada vez son mas las entidades que se apoyan en los datos en su toma de decisiones, y los resultados prometen ser cada vez mas sorprendentes.

FUENTE

Para más información, contáctanos y sigue nuestras noticias en redes sociales.

[social_links size=»normal» align=»left» email=»» facebook=»» twitter=»https://twitter.com/penta_analytics» google=»» linkedin=»https://www.linkedin.com/company/penta-analytics» youtube=»https://www.youtube.com/channel/UCwDDRsxyd2pI7YJa7CdqL-Q/videos» vimeo=»» flickr=»» instagram=»» behance=»» pinterest=»» skype=»» tumblr=»» dribbble=»» vk=»» rss=»»]