Ciencia de Datos para mejorar resultados
Cada vez más organizaciones -grandes players, startups y pequeñas empresas- se están dando cuenta del espacio estratégico que ocupa la Ciencia de Datos en los negocios.
Independientemente del sector o el tamaño, las organizaciones que quieren continuar siendo competitivas en la era del Big Data tienen que desarrollar e implementar eficientemente capacidades de Ciencia de Datos, si no lo hacen, se arriesgan a quedarse atrás.
¿y tú?, ¿qué sabes sobre Ciencia de Datos?
En este artículo vamos a hablar sobre el concepto y podrá ver algunos ejemplos de proyectos de Ciencia de Datos que ayudaron a mejorar resultados de negocio.
Qué es Ciencia de Datos
Del inglés Data Science, la Ciencia de Datos es el campo de estudio que combina conocimiento sobre domínios, habilidades de programación, matemática y estadística para extraer insights significativos de los datos.
Los científicos de datos aplican algoritmos de machine learning a números, textos, imágenes, vídeos, audios y mucho más, produciendo sistemas de inteligencia artificial (IA) para ejecutar tareas que requieren inteligencia humana.
A su vez, estos sistemas generan insights que analistas y usuarios traducen en valor comercial tangible.
Una forma de entender la Ciencia de Datos es a través de la visualización de lo que hace un científico de datos. En la definición de Gartner, ese profesional tiene una “función crucial para las organizaciones que buscan extraer insights de información para las iniciativas de Big Data”.
La empresa añade que esa especialidad requiere una amplia combinación de habilidades: colaboración y trabajo en equipo son necesarios para entender los problemas de negocio, habilidades analíticas y de elaboración de modelos de decisión para descubrir interrelaciones y detectar patrones, y habilidades de gestión de datos son importantes para analizar y generar insights de valor para promover tomas de decisión eficientes.
Cómo funciona el proceso de Ciencia de Datos
El proceso de Ciencia de Datos sigue normalmente la secuencia:
datos > información > conocimiento > insight > inteligencia
Para comprender mejor este proceso, vamos a recurrir a la explicación dada en la Harvard Business Review por Hugo Bowne-Anderson, Ph.D en Ciencia de Datos:
“En primer lugar, los científicos de datos crean una sólida base de datos sobre la que realizar los análisis. A continuación, realizan experimentos on-line para alcanzar un crecimiento sostenible. Finalmente, construyen pipelines de machine learning y productos de datos personalizados para entender mejor a sus negocios y clientes, y de esta forma tomar decisiones de forma más eficiente. En resumen, se puede decir que en lo que referente a la tecnología, la Ciencia de Datos trata sobre infraestructura, tests y machine learning para tomas de decisiones y productos de datos”.
Beneficios de la Ciencia de Datos para los negocios
La principal ventaja de usar Ciencia de Datos en una organización es el empoderamiento y la facilitación en la toma de decisiones.
Organizaciones que trabajan con científicos de datos pueden tomar decisiones basadas en evidencias cuantificables con datos. Esas decisiones pueden llevar al aumento de la rentabilidad y a una mejora de la eficiencia operacional, del desempeño de los negocios y de los flujos de trabajo.
En organizaciones que viven en estrecha relación con sus clientes, la Ciencia de Datos ayuda a identificar y refinar el público objetivo. También es bastante útil para reclutar: el procesamiento interno de aplicativos, tests, y juegos de aptitud orientados a los datos, ayuda al equipo de recursos humanos a hacer selecciones más rápidas y precisas durante el proceso de contratación.
Los beneficios específicos de la Ciencia de Datos varían dependiendo del objetivo de la empresa y del sector en el cual está insertada.
Por ejemplo, los departamento de ventas y marketing pueden extraer datos de los clientes para mejorar las tasas de conversión, o crear campañas de marketing individuales.
Instituciones bancarias están generando datos para mejorar la detección de fraudes. Servicios de streaming y música para determinar el interés de los usuarios y usar esos datos para conocer qué programas de TV o películas se deben producir.
Algoritmos basados en datos también son usados para hacer recomendaciones personalizadas con base en el histórico de visualizaciones de un usuario.
Empresas de transporte como DHL y FedEx ya usan Ciencia de Datos para encontrar las mejores rutas y horarios de entrega, así como las mejores formas de transporte para realizar sus envíos.
2 ejemplos de proyectos de Ciencia de Datos para alcanzar resultados
A continuación, algunos proyectos de Ciencia de Datos que han sido bastante eficaces en potenciar los resultados de negocios.
Yelp: mejora en el sistema de recomendaciones
Cuando llega el momento de escoger un restaurante muchas personas recurren a Yelp para determinar cuál es la mejor opción para el tipo de comida que están buscando, pero ¿qué pasa cuándo hay varios restaurantes con la misma clasificación en una misma área?
¿Cual elegir? Robert Chen, un científico de datos, investigó una manera de evaluar mejor los puntuaciones de los usuarios de Yelp para determinar si llevaban realmente a los mejores restaurantes indios.
Chen descubrió que había muchos restaurantes indios recomendados con las mismas puntuaciones. Con toda seguridad no todos los usuarios tenían el mismo conocimiento sobre la culinaria india, y con esa idea llegó a las siguientes conclusiones:
- Ponderar las puntuaciones de restaurantes realizados por una única persona y de una cocina específica (en este caso, comida india). El consiguió justificar ese parámetro examinando los usuarios de otras cocinas, como por ejemplo la comida china;
- La etnia aparente del usuario en cuestión. Si el usuario tuviese un nombre indio Chen infería que probablemente serían de etnia india y por tanto con una opinión más fundada de lo que era buena comida indiana.
Las modificaciones que realizó sobre los datos en las variables reflejó que aquellos que tenían nombres indios tendían a dar buenas críticas a solo un restaurante por ciudad de las 11 analizadas, proporcionando así una elección clara por ciudad.
Amazon vs eBay: comparación para el ahorro
A todos nos ha pasado que justo después de hacer una compra online descubres que ese mismo producto es mucho más barato en otra tienda. Para apoyar una extensión de Chrome que estaba desarrollando, Chase Roberts decidió comparar los precios de 3.500 productos en eBay y en Amazon.
Los resultados mostraron unas posibilidades de ahorro muy relevantes: “Nuestro carro de la compra posee 3.520 items exclusivos, si escoges la plataforma equivocada para comprar cada uno de esos items (siempre comprando en un site que tenga el precio más caro), ese carro costará 193.498,45 US $ más” apunta Roberts en su blog.
¿Te das cuenta después de conocer estos dos proyectos como la Ciencia de Datos no es un dragon de 7 cabezas? Lo cierto es que en la práctica potencializa resultados al ayudar a dar respuesta a preguntas relevantes. Si quieres profundizar más en este tema, descargue nuestra versión en inglés del E-book Design Driven Data Science.
Back