Pequeños datos, grandes oportunidades
Publicado: 2022-03-11Resumen ejecutivo
¿Qué es el gran volumen de datos?
- "Big data" es una medida subjetiva que describe conjuntos de datos tan grandes que no pueden ser administrados ni analizados por las herramientas típicas de software de base de datos.
- En cambio, estos conjuntos se analizan computacionalmente para revelar patrones, tendencias y asociaciones, especialmente en relación con el comportamiento y las interacciones humanas.
- Los grandes datos y el análisis se han generalizado con la llegada de Internet, el comercio electrónico, las redes sociales y la interconexión de los dispositivos, todo lo cual ha contribuido al aumento sustancial del volumen de datos analizables necesarios para que los grandes datos se conviertan en una realidad.
- Gartner e IBM deconstruyen el big data en las Cuatro V: Volumen , Velocidad , Variedad y Veracidad , cada una de las cuales es una parte constitutiva necesaria para transformar el big data en valor monetizable.
¿Qué son los pequeños datos?
- Los datos pequeños, también una medida subjetiva, se definen como conjuntos de datos lo suficientemente pequeños en volumen y formato para que sean accesibles, informativos, procesables y comprensibles para las personas sin el uso de sistemas y máquinas complejos para el análisis.
- Los pequeños datos no se establecieron como una categoría independiente hasta la aparición de los grandes datos y, por lo tanto, representan un derivado de estos últimos.
- Las pequeñas empresas que estén considerando una estrategia de análisis deberían centrarse inicialmente en el uso de pequeños datos para generar información procesable sobre sus clientes antes de madurar a aplicaciones de grandes datos para análisis más prescriptivos y predictivos.
Definir análisis de datos.
- El análisis de datos es una disciplina de larga data en la que estadísticos y científicos de datos altamente capacitados analizan conjuntos de muestras estadísticamente significativas (es decir, grandes) utilizando programas de software sofisticados para identificar patrones y tendencias. Este análisis permite obtener información útil para tomar mejores decisiones, principalmente en torno a las interacciones con los clientes.
- En los últimos años, el software que permite este trabajo se ha vuelto más accesible, poderoso y fácil de usar, lo que permite que el ciudadano científico de datos surja y comience a emprender proyectos que antes eran dominio de especialistas técnicos altamente capacitados.
Introducción
Los datos y el análisis se han convertido rápidamente en palabras de moda en el mundo de los negocios. Sería difícil descifrar un diario sin alguna referencia a las empresas con visión de futuro que "usan datos de manera inteligente" para obtener información sobre el comportamiento del cliente, realizar análisis de riesgo o administrar su infraestructura de manera más eficiente. Las grandes empresas ricas en datos, especialmente las de la variedad regulada, se han involucrado en la toma de decisiones basada en datos durante años, mejor ejemplificado por el análisis de datos pionero de Capital One para comprender mejor a sus clientes; campañas de marketing impactantes que llevaron a su éxito desbocado.
Pero a pesar de los comienzos de nicho, la utilización de datos se ha convertido rápidamente en la corriente principal. Existen pocas razones creíbles hoy en día para que una empresa determinada, independientemente de su tamaño y mano de obra, no tenga análisis como un proceso/capacidad comercial central. Las objeciones tradicionales como el costo, los recursos y la experiencia ya no sirven. Por el contrario, los datos generados internamente se están convirtiendo rápidamente en un activo estratégico omnipresente aprovechado como lo haría cualquier otro, por empresas competitivas que buscan mantenerse competitivas.
Este artículo busca presentar brevemente a sus lectores el mundo de los datos y el análisis, guiándolos a través de la dinámica del mercado, las herramientas, los jugadores y las soluciones exclusivas de ambos, antes de dedicar la segunda mitad a una guía de implementación práctica y un marco para pequeñas empresas.
Una guía para laicos sobre datos grandes y pequeños
Con el advenimiento de Internet y con él el comercio electrónico, las redes sociales y la interconexión de los dispositivos, se produjo una explosión en el volumen de datos analizables y disponibles a nivel mundial para aquellos que poseen las herramientas para aprovecharlos. Cada tweet, publicación, me gusta, deslizamiento hacia la izquierda, deslizamiento hacia la derecha, doble toque, revisión, texto y transacción, cada uno es información utilizable para mapear nuestras huellas digitales que cuentan todo sobre quiénes somos, cómo tomamos decisiones, dónde y por qué. Estos datos, denominados apropiadamente "big data" por la inmensidad, profundidad y complejidad de su forma, han desbloqueado un mar de posibilidades en el análisis prescriptivo y predictivo, haciendo posible la hiperpersonalización de muchos de los productos que consumimos a diario.
Formalmente, los grandes datos describen grandes conjuntos de datos que pueden analizarse computacionalmente para revelar patrones, tendencias y asociaciones, con mayor frecuencia en relación con el comportamiento y las interacciones humanas. Para que los datos se denominen "grandes", el conjunto/banco debe ser tan grande como para requerir métodos de datos avanzados y sistemas complejos para extraer valor de ellos.
En un informe de investigación de 2001, el Grupo META (ahora Gartner) enmarcó los grandes datos en tres dimensiones denominadas las Tres V de los datos. Estos son los siguientes: Volumen (cantidad), Velocidad (velocidad de generación/transmisión) y Variedad (rango de tipo y fuente). Estas tres V fueron posteriormente ampliadas a Cuatro V por IBM, para incluir la Veracidad (calidad/integridad) de los datos como la dimensión final requerida para capturar valor.
…pero es probable que ya hayas oído hablar de big data. Los datos pequeños, por otro lado, son una subclase de datos que se consideran lo suficientemente modestos como para que sean accesibles, informativos y procesables por las personas, sin la necesidad de herramientas analíticas demasiado complejas. Mejor reducido por el ex-consultor de McKinsey, Allen Bonde, "Big data se trata de máquinas, mientras que small data se trata de personas", específicamente, conocimientos significativos organizados y empaquetados para la derivación de causas, patrones y las razones "por qué" sobre las personas.
Análisis basado en SaaS
Junto con el aumento tanto de la disponibilidad como de la utilidad de los datos, se produjo el surgimiento de una industria analítica independiente. Alguna vez el lugar predilecto exclusivo de los estadísticos, científicos de datos y analistas de nivel de maestría y doctorado, el análisis se ha convertido en una industria de plataformas de software como servicio (SaaS) de autoservicio funcionalmente robustas pero de bajo costo que permiten que incluso los más principiante de los usuarios para extraer valor de sus datos. Las empresas más pequeñas que anteriormente carecían de la experiencia o los presupuestos necesarios para ejecutar este tipo de análisis ahora están compitiendo en pie de igualdad con sus contrapartes con mejores recursos y estableciendo motas defendibles en sus mercados.
Además de los beneficios de costos del modelo SaaS, la investigación realizada por Aberdeen Group, una empresa de investigación de tecnología y servicios, ilustra que las organizaciones que adoptan herramientas SaaS tienen el doble de empleados que usan instintivamente datos para tomar decisiones y alcanzar sus objetivos de ROI 40 % más rápido que los que no lo hacen. Para la mayoría de las empresas, los informes de marketing por correo electrónico, Google Analytics y otras herramientas de análisis web de terceros ya están en uso activo, además de los informes generados internamente de los sistemas de contabilidad, marketing, ERP y CRM y se utilizan como mecanismo principal para monetizando sus pequeños datos.
Más aún, y aunque es un mercado grande y en crecimiento cuya medición precisa puede ser difícil, IDC estima que el mercado mundial de herramientas de análisis e inteligencia comercial en casi $ 14 mil millones a partir de 2017, creciendo a una tasa de 11.7% interanual, con Forrester Research , una empresa de investigación de mercado global, pronostica una CAGR del 15 % hasta 2021.
Datos de cuota de mercado
Como era de esperar, el mercado de herramientas y soluciones de análisis está dominado por la vieja guardia de las empresas de software, empresas como SAP, IBM, Oracle y Microsoft. A partir de 2015, SAP lideró el mercado con una participación de mercado del 10 % y USD 1200 millones en ingresos por productos de análisis e inteligencia empresarial (BI); SAS Institute fue el segundo lugar, con una participación del 9%; IBM, tercero con 8%, y Oracle y Microsoft en cuarto y quinto lugar, respectivamente, con 7% y 5%. Curiosamente, la participación de mercado de los cinco proveedores más grandes ha ido disminuyendo debido al crecimiento superior al mercado de nuevas empresas respaldadas por capital de riesgo, como Sentiment Strategies, Tableau y Teradata, lo que sugiere que gran parte del crecimiento futuro de la industria será generado por empresas más pequeñas, empresas más rápidas y ágiles.
Una guía de implementación de análisis de datos para pequeñas empresas
En el nivel más alto posible, una cultura centrada en los datos brinda a la gerencia una mayor confianza de que puede tomar las mejores decisiones posibles, a menudo y de manera consistente, mientras trabaja con la misma versión de la verdad: una transparente y cuantificable. Después de todo, la mayoría de nosotros hemos asistido a sesiones en las que ejecutivos en conflicto han presentado o defendido diferentes argumentos apoyándose en diferentes fuentes anecdóticas, patrones de hechos e interpretaciones, lo que rápidamente cuestiona la integridad de las entradas y, por lo tanto, las salidas. Por lo tanto, la primera decisión que debe tomar una pequeña empresa determinada que busca recorrer el camino del análisis de datos es si dicha empresa realmente busca convertirse en una organización basada en datos.
Una vez que se ha tomado esta decisión de arriba hacia abajo, se debe establecer un marco para optimizar el potencial y la utilidad de la nueva prioridad estratégica. Para empezar hay que hacerse varias preguntas. La primera, ¿cuáles son los objetivos a corto y largo plazo de la empresa, proyecto, iniciativa o departamento dado? En segundo lugar, ¿quién debería ser responsable del esfuerzo y sus resultados? En tercer lugar, ¿qué problemas específicos busca resolver la empresa, el proyecto, la iniciativa o el departamento con datos? Y cuarto, ¿qué herramientas se deben utilizar para impulsar la iniciativa?
Una vez que se hayan respondido estas preguntas, el siguiente paso es formular un plan de ejecución tangible que, con un poco de planificación, estructura organizacional, dirección de arriba hacia abajo y entusiasmo de abajo hacia arriba, posicionará a la organización en cuestión para generar resultados reales y medibles. resultados más consistentemente que en el pasado. El siguiente diagrama está diseñado para proporcionar un marco para considerar los diversos elementos de un enfoque simple de análisis de datos.
A la cuestión de los objetivos
Esta es la primera pregunta importante para acertar. A un alto nivel, el objetivo primordial para cualquier empresa que busque aprovechar sus datos es desarrollar un proceso sistemático para tomar decisiones comerciales sólidas, un proceso que sea consistente y repetible, y que produzca resultados considerablemente mejores. En este momento, es importante tener en cuenta que convertirse en una organización sólida orientada a los datos es un viaje y no un destino y, como tal, la "aceptación" desde arriba y el consenso desde abajo son pasos fundamentales importantes que resultarán críticos. a la adopción masiva y activos analíticos completamente utilizados. Una vez que haya logrado la aceptación, el siguiente paso probado y probado es organizar estratégicamente algunas "ganancias rápidas" para aumentar el entusiasmo y el compromiso necesarios para que este proceso fructifique. La creación de consenso, la aceptación y las ganancias rápidas logradas, tanto la investigación como mis experiencias dictan un enfoque de implementación que asume la siguiente estructura, secuencia y consideraciones:

Comience con análisis descriptivos: un tablero visual simple que destaca el desempeño corporativo utilizando datos transaccionales existentes para sacar conclusiones que anteriormente no habían resultado concluyentes sin datos cuantificables. A continuación, desarrolle capacidades de desglose dentro de su panel de control, compartiendo conocimientos, lecciones de desempeño e instrucciones de autoayuda estratégicamente y con los colegas/personas influyentes de la organización adecuadas. Esto impulsará tanto el proceso de difusión a sus subordinados como la cultura de confianza en los datos que busca cultivar.
Etapa dos: Graduarse a capacidades de análisis predictivo más sofisticadas, ya sea utilizando recursos técnicos internos o con la ayuda de proveedores externos. Estas capacidades predictivas combinan fuentes de datos internas y externas para responder mejor a preguntas comerciales específicas como "¿Cuál es la probabilidad de que un cliente abandone?" o "Los clientes que compran x, por lo general también compran y", y proporcionan información temporal sobre el desempeño departamental o de una iniciativa determinada. Las "fuentes de datos externas" en este caso incluyen datos de redes sociales, datos de la fuerza de ventas o datos de la experiencia del usuario, todos los cuales brindan fuentes ricas y estadísticamente significativas de información, donde los datos internos aún son demasiado limitados para ser aprovechados por sí solos.
La tercera etapa es pasar a análisis prescriptivos avanzados que ayuden a determinar la acción apropiada para guiar/prevenir el comportamiento del consumidor, corporativo, competidor, empleado o proveedor en el contexto de datos históricos. Sin embargo, debe tenerse en cuenta que esta etapa generalmente comienza a marcar la transición de los datos pequeños a los grandes; y, sin embargo, es un paso necesario que debe incorporarse en el proceso de decisiones de toda la empresa para garantizar los niveles más altos de integridad y consistencia de entrada-salida en la toma de decisiones.
Vista en profundidad de las diferentes etapas de análisis
Analítica descriptiva – Cuadros de mando
Es una perogrullada que lo que se mide se gestiona y, por lo tanto, al desarrollar una única verdad determinista de datos, los líderes dentro de una organización están mejor capacitados para tomar decisiones más sólidas y unificadas. Los tableros son el punto de partida de tales viajes analíticos y la ilustración visual de la verdad determinista de datos de una empresa. Por supuesto, lo que es relevante para un grupo puede no tener sentido para otro, por lo que se debe prestar la debida atención al propósito o tema de un tablero determinado, qué información se debe incluir, quién es la audiencia receptora relevante para su contenido y cuál es el pregunta/problema es que dicho grupo busca responder/resolver.
Los tableros bien diseñados impulsan la toma de decisiones en lugar de simplemente presentar información histórica, y los mejores enfocan la atención de manera efectiva en tendencias y patrones recurrentes (tanto positivos como negativos) mientras ilustran con precisión los puntos vitales de un negocio. Los tableros más sofisticados brindan capacidades de desglose que permiten a los líderes llegar a las causas raíz de un problema diagnosticado con capacidades de anotación y uso compartido que permiten una visualización más dinámica y en tiempo real.
Análisis predictivo: combinación, exploración y consulta de datos
Una vez que se completa el proceso del tablero, la organización que aspira a ser basada en datos puede comenzar a ser más ambiciosa. A esto, un próximo paso típico es "usar datos voluminosos y variados para realizar un análisis más avanzado y proporcionar una mayor dimensión al dominio de decisión". Al combinar datos específicos de la empresa enriquecidos aún más con los de terceros, que van desde proveedores verticales específicos como Experian, Acxiom y D&B hasta redes sociales o proveedores de datos de ventas como Facebook, Twitter y Salesforce, la empresa determinada puede explorar más grande, Conjuntos más amplios, más variados y estadísticamente significativos para nuevos y mejores conocimientos sobre el desempeño de la empresa y el comportamiento del cliente.
Análisis prescriptivo: implementación de análisis en los procesos comerciales
Las empresas de nivel empresarial con diferentes necesidades en términos de datos, clientes, regulaciones y problemas/asuntos comerciales específicos y con diferentes presupuestos y conjuntos de habilidades internas probablemente tendrán proveedores de tecnología que aborden sus necesidades más exclusivas. Operan a una escala en la que la capacidad de operacionalizar el análisis en sus procesos comerciales y flujos de trabajo se vuelve más importante y económica. A menudo, estas empresas estarán en industrias reguladas en las que deben poder demostrar que cuentan con tratamientos justos y repetibles.
Los prestamistas no muestran prejuicios en sus políticas de préstamo, ya sea por sexo, ingresos o raza.
A la cuestión de la responsabilidad
Una cosa es determinar una acción concreta y otra ejecutarla. Debe haber una conexión entre el diagnóstico, la prescripción y la decisión y un individuo/grupo responsable del resultado deseado. Es aquí donde el papel del patrocinador ejecutivo cobra importancia.
Tanto en las empresas pequeñas como en las grandes, dicho patrocinador ejecutivo, el campeón designado del enriquecimiento de datos y director de datos de facto, es una persona, por lo general el director general, el director financiero o el director de marketing desde el principio, ya inmerso en datos y análisis, en sintonía con el tipo de problemas que se resuelven mejor con datos, o al menos un creyente en el potencial transformador del análisis de datos.
Además de este protagonista, el proceso también suele requerir un campeón secundario más práctico, especialmente una vez que la empresa comienza la transición del análisis descriptivo al predictivo. Tradicionalmente, esta persona era un científico de datos interno técnicamente capacitado, pero más recientemente ha tomado la forma de un entusiasta experto en tecnología, a menudo denominado científico de datos ciudadano. Este individuo típicamente se auto-selecciona, un jinete de hoja de cálculo autoproclamado con el equilibrio correcto de curiosidad intelectual y destreza, pero dispuesto a vivir en la maleza de implementación. En muchos casos, esta persona se adelantó a la gerencia al reconocer el impacto potencial que un proceso formal de análisis de datos puede crear en su empresa, pero simplemente carecía del estatus o la credibilidad necesarios para vender su visión.
A la Cuestión del Problema Empresarial
Cada empresa exitosa y fallida tiene su conjunto único de desafíos que solo se pueden abordar mediante la combinación adecuada de recursos, procesos y capacidades específicas para ella. Dicho esto, los tipos de desafíos comerciales más adecuados para ser abordados por los datos pueden, en la mayoría de los casos, reducirse, categorizarse y abordarse utilizando el marco establecido en el Gráfico 7.
Además, se han ideado algunas pautas/parámetros anecdóticos a lo largo de los años, que optimizan aún más las posibilidades no solo de identificar los tipos correctos de problemas para abordar con datos, sino también sus posibilidades de resolverse con éxito. Estas pautas/parámetros son los siguientes: Primero, elija preguntas simples y claras cuyas implicaciones sean muy importantes; segundo, al buscar respuestas a partir de datos, apunte a la practicidad de la solución más que a la perfección de una respuesta académica; tercero, tenga en cuenta la naturaleza y la base de conocimientos de su audiencia receptora al entregar el diagnóstico y la solución; y finalmente, solo seleccione problemas que sean medibles y cuantificables con datos y soluciones ya existentes que puedan, en igual medida, ser rastreados.
A la cuestión de las herramientas y los métodos correctos
La última de nuestras cuatro preguntas marco originales, en lo que respecta a la construcción de una organización sostenible orientada a los datos, se refiere a la selección de herramientas, métodos o plataformas. A esto, primero diré que las herramientas de análisis de datos han evolucionado considerablemente en los últimos años, con varios pros y contras para el usuario empresarial. Las ventajas incluyen una caída sustancial en los costos asociados con el arrendamiento de tales herramientas y un aumento en la lista de funciones y la complejidad de las opciones disponibles, ya que han pasado de herramientas específicas de funciones a plataformas de funcionalidad superpuesta. Además, los proveedores de SaaS ofrecen pruebas gratuitas, aunque con restricciones en el volumen y el tipo de datos; los nuevos usuarios tienen la oportunidad de tomar una decisión de compra informada después de probar varias plataformas.
La principal desventaja de estas plataformas es que, en un intento por mantenerse competitivos entre sí, los proveedores han innovado tan agresivamente hacia la complejidad que sus ofertas ahora se acercan a la saturación de funciones con ofertas que están más allá de la utilidad del usuario comercial promedio. El desafortunado resultado es la abrumadora mayoría del usuario novato, lo que dificulta el logro de las "ganancias rápidas" discutidas anteriormente y, por lo tanto, reduce la probabilidad de que la cultura de datos se arraigue en una empresa determinada.
Afortunadamente, hay muchos recursos disponibles para ayudar a los posibles usuarios, evaluar y comparar las soluciones de inteligencia comercial de la competencia, aunque es útil cierto conocimiento de las capacidades comunes básicas para evaluarlas frente a las necesidades y prioridades específicas de una empresa. Algunas de estas capacidades incluyen: cantidad y alcance de las conexiones de datos, disponibilidad de tableros preensamblados, capacidades de desglose, publicación y uso compartido, integración con la combinación de datos y capacidad de software de exploración, potencial de escalamiento (tanto en volumen como en parámetros de variedad), número y precisión de los enfoques de modelado, y las bases de referencia de clientes por industria específica. Aunque ciertamente simple en su resumen, el Gráfico 7 anterior establece algunos proveedores clave que juegan en varias categorías (descriptivo, predictivo, prescriptivo).
Pequeños datos, grandes oportunidades
A pesar de sus comienzos de nicho, está claro que el análisis de datos y el mercado de herramientas de análisis basadas en SaaS han evolucionado considerablemente en los últimos años, en beneficio del ciudadano científico de datos y su empresa. Big data, small data, herramientas de autoservicio: cada uno es lo suficientemente convencional ahora como para justificar su consideración como una competencia central incluso de las empresas menos técnicas. Dicho de otra manera, con tantos datos útiles y procesables que se generan y los costos de las herramientas de autoservicio que se mueven inversamente a las características y capacidades que se ofrecen, seguirán existiendo pocas razones para que incluso las pequeñas empresas no comiencen a aprovechar los datos de alguna manera.
Este artículo debería haber ilustrado que, con un poco de planificación, establecimiento de objetivos y selección de patrocinadores, incluso su startup puede comenzar a nivelar el campo de juego competitivo con los titanes de la industria que se ha propuesto interrumpir, y en el proceso desbloquear un tremendo valor económico para usted. y sus partes interesadas. Solo necesitas empezar; así que adelante, ¡comienza!
