小数据,大机遇
已发表: 2022-03-11执行摘要
什么是大数据?
- “大数据”是一种主观度量,描述的数据集非常庞大,以至于无法通过典型的数据库软件工具进行管理和分析。
- 相反,这些集合被计算分析以揭示模式、趋势和关联,特别是与人类行为和交互相关的。
- 随着互联网、电子商务、社交媒体和设备互连的出现,大数据和分析已成为主流——所有这些都促成了大数据成为现实所需的可分析数据量的实质性增加。
- Gartner 和 IBM 将大数据分解为四个 V: Volume 、 Velocity 、 Variety和Veracity——每一个都是将大数据转化为货币化价值所需的组成部分。
什么是小数据?
- 小数据,也是一种主观衡量标准,被定义为在数量和格式上足够小的数据集,以便在不使用复杂系统和机器进行分析的情况下,使人们可以访问、提供信息、可操作和可理解的数据。
- 直到大数据出现,小数据才成为一个独立的类别,因此是后者的衍生品。
- 考虑分析策略的小型企业最初应专注于使用小数据来生成对客户的可操作见解,然后才能成熟地使用大数据应用程序进行更具规范性和预测性的分析。
定义数据分析。
- 数据分析是一门历史悠久的学科,训练有素的统计学家和数据科学家使用复杂的软件程序分析具有统计意义的(即大型)样本集,以识别模式和趋势。 这种分析使洞察力有助于做出更好的决策,主要是围绕客户交互。
- 近年来,支持这项工作的软件变得更加易于访问、功能强大且易于使用,从而使公民数据科学家得以出现并开始承担以前训练有素的技术专家领域的项目。
介绍
数据和分析已迅速成为当今商业世界的流行语。 如果不提及具有前瞻性思维的公司“智能地使用数据”来收集对客户行为的洞察、进行风险分析或更有效地管理其基础设施,那么将很难破解一本期刊。 大型、数据丰富的公司,尤其是那些受监管的公司,多年来一直从事以数据为主导的决策,最好的例证是 Capital One 开创性的数据分析以更好地了解其客户——随后用于推出超目标和巨大的洞察力有影响力的营销活动,导致其大获成功。
但是,尽管开始于利基市场,但数据的利用已迅速成为主流。 如今,对于一家给定的公司,无论规模和人力如何,几乎没有什么可信的理由不将分析作为核心业务流程/能力。 成本、资源和专业知识等传统反对意见已不再适用。 相反,内部生成的数据正迅速成为一种无处不在的战略资产,以任何其他方式被寻求保持竞争力的竞争企业所利用。
本文旨在粗略地向读者介绍数据和分析的世界,带您了解两者独有的市场动态、工具、参与者和解决方案,然后将后半部分用于小型企业的实践实施指南和框架。
大数据和小数据的外行指南
随着互联网的出现以及电子商务、社交媒体和设备的互连性,全球可用和可分析数据的数量激增,对于那些拥有利用它的工具的人来说。 每条推文、帖子、点赞、向左滑动、向右滑动、双击、评论、文本和交易——每一个都是可用于绘制我们的数字足迹的数据,这些数据告诉我们我们是谁、我们如何做出决定、在哪里以及为什么做决定。 这些数据因其形式的广泛性、深度和复杂性而被恰当地称为“大数据”,它为规范性和预测性分析提供了无限可能,使我们每天消费的许多产品的超个性化成为可能。
形式上,大数据描述了可以通过计算分析以揭示模式、趋势和关联的大型数据集,通常与人类行为和交互有关。 对于被称为“大”的数据,集合/银行必须大到需要先进的数据方法和复杂的系统才能从中提取价值。
在 2001 年的一份研究报告中,META Group(现为 Gartner)在三个维度中构建了大数据,称为数据的三个 V。 它们如下: Volume (数量)、 Velocity (产生/传输的速度)和Variety (类型和来源的范围)。 IBM 随后将这三个 V 扩展为四个 V,将数据的准确性(质量/完整性)作为获取价值所需的最终维度。
…但您可能已经听说过大数据。 另一方面,小数据是被认为足够适中的数据的子类,以便人们可以访问、提供信息和可操作,而无需过于复杂的分析工具。 前麦肯锡顾问艾伦邦德最好的总结是,“大数据是关于机器的,而小数据是关于人的”——特别是,有意义的见解被组织和打包,用于推导关于人的因果关系、模式和“为什么”的原因。
基于 SaaS 的分析
随着数据可用性和实用性的提高,一个独立的分析行业出现了。 曾经是硕士和博士级别的统计学家、数据科学家和分析师的专属场所,分析已经发展成为一个功能强大但成本低廉的自助软件即服务 (SaaS) 平台行业,即使是最强大的软件即服务 (SaaS) 平台,新手从他们的数据中提取价值。 以前缺乏执行此类分析所需的专业知识或预算的较小公司现在正在与资源更丰富的同行竞争,并在其市场上建立可防御的微尘。
除了 SaaS 模式的成本优势,技术和服务研究公司 Aberdeen Group 的研究表明,采用 SaaS 工具的组织拥有本能地使用数据做出决策并实现其 ROI 目标的员工数量是其两倍比那些没有的更快。 对于大多数公司来说,电子邮件营销报告、谷歌分析和其他基于 Web 的第三方分析工具已经在积极使用,此外还有来自会计、营销、ERP 和 CRM 系统的内部生成报告,并被用作主要机制将他们的小数据货币化。
更重要的是,尽管它是一个庞大且不断增长的市场,其精确衡量可能很困难,但 IDC 根据 Forrester Research 估计,截至 2017 年,全球商业智能和分析工具市场规模接近 140 亿美元,同比增长 11.7% ,一家全球市场研究公司,预测到 2021 年的复合年增长率为 15%。
市场份额数据
不出所料,分析工具和解决方案市场由老牌软件公司(如 SAP、IBM、甲骨文和微软)主导。 截至 2015 年,SAP 以 10% 的市场份额和 12 亿美元的分析和商业智能 (BI) 产品收入领先市场; SAS Institute 排名第二,占有 9% 的份额; IBM 以 8% 的份额位居第三,甲骨文和微软分别以 7% 和 5% 的份额位居第四和第五位。 有趣的是,由于 Sentiment Strategies、Tableau 和 Teradata 等风险投资支持的初创公司的高于市场增长,五家最大供应商的市场份额一直在下降,这表明该行业未来的大部分增长将由较小的、更快、更敏捷的公司。
小公司数据分析实施指南
在尽可能高的水平上,以数据为中心的文化使管理层更有信心,他们能够经常且始终如一地做出最佳决策,同时根据相同版本的事实(透明、可量化的事实)开展工作。 毕竟,我们中的大多数人都参加过这样的会议,交战的高管们通过依靠不同的轶事来源、事实模式和解释提出/捍卫不同的论点,很快就对输入的完整性和输出的完整性提出了质疑。 因此,寻求走数据分析道路的特定小型企业必须做出的第一个决定是,该企业是否真正寻求成为数据驱动的组织。
一旦做出这种自上而下的决定,就必须建立一个框架来优化新战略重点的潜力和实用性。 首先,必须问几个问题。 首先,给定公司、项目、计划或部门的短期和长期目标是什么? 其次,谁应该为努力及其结果负责? 第三,公司、项目、计划或部门想用数据解决哪些具体问题? 第四,应该使用什么工具来推动主动性?
回答完这些问题后,下一步就是制定切实可行的执行计划,通过一些规划、组织结构、自上而下的方向和自下而上的热情,将手头的组织定位为产生真实和可衡量的结果比过去更一致。 下图旨在提供一个框架来考虑简单数据分析方法的各种元素。

关于目标问题
这是第一个正确的重要问题。 在高层次上,任何寻求利用其数据的公司的最高目标是开发一个系统化的流程来制定合理的业务决策——一个一致且可重复的流程,并产生明显更好的结果。 在这个时刻,重要的是要注意,成为一个健全的面向数据的组织是一段旅程,而不是一个目的地,因此,从上层“买入”和从底层达成共识是重要的基础步骤,将被证明是至关重要的大规模采用和充分利用分析资产。 获得认可后,经过试验和测试的下一步是战略性地安排一些“速赢”,以提高看到这一过程取得成果所需的门槛兴奋和参与度。 研究和我的经验决定了一种实现方法,即假设以下结构、顺序和考虑因素,建立共识、支持和快速获胜:
从描述性分析开始——一个简单的可视化仪表板,使用现有的交易数据突出企业绩效,得出以前在没有可量化数据的情况下被证明是无定论的结论。 接下来,在您的仪表板中开发向下钻取功能,战略性地与合适的同事/组织影响者分享见解、绩效要点和自助说明。 这将启动向其下属的传播过程以及您寻求培养的数据依赖文化。
第二阶段:利用内部技术资源或在第三方供应商的帮助下,学习更复杂的预测分析能力。 这些预测能力融合了内部和外部数据源,以更好地回答特定的业务问题,例如,“客户背叛的可能性有多大?”或“购买 x 的客户,通常也购买 y”,并提供真实的时间洞察部门或给定计划的绩效。 在这种情况下,“外部数据源”包括社交媒体数据、销售人员数据或用户体验数据,所有这些都提供了丰富且具有统计意义的洞察力来源,而内部数据仍然过于有限,无法单独利用。
第三阶段是继续进行高级、规范性分析,帮助确定适当的行动,以根据历史数据的背景引导/抢占消费者、公司、竞争对手、员工或供应商的行为。 需要注意的是,这个阶段通常开始标志着从小数据到大数据的转变; 然而,这是一个必要的步骤,应该纳入您公司范围的决策过程,以确保最高水平的输入输出完整性和决策的一致性。
深入了解分析的不同阶段
描述性分析——仪表板
不言而喻,衡量的东西是经过管理的,因此通过开发一个单一的数据确定性真理,组织内的领导者能够更好地做出更合理、更统一的决策。 仪表板是此类分析之旅的起点,也是公司数据确定性事实的直观说明。 当然,与一个群体相关的内容可能对另一个群体毫无意义,因此应适当考虑给定仪表板的目的或主题,应包含哪些信息,相关的受众受众是谁,以及什么是问题/问题是该小组正在寻求回答/解决。
精心设计的仪表板推动决策制定,而不是简单地呈现历史信息,并且最有效地将注意力集中在趋势和反复出现的模式(正面和负面)上,同时准确地说明企业的生命力。 更复杂的仪表板提供向下钻取功能,使领导者能够通过注释和共享功能找到诊断问题的根本原因,从而实现更动态的实时查看。
预测分析——数据混合、探索和查询
仪表板流程完成后,有抱负的数据驱动型组织可能会开始变得更加雄心勃勃。 为此,典型的下一步是“使用大量多样的数据进行更高级的分析,并为决策领域提供更多维度。” 通过将进一步丰富的公司特定数据与第三方(从 Experian、Acxiom 和 D&B 等垂直特定供应商到 Facebook、Twitter 和 Salesforce 等社交媒体或销售数据提供商)混合,特定公司可以探索更大的、更广泛、更多样化和具有统计意义的集合,以提供对公司绩效和客户行为的新的和更好的洞察力。
规范性分析——将分析部署到业务流程中
在数据、客户、法规和特定业务问题/问题方面具有不同需求以及具有不同预算和内部技能组合的企业级公司可能会有技术供应商来满足他们更独特的需求。 他们的运营规模使得将分析应用到他们的业务流程和工作流程中的能力变得更加重要和经济。 通常,这些公司将在受监管的行业中,他们需要能够证明他们有公平和可重复的治疗。
贷款人在他们的贷款政策中没有表现出任何偏见,无论是性别、收入还是种族。
关于责任问题
确定具体行动是一回事,实施它是另一回事。 诊断、处方和决策与负责预期结果的个人/团体之间需要建立联系。 正是在这里,执行发起人的角色变得很重要。
执行发起人(被提名为数据丰富的拥护者和事实上的首席数据官)表示,无论在小型公司还是大型公司,都是个人,通常是首席执行官、首席财务官或首席营销官,他们已经沉浸在数据和分析领域,适应了这类问题最好由数据解决,或者至少相信数据分析的变革潜力。
除了这个主角之外,这个过程通常还需要一个次要的、更亲力亲为的拥护者,尤其是当公司开始从描述性分析过渡到预测性分析时。 传统上,此人是受过技术培训的内部数据科学家,但最近已成为一名精通技术的爱好者,通常被称为公民数据科学家。 这个人通常是自我选择的——自称是电子表格骑师,在求知欲和灵巧之间取得了适当的平衡,但愿意生活在实施的杂草中。 在许多情况下,这个人在认识到正式数据分析过程可以在他们的公司创造的潜在影响方面领先于管理层,但只是缺乏推销他们的愿景所需的地位或信誉。
关于业务问题的问题
每家成功和失败的公司都有其独特的挑战,只有通过适当组合特定的资源、流程和能力才能解决。 也就是说,最适合通过数据解决的各种业务挑战通常可以使用图 7 中列出的框架来减少、分类和解决。
此外,多年来已经设计了一些轶事指南/参数,这进一步优化了不仅识别正确类型的问题以使用数据解决的机会,而且还优化了它们被成功解决的机会。 这些指导方针/参数如下: 首先,选择意义重大的简单、明确的问题; 第二,从数据中寻找答案,以解决方案的实用性为目标,而不是学术答案的完美; 第三,在提供诊断和解决方案时,牢记接受者的性质和知识基础; 最后,只选择可以用现有数据和解决方案衡量和量化的问题,这些问题和解决方案可以同等地跟踪。
关于正确的工具和方法的问题
我们最初的四个框架问题中的最后一个问题是关于构建一个可持续的面向数据的组织,是关于工具、方法或平台的选择。 对此,我首先要说明的是,近年来数据分析工具有了长足的发展,对业务用户有利也有弊。 优点包括与租赁此类工具相关的成本大幅下降,以及功能列表和可用选项的复杂性增加,因为它们已经从特定功能的工具过渡到具有重叠功能的平台。 此外,SaaS 供应商提供免费试用,尽管对数量和数据类型有限制; 新顾客有机会在测试多个平台后做出明智的购买决定。
这些平台的主要缺点是,为了保持彼此之间的竞争力,供应商在复杂性方面进行了如此积极的创新,以至于他们的产品现在接近功能饱和,提供的产品超出了普通商业用户的实用性。 不幸的结果是新手用户的压倒性优势,这使得实现前面讨论的“速赢”变得更加困难,从而降低了数据文化在给定公司中扎根的可能性。
幸运的是,有许多资源可用于帮助潜在用户、评估和比较竞争的商业智能解决方案,尽管一些核心通用能力的知识对于根据公司的特定需求和优先事项评估它们很有用。 一些此类功能包括:数据连接的数量和范围、预组装仪表板的可用性、向下钻取、发布和共享功能、与数据混合和探索软件功能的集成、扩展潜力(在数量和品种参数上)、数量建模方法的准确性和准确性,以及每个特定行业的客户参考基础。 虽然总结很简单,但上面的图表 7 列出了一些在不同类别(描述性、预测性、规范性)中发挥作用的主要供应商。
小数据,大机遇
尽管起步于利基市场,但很明显,数据分析和基于 SaaS 的分析工具的市场近年来发生了长足的发展,这对公民数据科学家及其公司大有裨益。 大数据、小数据、自助服务工具——现在每一个都足够主流,足以保证它们被视为即使是技术含量最低的企业的核心竞争力。 换句话说,由于生成了如此多有用的、可操作的数据,而且自助服务工具的成本与所提供的特性和功能成反比,即使是小型企业也没有什么理由不开始以某种方式利用数据。
本文应该已经说明,只要稍加规划、设定目标和选择赞助人,即使是您的初创公司也可以开始与您打算颠覆的行业巨头展开竞争,在此过程中为您释放巨大的经济价值和你的利益相关者。 你只需要开始; 所以去吧——开始吧!