数据分析对所有员工都至关重要,无论您在哪个部门或角色工作。无论您是分析最新活动投资回报的营销人员,还是审查使用数据的产品经理,识别和探索数据趋势和波动的能力都是决策的基本技能。

不幸的是,今天许多公司都在数据组织和分析方面苦苦挣扎。全球调查Splunk发现企业收集的所有数据中有55%是“暗数据”:即收集了但从未使用的信息。有时,公司甚至不知道它已经收集了信息。或者,数据放在那里是因为团队不知道如何分析它。

该调查还发现,76%的高管认为,对现有员工进行数据科学培训,将有助于解决公司的黑暗数据问题。如果员工了解如何分析不同类型的数据,公司将能够更好地利用它收集的信息。

幸运的是,数据分析是一项可以学习的技能。你不需要是一个“数字人”,拥有统计学的高级学位,或者坐着通过数小时的深入培训模块来学习了解如何分析数据.相反,我们将此指南放在一起,帮助您掌握一些基本的数据分析技能——从清理数据、选择正确的分析工具,以及分析模式和趋势,从而能够得出准确的结论和可操作的见解。

定义你的目标

在开始分析数据之前,您需要设定一些明确的目标。如果你不清楚自己在寻找什么,你只会花几个小时盯着电子表格或滚动无数支持票,等待灵光一闪的时刻。

你的目标会因你所在的团队、收集的数据以及你在公司中的角色而有所不同:

  • 财务团队希望通过分析团队费用数据来确定节省成本的机会
  • 营销团队正在寻找通过观察潜在客户活动的变化来提高免费试用转化率的方法
  • 工程团队需要了解有多少客户受到最近服务中断的影响,因此它将查看大量产品使用数据
  • 产品团队需要在产品路线图中确定新特性和bug修复的优先级,因此它将分析您最近的支持列表,以了解对您的客户来说什么是最重要的

这些目标将告诉您收集哪些数据,使用哪些分析工具,以及从数据集中获得的见解。

清理数据并删除不需要的任何内容

你的数据分析只有在开始的时候才有效。如果你得到的信息是不完整的、不准确的或不一致的,那么你从分析中得到的见解将是不完整的或具有误导性的。所以,一旦你收集了你的数据,花些时间来清理它,确保它是一致的,不包括重复的信息。

如果您只查看一个小数据集,您可能会发现在电子表格中手动清理数据是最容易的。首先,在开始分析数据之前,您可以做一些简单的事情来清理数据:

  • 添加标题行,便于理解电子表格中的信息
  • 如果数据集中有相同记录的多个副本,则删除重复的行或列
  • 如果导出数据,请删除不使用的行或列。例如,许多工具将“ID”列或时间戳添加到数据导出中,这在分析中是不会使用的
  • 标准化数据,以便数字、日期或货币等数值都以相同的方式表示

如果您处理的是大量的数据集,那么手动清理这些数据就比较困难(或者至少要费时得多!)。取而代之的是,考虑使用数据清理工具OpenRefine泰伦德加快进程。专用数据清理工具可快速清理杂乱、不一致的信息,以便随时可用。

您还可以实现数据治理战略为你的公司如何管理和组织数据制定明确的指导方针,并减少你在未来清理数据的时间。一些数据治理最佳实践包括:

  1. 为收集数据的时间和方式创建标准流程
  2. 采用标准化命名约定以减少数据中的不一致性
  3. 如果您已经自动化了任何数据收集过程,请注意任何错误消息或不正确的数据。如果看到任何错误消息,请检查设置,诊断导致这些错误的原因
  4. 编辑和更新过去收集的数据,使其符合新的质量标准

清理和标准化数据是分析数据的必要准备步骤。这样你就不太可能根据不一致的数据得出错误的结论,而更有可能得到有用的、有用的见解。

构建您的数据分析工具包

许多公司依靠Excel或其他电子表格工具来存储和分析数据,但有许多不同的平台可以帮助您分析数据。你使用的数据分析工具的类型取决于两件事:

  1. 你正在分析的数据类型。定量数据通常是数值的,这对于在电子表格和可视化工具中表示非常理想。但定性数据——如问卷答案、调查回复、支持票或社交媒体消息——是非结构化的,因此仅通过电子表格很难得出有用的见解。你需要一种方法来分类或组织你的定性数据,以便能够有效地分析它。
  2. 你正在分析的数据量。如果每周或每月只分析一个小数据集,则可以手动分析信息。但是,您处理的数据越多,就越有可能需要投资于自动化数据收集和分析过程的工具。这些平台将减少人为错误的可能性并加快分析过程。

下面是一些建议的工具,可能会对您的数据分析工具包有用。当然,在每次分析数据时,您可能不会使用所有这些方法,因为每种方法都适合于特定类型的数据。

  • 电子表格像Excel或谷歌表格是检查数据的传统工具。它们非常适合分析中小批量数据,而不需要深入的技术知识
  • 商业智能(BI)工具那些需要收集和分析大型数据集以发现趋势、模式和见解的公司会使用这些数据吗
  • 预测分析工具使用公司的历史数据和机器学习预测绩效变化将如何影响未来结果
  • 数据建模工具表示信息如何在各种业务系统之间流动和连接。公司使用数据建模工具查看哪些部门持有哪些数据以及这些数据集如何交互
  • 部门特定分析工具由业务不同领域的团队使用,以分析特定于其角色和职责的数据。例如,人力资源部门需要跟踪大量人员数据,如工资单、绩效和敬业度数据,因此ChartHop会比电子表格更容易使用吗
  • 数据可视化工具用图表、图形和其他图形表示信息,以便更容易发现数据集中的趋势

选择能够帮助您快速分析数据集并提取难以找到的见解的工具。

你的数据是干净的,你设置了各种各样的工具。现在,可以开始数据分析过程了。

首先,在你的数据集中寻找趋势。如果您的大部分数据是数值的,那么在图表和其他可视化图形上绘制模式就相对容易。但如果您有非结构化数据,如电子邮件或支持票,您可能需要一种不同的方法。如果你的信息不能很好地放入电子表格中,你可以尝试以下几种数据分析方法:

  • 文本分析使用机器学习从非结构化文本数据(如电子邮件、社交媒体消息、支持票证和产品评论)中提取信息。它涉及检测和解释这种非结构化数据中的模式。示例文本分析工具:主题的,再保险:推断
  • 情绪分析使用机器学习和自然语言处理检测非结构化文本数据中的积极或消极情绪。公司经常使用情感分析来衡量品牌在社交媒体信息、产品反馈和支持票中的感知。情感分析工具示例:IBM华生,MonkeyLearn
  • 主题分析使用自然语言处理将预定义标签分配给自由文本数据。它对于组织和结构化文本数据很有用。例如,您可以使用主题分析对支持反馈进行分类,以帮助您了解公司或产品的哪些领域给客户造成的问题最多。示例主题分析工具:Datumbox,MonkeyLearn
  • 断代分析包括在特定时间段内检查类似客户组内的数据。您可以查看同月注册您的产品的客户的产品使用情况的变化。实例队列分析工具:电子表格,美人

当你发现模式时,不要假设相关性意味着因果关系。例如,如果你在看到产品注册量大幅上升的同时,看到社交媒体关注者大幅增加,你可能会认为你所有的新用户都来自社交媒体。但如果你看看谷歌分析中的源跟踪数据,你会发现很少有人通过社交媒体访问你的网站——更不用说注册你的产品了。

假设两件事之间的相关性意味着其中一件导致了另一件错误的因果关系,这是人们在分析数据时最常犯的错误之一。通常还有另一个因素在起作用,导致你发现的趋势,所以花时间收集足够的证据,确保你的见解是准确的。

如果您发现在数据中识别趋势和模式很困难,可能是因为您是孤立地查看数据。你无法发现随着时间的推移而发生的变化,因为你所看到的只是你表现的单一快照。您所忽略的是上下文:您当前的数据与以前的时间框架相比如何。

将你当前的数据与过去的表现进行比较,将你的发现与上下文联系起来。但如果这是不可能的——例如,如果你正在查看一个全新产品功能的使用数据,或者你刚刚开始分析你的支持性能——那么你可能会发现查看行业基准是有帮助的。

您可以找到不同公司、部门和行业的性能基准。通常,在谷歌上快速搜索“[部门]性能统计”或“[行业][部门]统计”,就会发现有用的性能基准。另外,在会议上发表的行业出版物和研究是寻找基准数据的好地方。

例如,Zendesk基准允许公司将其客户支持绩效数据与其所在行业的平均值进行比较:

截图2021-07-06 11.56.53.png

Zendesk基准是一个基准数据示例,您可以将其与支持团队的性能数据进行比较,从而将您的性能置于与您所在行业相关的上下文中。

需要注意的是:如果您使用的是基准数据,那么可能很难找到与您规模或阶段相似的公司。因此,请记住将这些数字用作参考点,而不是直接将您的绩效与这些基准进行比较。

寻找与你预期相反的数据

当你开始分析你的数据时,你设定了清晰的目标和期望,你想要学习什么,你希望发现什么见解。但这可能会导致确认偏差,你更有可能注意到支持你现有假设或假设的趋势。

保持开放的心态,寻找与预期相反的趋势或数据点。您还应该在原始数据中查找异常值。这种做法将帮助你避免挑选支持你现有信念的发现。

如果您在数据中发现异常,您应该进一步调查它们,因为可能有一个简单的解释。例如,如果你的营销团队发送了一份时事通讯,但你没有看到任何网站流量,这可能是他们将其发送到内部测试列表,或者他们忘记添加UTM参数到通讯中的链接。

你还应该看看你的数据中有多少异常值扭曲了你的结果。显著的异常值很容易扭曲数据中的平均值,所以您可能需要跟踪中值而不是平均值。中位数使用数值数据集的中间值,所以它较少受到离群值的影响。或者,您可能需要从您的分析中完全忽略这些离群值。

可视化数据并解释结果

当数据以可视化的方式而不是电子表格的形式呈现时,通常更容易理解和解释数据。使用这样的工具谷歌Data Studio以图表、图形或其他图形表示您的数据,以便您可以向其他团队成员清楚地解释您的结果。

如果您使用的是大型数据集,不要试图在可视化中一次传递太多信息。简单的图表使查看者更容易理解您的信息和数据中的结果。我们已经整理了一系列的数据可视化的提示以帮助您更清楚地表达您的数据发现。

您还可以使用Geckoboard等工具将数据显示在仪表板上,团队中的任何人都可以随时查看。Geckoboard的发送到松弛通过集成Slack,可以很容易地与团队分享仪表盘,从而获得更大的可视性,因此即使在远程团队中,你也可以分享最新的数据见解。这个特性对于通过定期发送自动更新来保持关键指标的重要性特别有用。

与数据可视化一样,仪表板的设计方式将影响它对团队的有用程度。我们的仪表板设计指南将帮助您创建清晰地传达关键指标的仪表板,并让您的团队对您当前的性能数据有一个一目了然的了解。

下一步:分析数据后要做什么

如果你对自己形成的见解不采取任何行动,那么收集和分析所有这些数据是没有意义的。利用你的发现:

  • 设定现实的目标和kpi基于您当前的性能数据
  • 提高你的客户体验,因为你的分析可以让你更好地理解客户的需求和行为
  • 根据对产品使用情况和支持票证的分析,就产品路线图中的优先级做出数据驱动的决策
  • 做出更明智、更自信的业务决策,因为你将清楚地了解什么是有效的,什么是无效的

虽然数据分析可能是一项耗时的任务,但重要的是要记住,这不是最终目标。你正在分析数据,以便能够做出明智的决定。