Tableau Playbook - 热图
介绍
Tableau 是当今最流行的交互式数据可视化工具。它提供了各种各样的图表,可让您轻松有效地探索数据。本系列指南 - Tableau Playbook - 将向您介绍 Tableau 中各种常见图表。本指南将重点介绍热图。
在本指南中,我们将按照以下步骤了解热图:
我们将从一个示例图表开始,介绍它的概念和特征。
通过分析一个真实的数据集:英国各行业的就业变化,我们将学习如何一步步绘制热力图,同时通过 Tableau 可视化得出一些结论。
介绍相关图表,并对文本表格变体进行比较。
入门
例子
这是Adam Crahen创建的热图示例。他是The Data Duo的联合创始人,也是Pluralsight的作者。
下面的示例是“One More Light”歌词的视觉呈现。
在此热图中,每个单元格代表歌曲中唱出的一个单词。它使用大小和颜色比较单词。
概念与特征
热图是使用大小和颜色比较分类数据的有效方法。
具体来说,在 Tableau 中,我们可以在热图中比较至少一个维度上的一个或两个度量。通常,它不需要文本来辅助呈现数据。
通过热图可视化,我们能够比查看表格的原始数据更快地识别模式或相关性。它还具有很高的可扩展性,这意味着可以在单个图表中显示大量数据。
另一方面,与高亮表类似,热图限制了维度的数量,并且很难在大量数据中区分出细微的差异。
热图 vs. 突出显示表 vs. 热图
当你 Google “热图” 的时候,你会看到很多完全不同的图表。按照Tableau 的定义,我们可以粗略地把它们分为三类:热图、高亮表和热图。
这三张图表如下所示:
它们都是将度量和维度一起表示的出色视觉形式。简单易懂使它们成为强大的数据表示模式。
然而,它们确实有一些区别,但指的是同一个词:“热图”:
热图使用大小和颜色。如果只有一个度量,Tableau 将分配大小而不是颜色。它们中的大多数没有标签。
突出显示表仅使用颜色,并且适用于带或不带标签的情况。方形单元格形式也很流行。正如 Katie Wagner 的帖子所提到的:
由于颜色的强度或“热度”,突出显示表被许多 Tableau 可视化人员错误地称为“热图”。
我认为这是因为在 Tableau 中,热图(1 或 2 个度量)是一个更通用的概念,其中包含突出显示表(1 个度量)。您可以将突出显示表视为热图的一种特殊形式。
Tableau 2018.3 发布的热图采用密度标记类型。这大概就是大多数人想象中的“热图”的样子。这个名字来自官方发布,可能是因为它的形状像地图,颜色编码也类似。但确实很容易与现有的定义混淆。
我认为,如果我们在 Tableau 中谈论“热图”,我们应该遵守上述规则,因为官方有定义。但在更广泛的范围内,我们不必拘泥于这些概念,只要弄清楚别人想表达什么就行。例如,相关性分析中的热图(correlation heatmap)更像是高亮表。
其实我并不想这么大腹便便,我只是想做一些工作,让和我一样好奇、有疑惑的读者明白过来。
数据集
在本指南中,我们使用了英国各行业就业变化数据集。感谢EMSI(经济建模专家公司)提供此数据集。
该数据集包含 2011 年和 2014 年英国各城市按行业划分的就业数据。1 位数字表包含按行业级别汇总的数据。
我们将分析按行业、按城市划分的就业岗位分布情况,并重点关注受这些因素影响,2011年至2014年就业岗位的变化情况。
过程
构建热点图的过程与高亮表类似:
单击“显示我”并查看热图的请求。
对于热图,尝试 1 个或多个维度、1 个或 2 个度量。
从Show Me选项卡中我们可以看到,要构建热图,我们至少需要一个维度和一两个度量。所以我们按住 Control 键( Mac上为Command键)同时选择“城市”、“行业”、“变化百分比”和“2011 年就业”,然后在Show Me中选择“热图” 。Tableau 会自动生成原始热图。由于图表的属性不对称,自动分配的属性可能会混乱,例如Columns和Rows、Color和Label。因此我们可能需要做进一步的调整。
或者,我们可以手动构建热图:
- 将“城市”拖入列架。
- 将“行业”拖到“行”架中。
- 选择方形作为标记类型。这是热图最常见的类型。事实上,我们可以选择其他类型,例如圆形(如上例所示)、条形,甚至是自定义的形状。
- 将“% 变化”拖入标记-颜色。
- 将“Jobs 2014”拖到标记-大小中。
编辑尺寸以获得更好的视图:
- 单击尺寸图例中的倒三角形并选择编辑尺寸...。
- 首先我们分析一下职位数量的分布情况,除了伦敦的职位数量比较多以外,其余大部分职位数量都在10万以下,因此为了更好的区分大小,我们可以将大小范围设置为0-100,000:在编辑大小对话框中将起始值设置为0,将结束值设置为100,000 。
- 展开标记中的尺寸卡,并滑动调整至更合适的尺寸。
转换成发散和阶梯状的颜色,以更清楚地区分正值和负值:
单击标记中的颜色卡或单击图例中的倒三角形,然后选择编辑颜色...
我们要区分增长和衰退,所以我们选择发散的颜色:在调色板中选择橙色-蓝色发散。
这里值得一提的是,橙蓝比红绿要好。因为尽管橙蓝需要花费一些学习成本,但它对红绿盲更友好。
我们发现一些正值和负值都是灰色的,因为它们位于这种发散色谱的中间。阶梯式颜色可以解决这个问题,因为它将值分组到统一的颜色箱中:选中阶梯式颜色并将步数设置为 8。
通过分析作业变化率的分布,为了更好的进行颜色区分,我们将颜色范围设置为-60%-100% :展开高级选项,将开始设置为-0.6,将结束设置为1。
由于热图没有标签,我们最好添加一个友好的工具提示,以防用户需要更详细的信息。
- 添加 2011 年的工作以供比较:将“2011 年的工作”拖入标记-工具提示。
- 单击标记中的工具提示卡进行编辑。
- 在工具提示对话框中编辑:单击插入并选择“SUM(Jobs 2011)”。
- 单击“预览”查看工具提示。
进行最后的修饰:
- <font style="vertical-align: inher
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~