将数据导入 Tableau
介绍
“Tableau 可以帮助任何人查看和理解他们的数据。连接到几乎任何数据库,通过拖放创建可视化效果,单击即可共享。” - 来自 www.tableau.com。因此,要查看和理解 Tableau 中的数据(更具体地说,要充分利用 Tableau 的全部功能),首先,Tableau 中应该有一些数据。本指南将明确定义用户如何将来自各种来源的数据导入 Tableau。
从 Microsoft Excel 导入
下面是 Tableau 打开时的样子。
要从 Excel 文件导入数据,首先,单击“连接”选项卡下的“Microsoft Excel”。它将打开一个对话框,您可以在其中导航到计算机中要从中导入数据的 Excel 文件。然后,单击该文件并单击“打开”。如果您的 Excel 工作簿中有多个工作表,则所有工作表都将自动导入,并将它们列为 Tableau 左侧面板上的工作表。
请记住,您在 Excel 中编写的任何公式都不会导入到 Tableau 中。此外,Tableau 会查询文件中的数据并仅导入数据。因此,如果源文件中的任何数据更新,则每次修改数据时都需要刷新连接以使数据在 Tableau 中保持最新。另外,请记住 Tableau 不支持 Excel 中的数据透视表。在这种情况下,文件扩展名将是.xls和.xlsx。
要将更多数据(可以来自任何来源)添加到现有工作簿中,只需单击左侧窗格中连接旁边的“添加”即可。有时 Tableau 建议在导入数据时使用内置数据解释器。无需担心;它只会格式化数据。添加更多数据和使用数据解释器是从任何来源或文件格式导入数据时最常用的两个步骤。
从文本文件导入
前几个步骤与从 Microsoft Excel 导入数据类似。单击“文本文件”后,导航到要导入的文件,单击“打开”,文本文件中的数据将被导入。最常用的文件格式是.txt、.csv、.tab、.tsv。
从文本文件导入时,最重要的属性是分隔符。要更改属性,首先,单击文本文件中的“选项”,将出现一个下拉菜单,然后选择“文本文件属性”,如下所示。
从菜单中,您可以编辑字段分隔符、文本限定符、字符集和区域设置。字段分隔符是我们的分隔符。字符集是用于对文本文件进行编码的编码。在大多数情况下,Tableau 会自动检测这些值。只有在某些情况下,您才需要编辑这些值。
从 JSON 文件导入
如果您还不熟悉 JSON,请参阅JSON Wikipedia 文章。从 JSON 文件导入数据重复了其他格式的前两个步骤。首先,单击“连接”下的“JSON 文件”,导航到文件的位置,然后选择文件,然后单击“打开”。Tableau 将提示您选择要分析的架构级别,因此请选择所需的级别并单击“确定”。
从 JSON 文件导入数据与从其他格式导入数据略有不同,尤其是从大型 JSON 文件导入数据时。因此,导入 JSON 文件时,Tableau 只会扫描 JSON 文件的前 10,000 行并从这些行中检测架构。因此,如果您注意到检测到的架构中缺少任何字段,您可以选择扫描整个文件,这可能需要相当长的时间,具体取决于文件大小。此外,请记住,JSON 文件的架构级别越多,Tableau 加载数据所需的时间就越长。
单个 JSON 对象不能超过 128 MB。 此外,JSON 文件不支持 pivot 选项。
从 PDF 文件导入
传统上,数据不会存储在 PDF 中,但 PDF 文件的连接器存在是有原因的。数据本身可能不会存储在 PDF 中,但数据可能会与其他内容一起打包并全部存储在 PDF 中。最好的例子就是研究论文。大多数研究论文都会以某种方式包含数据,以巩固所提出的理论。
前两个步骤再次重复,单击“连接”下的“PDF 文件”,导航到文件的位置,然后选择文件,并单击“打开”。现在会出现一个对话框,提示您输入所选 PDF 文件中要扫描的页面。
您可以选择扫描整个文档、单个页面或指定某个范围的页面。请记住,扫描大型文档中的所有页面可能非常耗时。扫描页面后,Tableau 会自动使用唯一名称命名表并将其列在左侧导航栏中。如果 Tableau 提示使用数据解释器,最好使用它来轻松清理数据。确保验证 Tableau 在您的 .pdf 文件中识别的表中的数据,因为有时由于格式不同,Tableau 可能无法正确检测您的数据。当一个表存在于 PDF 中的多个页面中时,Tableau 会为每个页面中的数据创建一个新表,因此要对整体进行处理,必须合并所有这些表。
Tableau 无法连接文件名包含 Unicode 字符的 PDF 文件。Tableau 无法扫描受密码保护的 PDF 文件。
结论
如果使用得当,Tableau 是一款非常强大的工具。上述连接器是 Tableau 最常用的一些连接器。除此之外,Tableau 还可以连接到统计文件、空间文件、Rdata 文件等。在数据库和云存储系统方面,大多数流行的连接器都有,例如 Amazon Redshift、Cloudera Hadoop、Dropbox、Google Drive、Microsoft SQL Server、MongoDB BI Connector、MySQL、OneDrive、Oracle、PostgreSQL、Salesforce、Teradata 等等。这里的重点是,将任何类型的数据导入 Tableau 几乎没有任何限制。祝您导入数据顺利。
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~