- 发布日期:2024-08-20 09:54 点击次数:186
不管您奈何组合数据刘亦菲 ai换脸,配置数据源都需要了解每个表的数据结构以及它们的组合花式。需要议论几个要道身分:
可贵级别:数据的可贵进度 — 其粒度。可将其视为“行的界说是什么?”问题的谜底。规划粒度的可贵信息,请参见构造用于分析的数据分享字段:至少必须有一个可用于在表之间造成衔接的字段。关于集会,这些字段界说集会子句。在规划表中,它们缔造了关系。关联基数:分享字段有些许个独一值(独一性)。规划可贵信息,请参见下一部分。援用齐备性:一个表中的值保证另一个表中具有匹配项。换句话说,一个表中不可有另一个表中莫得相应记载的记载。规划可贵信息,请参见下文。关联基数不错在“性能选项”配置中指定关联基数。规划可贵信息,请参见使用性能选项优化关系查询。
援用齐备性有一个称为援用齐备性的规划意见,这意味着一个表中的行在另一个表中将恒久具有匹配行,由其分享字段的值细则。若是数据库不包含车辆无车牌或车牌或车辆的记载,则这种关系具有援用齐备性。
在 Tableau 中,援用齐备性在关系的每一端配置。在“性能选项”配置中,某些记载匹配意味着莫得(概况您不知谈是否有)援用齐备性。通盘记载匹配意味着存在援用齐备性。默出嫁置是不假设援用齐备性(某些记载匹配)。
规划可贵信息,请参见使用性能选项优化关系查询。
自测您能否界说每个图表的关联基数和援用齐备性?这在笔墨上是什么真谛?
示例:
若是咱们将左表配置为册本,将右表配置为在 AuthorID 上衔接的作家,将图表诊疗为文本:
一册书不错有多名作家(紫色记载在左侧的文籍表中表露一瞥,与右侧作家表中的多札记载相对应)。莫得作家有多本书(右侧的每条作家记载仅指向的一条图通知录)。不存在莫得作家的文籍(左侧莫得记载不可与右侧的记载对应)。有些作家可能莫得文籍(右侧的灰色作家记载在左侧莫得对应的图通知录。)单击底下的每个部分将共伸开。
为什么这很遑急?正确配置关联基数或援用齐备性配置不错通过查询优化进步性能。然而,不正确的配置可能会导致由于数据丢失或访佛而出现团聚问题。默许的“性能选项”配置为对关联基础为“多”,关于援用齐备性为“某些记载匹配”。唯有在细则数据的正确特征时,才应诊疗这些配置。
规划 Tableau 奈那处理每个配置的可贵信息,请参见基数和援用齐备性配置的含义。
Tableau 中的一个示例让咱们来探讨一下当关联基数配置不正确时会发生什么。
小心:以下示例使用Bookshop 数据王人集表子集。您不错 下载职责簿进行操作,也不错下载原始数据以自行创建数据源。使用的表为 Bookshop.xlsx 中的“Books”(文籍)、“Info”(信息)和“Edition”(版块)(只保留一些字段),以及 BookshopLibraries.xlsx 中的“LibraryProfile”(藏书楼长途)和“Catalog”(目次)。
“Book”(文籍)和“Info”(信息)表具有一双一的关系 —“Info”(信息)实质上是“Book”(文籍)表的附加列。因此,诚然它们可能规划,但集会它们以创建包含通盘列的新逻辑表是有益旨的。“Edition”(版块)与这个组合表具有多对一的关系,因为单一文籍可能有多个版块,频繁具有不同的递次。(请小心,下图表露了从“Book+Info”(文籍+信息)表到“Edition”(版块)的关系,因此为一双多。)
“Edition”(版块)与“Catalog”(目次)规划刘亦菲 ai换脸,当作 ISBN 上的一双多关系。“Catalog”(目次)和“LibraryProfile”(藏书楼长途)表在“Library Id”(藏书楼 ID)上具有多对多关系。要道点是,“LibraryProfiles”(藏书楼长途)表的每个库有多个行,每个东谈主员类型(藏书楼员、藏书楼助理、藏书楼时代东谈主员)一瞥。规划这些表的结构的可贵信息,请参见Bookshop 数据集。
正确的配置正确配置“Catalog-LibraryProfile”(目次-藏书楼长途)关系后,咱们不错创建一个浅显的可视化项,表露每个藏书楼对应于多本文籍的职责主谈主员数目。这个要缔造的可视化项有点愚蠢,但它有助于讲明这少许。Idle Hour Library(失业藏书楼)有 130 名职工, 不管咱们驳倒的是哪本书。职工类型有三个值,因此每个以为由三札记载(括号中的数字)构成。
职责主谈主员按藏书楼和书称呼计数。(括号中的数字暗意每个标记中的记载数。)
失实的配置:一双一当关系被失实地配置为一双一时,在可视化项中,“Catalog”(目次)中的每个书名仅与“LibraryProfile”(藏书楼长途)表中的一札记载进行灵验配对(如括号中的记载计数所示)。
职责主谈主员按藏书楼和书称呼计数。(括号中的数字暗意每个标记中的记载数。)
在上头,咱们不错看到每个藏书楼只表露其最少职责主谈主员数目。(请参阅底下的可视化项中的粗体数字。“Staff Count”(职责主谈主员计数)可视化项中响应的数目是最少职责主谈主员数目。
按类型和藏书楼分列的职责主谈主员。
规划关系奈何成为可视化项的高下文集会的可贵信息,请参见 Tableau 博客上的 Tableau 博客中的新数据建模简介(衔接在新窗口中开放)。
失实的配置:集会诚然有宗旨搞定这类问题(可贵级别抒发式是通用的),但集会具有不同粒度或其关联基数为“多”的表可能会导致访佛。在这里,关于唯有一种递次的书名,职责主谈主员计数是准确的,但关于在“Editions”(版块)表中具有两种递次的文籍,传递到职责主谈主员计数的值也会翻倍(请小心,括号中的记载计数为 6 而不是正确的 3)。
职责主谈主员按藏书楼和书称呼计数。(括号中的数字暗意每个标记中的记载数。)
失实的配置:失实地假设援用齐备性在不存在援用齐备性的情况下,奉告 Tableau 存在援用齐备性(通盘记载匹配)可能会导致值丢失。在这里,这两个可视化项是相通的,但右侧的一个来自配置为假设援用齐备性的数据源。阿谁可视化项依然丢失了 null。诚然这在某些情况下可能没问题,但了解这些 null 代表什么相等遑急。此处,若是可视化项表露每个藏书楼中的版块数,则 null 暗意版块表中存在但不属于任何藏书楼的两个版块。这可能是一个遑急的果决,而且失实地假设援用齐备性会忽略这种果决。
浏览职责簿过甚数据源,了解归拢不当的表可能产生哪些其他问题。
性能影响若是这些配置配置失实可能导致数据丢失或访佛,为什么 Tableau 允许改革它们?在许厚情况下,您不错而且应该保留默出嫁置:关联表而不是集会,将关联基数保留为多对多,况兼不假设援用齐备性。超越是在您不细则配置应该是什么的情况下更应如斯。
然而,关联基数和援用齐备性是性能选项,因为可能会对默许值产素性能影响。若是您细则数据的结构,配置正确的配置不错减少查询实施,从而进步速率。
在幕后小心:本节使用与其他数据组合时代类似的时代来仅提供意见框架。它不是规划 Tableau 奈何使用关系性能配置的时代刻画。
关联基数
关系的关联基数会影响团聚的发生时辰。这不错从搀和的角度来议论。数据搀和会安详查询两个数据源。不管其他数据源奈何,每个数据源都会凭据需要团聚到视图所需的可贵级别。关于关系,关联基数配置会影响团聚是在集会之前照旧之后发生。
在上头的示例中,“多”配置暗意在将数据与文籍信息归拢之前对每个藏书楼的职责主谈主员数目进行团聚,从而确保每本书都有正确的数目。当关联基数失实地配置为“一” 时,在将职责主谈主员数目与文籍数据归拢之前不会团聚,从而导致不正确的值。
请小心,不仅会表露不正确的值,通盘值都分拨给职责主谈主员类型“ Librarians”(藏书楼员),尽管它们来自通盘三种职责主谈主员类型。此配置配置失实可能会导致不可展望和不正确的值。唯有在视图中使用来自失实配置的关系另一端的另一个表的字段时,才会发生此结果筛选。
然而,在这些值独一的情况下,若是 Tableau 优化查询,则不错目田移除集会前的团聚。
丁香五色月先锋援用齐备性
尽管援用齐备性是指关系的配置,但不错从集会类型的角度议论它。十足外部集会将保留通盘记载,不管另一个表中是否有匹配项,但会以性能本钱假想。若是您不细则记载是否会丢失,外部集会会更安全。当可能莫得援用齐备性时,这是处理表的花式(某些记载匹配)。
里面集会将仅保留两个表中有匹配项的记载,同期会删除不出当今每个表中的记载。若是您知谈里面集会不会摒除必要的数据,则遵循更高。若是“性能选项”配置为“通盘记载匹配”,则假设援用齐备性,并在不议论不匹配值的情况下实施集会。
不正确的援用齐备性配置可能会对组合数据产生类似筛选器的后果,从而移除不匹配的值。规划保留不匹配记载的功能的可贵信息,请参见 Tableau 博客上的跨多个规划表提倡问题。规划集会类型数据的可贵信息,请参见集会数据。
保留默许值若是您的分析具有可收受的性能刘亦菲 ai换脸,咱们蛮横建议将默许的“性能选项”配置保留为多对多,而不是假设援用齐备性。关系的力量来自于它们凭据分析中使用的表提供准确、高下文符合的结果的本事。改革这些配置会移除关系的语义生动性。