当前位置:首页  >  数据可视化专题  > 

桑基图是什么?如何利用桑基图进行用户路径分析可视化?

作者:FineBI

发布时间:2024.2.4

浏览次数:581 次浏览

探索复杂用户路径和行为是提升业务决策的关键一环。在这个信息时代,桑基图作为功能强大的可视化图表之一,其独特之处在于它能通过图形化展示流量/用户在网站或应用中的流动路径,清晰呈现不同步骤之间的转化和流量分布,为用户路径分析提供了直观而深入的洞察。

在本文中,我们将深入介绍什么是桑基图,并利用BI工具,为你展示如何通过可视化用户路径进行深度分析,为数据背后的故事揭开新的面纱。

什么是桑基图?

桑基图(Sankey diagram)是一种图表类型,通过直观的节点和连接线,清晰呈现用户在不同步骤之间的迁移和流量分布。每个节点代表特定的页面或操作,而连接线的宽度则反映了用户从一个节点到另一个节点的流量量。

桑基图的主要特点包括:

  • 节点(桑基图中的矩形): 代表系统中的各个阶段或部分,它们的大小通常与其所代表的数量或数值成正比。
  • 连接线(箭头): 表示物质、能量或信息的流动路径,箭头的宽度通常与流量的量级成正比。
  • 宽度(或颜色)表示量级: 桑基图通过连接线的宽度或颜色来表示流动的量级,这使得用户可以直观地比较不同阶段之间的相对流量。

这种直观的图表形式使得分析师和决策者能够轻松理解用户在整个体验过程中的行为轨迹,从而深入洞察用户路径的关键节点和潜在的瓶颈。

如何利用桑基图进行用户路径分析可视化?

为了更好地为您解答这个问题,我们将利用一则玩具品牌对用户流入流出分析的案例,为您系统地展示桑基图的作用,以及FineBI是怎么通过桑基图,实现对用户路径的数据分析需求。

案例背景

某商场入驻了多家玩具品牌,导致A品牌最近的用户数量有些许下滑,A品牌想知道自己家的用户流失去了哪里?

分析思路

现在,让我们深入拆解这个问题:A品牌的用户都流失去了哪里?

站在上帝视角,我们可以采用MECE原则(相互之间穷尽且不重叠)对用户进行分组,分为两大类:继续在商场交易的用户和不再在商场交易的用户。接着,针对每个大类,进一步进行拆解和细分。

用户流向

在这个分析过程中,我们发现不再在商场继续交易的用户数据难以收集,因此A品牌的可分析用户范围被框定在“继续在商场交易”的用户内。在这一群体中,我们将其进一步分为两类:

  • 第一类:A品牌的复购用户,持续在商场交易,并选择购买A品牌商品;
  • 第二类:A品牌的流失用户,流失到了本商场的其他竞争品牌。

深入分析后,我们需要从用户行为的角度思考第二个问题:用户的购买行为路径通常有哪些?

举例来说,比如Kitty是A品牌的会员,被小红书种草了B品牌,决定尝试购买。然而,使用B品牌后发现其质量不尽如人意。此时,Kitty面临三个选择:

① 换回A品牌;

② 继续尝试其他品牌;

③ 暂时放弃购物,待以后再考虑。

这构成了一个用户的典型购买行为链路。在这三个选择中:

① A – B - A,是消费行为路径最为简单的一种;

② A – B - C/D…,路径次之;

③ A – B - 空 - A/C/D…,路径最为复杂。

为了清晰展示这种“流动关系”,我们制作了桑基图,以直观呈现用户在不同品牌之间的转换和购物路径。

流动轨迹

在桑基图中,线的方向代表流向,而线的粗细则代表流量的多少,且始末端的分支宽度总和相等,保持能量的平衡,非常适用于用户流量等数据的可视化分析。

分析实操

前面我们详细梳理了分析思路,接下来将手把手实操一遍,展示具体的分析步骤。

首先,我们需要明确定义流失用户数的统计口径:在分析周期内,如果用户的首次交易品牌是A品牌,而最后一次交易品牌却变为非A品牌,那么我们将这样的用户定义为A品牌的流失用户。从顾客人数的角度,我们将统计这一类用户的去重人数。

1)数据处理

让我们来深入解析桑基图的构成要素,因为桑基图的目的在于展示流向,即从何处(起点)流向何处(终点),流动量有多大(流量)。我们可以用点、线、面这三个元素来概括其中的关键要素:

  • 点:即流向的起点、终点(维度);
  • 线:起点、终点之间有流量(隐性约束条件);
  • 面:流量多大?流量越大,线的面宽越宽(指标);

插图

为了满足制作桑基图的需求,我们需要创建两个自助数据集。第一个数据集包含两个字段:会员ID和最早交易品牌。第二个数据集是最终的分析表,包含三个字段:会员ID、最早交易品牌、最晚交易品牌。

数据集①:最早交易品牌

最早交易品牌

数据集②:最终分析表

最终分析表

这两个数据集提供了我们需要的两个维度(最早交易品牌和最晚交易品牌)以及一个指标(去重会员数),使得我们可以基于这些数据制作桑基图,直观地展示A品牌的客户流失路径。

下面逐步来看:

FineBI6.0的【我的分析】中新建分析主题。

第一步:制作数据集①

1.1 数据导入

弹出【选择数据】框,将Excel数据导入

数据导入

数据样例:

数据样例

1.2 计算最早交易品牌后分组汇总

新增公式列:最早交易品牌:IF(交易时间=DEF(MIN_AGG(交易时间),会员id),品牌,"")

操作实例

1.3 过滤,最早交易品牌非空

操作实例

第二步:制作数据集②

2.1 数据导入(同上面第一步1.1,不再赘述)

2.2 计算最晚交易品牌后分组汇总

新增公式列:最晚交易品牌:IF(交易时间=DEF(MAX_AGG(交易时间),会员id),品牌,"")

插图

插图

2.3 过滤,最晚交易品牌非空

2.4 左合并,将最早交易品牌合并进表内,用会员ID连接

此步需要注意多对多,此案例内数据有膨胀,因为真实的业务场景中存在这种情况且数据样本较小,故此处未做特殊处理,数据量大的时候,不建议用多对多。

操作实例

2)仪表板设计

第一步:选择桑基图

图表类型

第二步:制作桑基图

1.1 将 “最早交易品牌”拖入图形属性中的【起点】,“最晚交易品牌”拖入 【终点】;

制作桑基图

1.2 添加计算字段,用于计算去重会员数:

计算字段

1.3 将“会员数”拖入图形属性中的【大小】

将“会员数”拖入图形属性中的【大小】

1.4 调整颜色,将“最早交易品牌”拖入【颜色】设置框,可自定义调节

调整颜色,将“最早交易品牌”拖入【颜色】设置框,可自定义调节

1.5 显示标签,将“最早交易品牌”、“最晚交易品牌”、“会员数”拖入标签框(可根据自己的需求,自行选择想要展示的标签)

显示标签,将“最早交易品牌”、“最晚交易品牌”、“会员数

最终呈现的效果如下:

最终呈现的效果

结语

通过这个案例,我们深入剖析了A品牌客户流失的路径,以及如何利用桑基图可视化图表清晰展示用户在不同品牌之间的转换和购物路径。这个过程不仅强化了分析逻辑的理解,还锻炼了构建数据结构的能力。

这个案例的挑战点在于理清分析逻辑和构建数据结构,特别是桑基图的起点和终点的定义。然而,正如俗话说:“纸上得来终觉浅”,只有亲自动手,按照分析思路和教程的步骤实践,才能真正领会其中的深意。

希望通过这篇文,能够帮助您更深入地理解物流数据分析的方法和技巧,为业务决策提供更有力的支持!

在数字化与信息化高速发展的时代,FineBI——市场占有率第一的BI数据分析软件,旨在帮助企业的业务人员充分了解和利用他们的数据,加速企业数字化转型,提升市场竞争力。得益于FineBI强劲的大数据引擎,用户只需简单拖拽便能制作出丰富多样的数据可视化信息,自由地对数据进行分析和探索,让数据释放出更多未知潜能。 点击下方图片免费试用!

插图

商业智能BI产品更多介绍:www.finebi.com


   

商务咨询

在线咨询
专业顾问帮您解答问题

电话咨询

技术问题

投诉入口

微信咨询