数据分析

最近有个朋友问我,说他刚转岗产品经理,老板让他做一个数据分析报告,他一脸懵逼。
手里一堆数据,不知道从哪下手。
看了几篇文章,全是讲SQL和Python的,越看越慌。
我说兄弟,你方向搞错了,工具不是第一步,数据分析思维才是。
所谓数据分析思维就是怎么用数据去思考问题。
而这个,恰恰是大多数产品经理最缺的东西。
所以今天,给大家拆解一下,数据分析到底应该怎么入门。

一. 数据指标

数据本身只是数字,而指标才是用来衡量业务好不好的统一标准。
产品经理日常接触最多的指标,大概可以分成三大类。

1. 用户数据指标

日新增用户数:你的产品每天来了多少新人。如果按渠道拆解,还能看出不同推广渠道的效果。
活跃率:活跃用户占总用户的比例。注意去重,同一个人一个月活跃30次,月活跃人数也只算1个。
留存率:新用户过了一段时间还会回来的比例。Facebook有一个著名的40-20-10法则:次日留存40%、第7日留存20%、第30日留存10%,能达到这个水平就算相当不错了。
留存率为什么这么重要?因为它直接反映了你的产品对用户有没有粘性。留存低,就说明用户来了之后觉得没意思,跑了。

2. 行为数据指标

PV(访问次数)和UV(访问人数):通过比较不同页面的PV和UV,就能看出用户喜欢哪个功能、不喜欢哪个功能。
转化率:完成目标行为的人数 ÷ 到达的总人数。比如店铺转化率 = 购买人数 / 到店铺的人数。
K因子:K = 平均每个用户邀请人数 × 被邀请人的转化率。当K>1时,你的产品就会像滚雪球一样自增长。拼多多早期就是靠这个逻辑起来的。

3. 产品数据指标

总量指标:成交额、成交数量、访问时长。
人均指标:人均付费(ARPU)= 总收入 / 总用户数;付费用户人均付费(ARPPU)= 总收入 / 付费人数。
付费指标:付费率 = 付费人数 / 总用户数;复购率 = 消费两次以上的人数 / 付费人数。
复购率反映的是用户愿不愿意反复买你的东西。一个复购率很低的产品,要么是品质不行,要么是运营没跟上。

二. 不同行业常用数据指标

上面讲的是通用指标,但不同行业关注的重点差别非常大。
你做电商和做社交产品,盯的数字完全是两回事。
下面我按7个常见行业,把各自最核心的数据指标拎出来。

1. 电商行业

电商的核心逻辑就一个公式:GMV = 流量 × 转化率 × 客单价
围绕这个公式,最常盯的指标:
  • GMV(成交总额):最直观的业务规模指标
  • 转化率:从浏览到下单的比例,电商的生命线
  • 客单价:每个订单的平均金额
  • 加购率:看了商品之后加入购物车的比例
  • 退货率:退货订单数 / 总订单数,品质和预期管理的晴雨表
  • 复购率:老客户愿不愿意反复买,决定了你的长期生存能力
电商人天天挂在嘴边的就是"人货场",而这些指标就是"人货场"的数字化翻译。

2. 社交产品

社交产品最怕的不是没人来,而是来了之后没人说话。
  • DAU/MAU:日活和月活,社交产品的基本盘
  • DAU/MAU比值:这个比值越高,说明用户粘性越强。微信这个比值接近0.8,非常恐怖
  • 人均使用时长:用户每天花多少时间在你的产品上
  • 消息发送量:用户之间的互动频次
  • 关系链密度:平均每个用户有多少好友/关注,关系链越密,用户越难离开
  • 内容发布率:有多少比例的用户会主动发内容,而不只是潜水
社交产品有个铁律:用户在产品里建立的关系越多,迁移成本越高,留存就越好。

3. 内容/媒体行业

内容平台靠的是注意力经济,核心就是让用户看得多、看得久。
  • 内容消费时长:用户花了多少时间看你的内容
  • 完播率/完读率:一篇文章或一个视频,有多少人看完了
  • 互动率:点赞、评论、收藏、转发的比例
  • 内容分发效率:每篇内容平均能触达多少用户
  • 创作者活跃度:有多少创作者在持续产出内容
  • 推荐点击率(CTR):推荐给用户的内容,有多少被点击了
抖音为什么这么上瘾?因为它的推荐CTR和完播率优化得极其变态,每一条视频都在精准命中你的兴趣点。

4. SaaS/B端产品

B端产品跟C端最大的区别是:获客成本高、决策链路长、但一旦留住就是长期收入。
  • MRR/ARR:月度/年度经常性收入,SaaS的命根子
  • 客户获取成本(CAC):获取一个付费客户平均要花多少钱
  • 客户生命周期价值(LTV):一个客户在整个合作周期内能贡献多少收入
  • LTV/CAC比值:大于3才算健康,说明你赚的钱是获客成本的3倍以上
  • 客户流失率(Churn Rate):每月有多少客户不续费了
  • NPS(净推荐值):客户愿不愿意推荐你的产品给别人
SaaS行业有句话:留住老客户比拉新客户便宜5倍。 所以Churn Rate往往比新签客户数更让老板睡不着觉。

5. 金融行业

金融行业的数据指标有个特点:风险和收益必须同时看,只看一边就是耍流氓。
  • AUM(资产管理规模):管了多少钱,是金融机构实力的直接体现
  • 不良贷款率:贷款中有多少比例出了问题,风控的核心指标
  • ROE(净资产收益率):股东投入的钱赚了多少回报
  • 获客成本(CAC):金融产品获客成本通常比互联网产品高得多
  • 人均资产:每个客户平均贡献的资产规模
  • 逾期率:按时还款的比例,信贷业务的生死线
银行为什么那么在意你的征信?因为逾期率哪怕上升0.1个百分点,乘以几千亿的贷款规模,就是几个亿的损失。

6. 游戏行业

游戏行业可能是把数据分析用得最极致的行业之一。
  • 次日留存/7日留存/30日留存:游戏行业对留存的要求比其他行业更严格
  • ARPU和ARPPU:人均付费和付费用户人均付费,衡量游戏的"吸金能力"
  • 付费率:有多少比例的玩家愿意掏钱
  • LTV(生命周期价值):一个玩家从开始玩到流失,总共花了多少钱
  • 在线时长:玩家每天玩多久
  • 关卡通过率:哪些关卡太难导致玩家卡住流失了
游戏行业有个经典判断标准:次日留存低于30%,这款游戏基本就凉了。 因为获客成本收不回来。

7. O2O/本地生活

本地生活行业的特殊之处在于:线上和线下两条腿走路,缺一不可。
  • 订单量:最基础的业务规模指标
  • 客单价:每笔订单的平均金额
  • 配送时长:从下单到送达的时间,直接影响用户体验
  • 骑手/服务人员效率:每个骑手每小时能完成多少单
  • 商户活跃率:平台上有多少商户在持续经营
  • 区域渗透率:某个区域的潜在用户中,有多少成为了你的用户
美团为什么能赢?不只是因为用户多,而是它把配送时长优化到了极致。用户觉得快,就愿意继续点;商户觉得单多,就愿意继续开;骑手觉得效率高,就愿意继续跑。这是一个三方飞轮。

三. 北极星指标

指标这么多,到底该看哪个?
这就涉及到一个关键概念——北极星指标
北极星指标就是衡量你当前业务最核心的那个指标。就像天上的北极星一样,指引全公司往同一个方向努力。
Instagram的北极星指标是照片分享率
Facebook早期的北极星指标是月活跃用户数
喜马拉雅的北极星指标是用户收听时长
你看,不同产品、不同阶段,北极星指标是完全不一样的。没有标准答案,关键是你要想清楚——现阶段对业务最重要的那个数字是什么
而且好的指标应该是比例,不是绝对值。
比如你说"这个月销售额100万",听起来不错,但如果不知道上个月是多少、行业平均是多少,这个数字就是个孤零零的数字,啥也说明不了。
把它除以一个总数,换算成比例,才能看出真正的业务状况。

四. 指标体系

光有北极星指标还不够,你得围绕它建立一整套指标体系
怎么建?三步走。
第一步,明确一级指标。
一级指标就是评价业务最核心的那个指标,通常是业务流程最终的结果。
比如某旅游公司的会员积分业务,一级指标就是"积分抵扣金额"。
第二步,拆解出二级指标。
具体怎么拆,要看业务是怎么运营的。
比如"积分抵扣金额"可以从订单维度拆:积分抵扣金额 = 抵扣订单数 × 平均订单抵扣金额。
也可以从会员维度拆:积分抵扣金额 = 抵扣会员数 × 人均抵扣金额。
第三步,梳理业务流程,找到三级指标。
继续往下拆,找到每个环节可以监控的具体指标。
这样一级、二级、三级的结构,就形成了一个指标体系金字塔
这里有几个容易踩的坑:
  • 没有一级指标,抓不住重点。 报表上花花绿绿一大堆,但没有最核心的那个数字。
  • 指标之间没有逻辑关系。 不按业务流程建立指标,出了问题找不到对应的环节。
  • 拆解的指标没有业务意义。 销售部门最关心的是目标达成率,你拆了一堆用户年龄性别分布,跟业务目标完全无关。
  • 一个人闭门造车。 指标体系不是数据部门一个人能搞定的,必须跟业务部门、开发部门紧密协作。

五. 分析方法

有了指标,接下来就是怎么分析。
我把常用的分析方法按"你想解决什么问题"来分类,这样更好记。

1. 想把复杂问题变简单?用逻辑树

逻辑树就是把一个大问题,像树枝一样不断拆解成小问题。
比如"销售额为什么下降"——拆成流量、转化率、客单价,再继续拆,直到找到那个出问题的环节。
这就像看病一样,先确定是头疼还是肚子疼,再往下查具体原因。

2. 想多角度分析?用多维度拆解

这个方法的核心就一句话:把整体拆成部分看
因为整体数据有时候会骗人。
有个著名的辛普森悖论:整体看起来是A好,但分组看每一组都是B好。
比如两家医院,整体治愈率A医院更高。但如果按重症和轻症分开看,每一类都是B医院治愈率更高。为什么?因为B医院接收了大量重症患者,拉低了整体数据。
所以分析数据的时候,一定要从多个维度去拆解。
怎么拆?两个方向:
从指标构成拆——比如用户 = 新用户 + 老用户;销售额 = 新用户销售额 + 老用户销售额。
从业务流程拆——按渠道、地域、性别、时间等不同维度去看每个环节的表现。

3. 想做对比?用对比分析法

没有对比就没有伤害,数据也是一样。
和自己比——跟上个月比、跟去年同期比(同比和环比)。
和行业比——你的转化率是5%,行业平均是8%,那你就知道自己差在哪了。
这里有一个重要的注意事项:比较对象的规模要一致
比如你比较两个地区的销售额,但A地区有50家店,B地区只有10家店。直接比总额没有意义,得算单店平均销售额才能公平比较。
对比分析最经典的应用就是A/B测试——把用户随机分成两组,一组看方案A,一组看方案B,用数据说话哪个更好。

4. 想分析用户转化?用漏斗分析

漏斗分析就是把用户的行为路径画出来,看每一步有多少人流失。
比如电商的购买漏斗:浏览商品 → 加入购物车 → 提交订单 → 完成支付。
如果发现"加入购物车"到"提交订单"这一步流失特别严重,那问题大概率出在结算流程上——可能是运费太高、支付方式不方便、或者页面加载太慢。
漏斗分析的关键是:要结合具体行业和业务场景来设计漏斗的步骤,不能照搬别人的。

5. 想分析用户行为和产品运营?用AARRR模型

AARRR也叫海盗模型,五个字母分别代表用户生命周期的五个阶段:
Acquisition(获取)——用户怎么找到我们的?
Activation(激活)——用户首次体验怎么样?
Retention(留存)——用户会回来吗?
Revenue(收入)——怎么赚到更多钱?
Referral(推荐)——用户会告诉别人吗?
拼多多就是一个教科书级的AARRR案例。通过微信社交裂变获取用户,用低价爆款激活,用签到和优惠券做留存,靠高复购率做收入,拼团模式天然就是推荐。

6. 想对用户按价值分类?用RFM模型

RFM是三个指标的缩写:
R(Recency)——最近一次消费的时间间隔。
F(Frequency)——消费频率。
M(Monetary)——消费金额。
通过这三个维度,可以把用户分成8类,对不同类型的用户采用不同的运营策略。
比如信用卡的白金会员、金卡会员、普通会员,本质上就是在用RFM的思路做用户分层。
高R高F高M的是你的核心用户,得好好伺候着。低R低F低M的是沉睡用户,可能需要激活策略。

7. 想找到问题原因?用假设检验

这个方法的思路跟警察破案一模一样:
先根据现象提出假设,然后去找数据验证这个假设对不对。
比如最近转化率下降了,你假设是因为新上线的页面改版导致的。那就去拉改版前后的数据来对比验证。
如果数据不支持这个假设,就换一个假设继续验证,直到找到真正的原因。

8. 想知道两个指标有什么关系?用相关分析

豆瓣推荐"喜欢这部电影的人也喜欢",背后就是相关分析。
但这里有一个非常重要的注意事项:相关关系不等于因果关系
冰淇淋销量和溺水人数高度相关,但不是吃冰淇淋导致了溺水——是因为夏天天热,两个事都多了。
想判断是相关还是因果,可以用单变量控制法,只改变一个因素,看结果有没有变化。

六. 用数据分析解决问题的完整流程

方法都有了,具体怎么用呢?
其实就四步,跟去医院看病一模一样。
第一步:明确问题(你哪儿不舒服?)
这一步最关键,也是大多数人最容易跳过的。
老板说"帮我看看最近的数据",你别真的就打开后台开始瞎看。先追问:看什么数据?关心哪个指标?你觉得哪里有问题?
把问题定义清楚,分析就成功了一半。
第二步:分析原因(做检查、看报告)
用前面讲的那些分析方法,从多个维度去拆解问题,定位到底是哪个环节出了毛病。
先用多维度拆解找到"哪里出了问题",再用假设检验找到"为什么会出这个问题"。
第三步:提出建议(开药方)
找到原因之后,给出具体的、可执行的建议。
注意不是"建议优化用户体验"这种正确的废话,而是"把结算页面的运费提示从第三步提前到第一步,预计可以减少15%的流失率"这种有具体方案和预期效果的建议。
第四步:验证效果(复诊)
改了之后,数据有没有变好?如果变好了,说明方向对了。如果没变,说明原因没找对,回到第二步重新来。
这就是一个完整的数据分析闭环

写在最后

数据分析这件事,说难不难,说简单也不简单。
难的不是工具,而是思维方式的转变。
从"我觉得"变成"数据显示",从"拍脑袋"变成"有依据"。
这个转变一旦完成,你会发现自己看问题的视角完全不一样了。
以前看到一个数字涨了就开心,跌了就慌。
现在你会去拆解、去对比、去追问为什么,然后找到真正的原因,提出靠谱的方案。
这才是产品经理该有的样子。
工具年年在变,但思维方式,是可以用一辈子的。