The Rise of Composable Data Stacks: Why 2026 Is the Turning Point

The Rise of Composable Data Stacks: Why 2026 Is the Turning Point

当营销团队要的数据,CDP 说”给不了”

数据分析师李明接到营销总监的紧急请求:需要导出过去 6 个月所有用户的行为轨迹原始数据,用来训练一个流失预测模型。他打开 Segment 后台,找了半天,发现只能导出聚合报告和预定义的用户画像,原始事件数据?被锁在 Segment 的黑盒里。

“我们每个月给 Segment 付 $30,000,但连自己的数据都拿不出来?”营销总监在会议室里压着火气。这不是个例。2026 年,越来越多公司开始质疑 all-in-one CDP 的模式:数据应该属于谁?为什么 BI 团队、ML 团队、数据科学家都要通过 CDP 的 API 才能访问用户数据?

这个问题的答案,正在重塑整个数据栈的架构。

All-in-one CDP 的承诺与现实

十年前,Segment 提出的价值主张很简单:把所有用户行为数据统一收集到一个地方,然后一键推送到 Google Analytics、Facebook Ads、Salesforce 等几百个工具。对于 2015 年的创业公司来说,这是救命稻草——不用写代码对接每个工具,不用担心数据格式不一致。

但问题随着规模增长逐渐暴露。Segment 按 MTU(Monthly Tracked Users,月活跃用户)计费,Team 计划 $120/月可以追踪 10,000 个用户。听起来还好?但当你的产品增长到 100 万 MAU,账单会涨到什么程度?

一家 SaaS 公司的真实案例:2023 年用户数 50 万,Segment 账单 $18,000/月。2024 年增长到 200 万用户,账单涨到 $72,000/月。成本增长是线性的,但业务价值不是——用户增长不等于每个用户的数据价值都同等重要。更糟的是,数据被锁在 Segment 里,BI 团队想做深度分析,还得再买 Looker 或 Tableau,重复付费。

更致命的问题是数据孤岛。Segment 的数据存在 Segment 的 PostgreSQL 实例里,格式是 Segment 定义的 schema。你的 ML 团队想用这些数据训练模型?要么通过 Segment 的 API 慢慢拉(有速率限制),要么付费用 Segment Warehouse Connectors 把数据同步到 Snowflake(又是一笔费用)。数据主权在别人手里,灵活性接近于零。

Warehouse-native 方案:数据回归你的控制

2020 年左右,一个新的模式开始流行:为什么不把数据先存进自己的数据仓库(Snowflake、BigQuery、Redshift),然后再用工具推送到下游?这就是”warehouse-native”或”composable data stack”的核心思路。

架构很直接:

Step 1: 数据采集 → 直接进仓库。用 Segment 的开源替代品(RudderStack)或自建 pipeline,把用户行为事件写进 Snowflake。也可以继续用 Segment,但把 Snowflake 当作第一优先级的 destination。

Step 2: 数据建模 → dbt。在仓库里用 SQL 清洗、转换、建模。dbt(data build tool)让你用 SQL 写转换逻辑,生成干净的用户表、事件表、会话表。这些表是你自己定义的 schema,不是 CDP 强加的。

Step 3: 数据激活 → Reverse ETL。用 Hightouch 或 Census 把仓库里的数据同步到下游工具。比如把”过去 30 天未登录”的用户列表推送到 Braze 发召回邮件,或者把”高价值用户”标签同步到 Facebook Ads 做 lookalike 受众。

这个架构的核心优势是数据主权。所有原始数据、所有转换逻辑、所有用户画像都在你的仓库里,格式由你控制。想换 CDP?换掉 Segment,改用 Amplitude 或 Mixpanel,数据不用迁移。想换 BI 工具?从 Looker 切到 Metabase,直接连同一个仓库。工具可以换,但数据永远是你的。

成本账算得过来吗?

理论上听起来不错,但成本呢?Composable 栈会不会更贵?

我们对比一个中型 SaaS 公司(100 万 MAU)的两种方案成本:

All-in-one CDP(Segment):
– Segment Business 计划:约 $50,000/月(100 万 MTU)
– 数据存储:包含在 Segment 里
– 下游工具推送:免费(Segment 自带)
总成本:$50,000/月

Composable 栈:
– 数据采集:RudderStack 云服务 $500/月,或 Segment 把 Snowflake 当 destination $0(已有 Segment 的话)
– 数据仓库:Snowflake,按查询计算量,约 $3,000/月(存储 + 查询)
– 数据建模:dbt Cloud Team 计划 $100/月
– Reverse ETL:Hightouch Professional $1,000/月起(按同步行数),或 Census $350/月起
总成本:约 $5,000/月

省了 $45,000/月,一年就是 $540,000。这笔钱够招 3 个数据工程师了。

但这个账要加上”隐性成本”:你需要一个懂 SQL 和 dbt 的数据工程师来维护转换逻辑,需要有人管理 Snowflake 的 schema 和权限,需要写文档让营销团队知道去哪张表取数据。如果你的团队只有 5 个人,这些成本可能超过省下的钱。但如果你有 20+ 人的工程团队,自建数据栈的投入产出比是明显划算的。

2026 年为什么是转折点?

这个架构不是新概念。Hightouch 2020 年就推出了 reverse ETL,为什么现在才成为主流?

工具成熟度到位了。dbt 已经是数据建模的事实标准,社区有几千个开源的 transformation 模板。Hightouch 和 Census 的目标系统覆盖从 200 个增加到 300+,Google Ads、Salesforce、HubSpot、Braze 等主流工具全都支持。你不需要自己写对接代码,配置 UI 和 Segment 一样简单。

数据仓库成本降低了。Snowflake 的存储成本从 $40/TB(2020)降到 $23/TB(2026),查询计算也支持按秒计费的 serverless 模式。BigQuery 更便宜,按查询扫描量计费,小团队每月几百美元就够。仓库不再是”大公司才用得起”的奢侈品。

OpenTelemetry 打破了采集层的垄断。过去你用 Segment SDK 就被绑定在 Segment 生态里,换成其他工具要重写埋点代码。现在用 OpenTelemetry 采集数据,输出可以同时写进 Snowflake、Segment、自建系统,采集层和存储层解耦。工具之间的切换成本大幅降低。

数据隐私法规倒逼数据本地化。GDPR、CCPA、中国的数据本地化要求,都让企业更倾向于把数据存在自己控制的区域。Segment 的数据中心在美国和欧洲,如果你的业务在亚太,自建仓库(Snowflake 支持亚太 region)是更合规的选择。

适合谁,不适合谁?

Composable 栈不是银弹。它适合:

  • 有数据工程能力的团队(至少 1-2 个懂 SQL 和 dbt 的人)
  • 高 MAU 或快速增长的公司(Segment 账单已经超过 $10k/月)
  • 需要深度数据分析或 ML 的场景(BI、数据科学团队需要原始数据)
  • 对数据主权敏感的行业(金融、医疗、政府)

它不适合:

  • 5 人以下的初创团队:没人力维护数据栈,All-in-one CDP 更省心
  • 只需要基础分析的场景:如果你只是看看 DAU、留存率,Google Analytics 免费版就够
  • 营销驱动、技术资源有限的公司:营销团队不会写 SQL,All-in-one CDP 的可视化配置更友好

关键问题是:你是否有能力(和意愿)把数据管理当作核心能力来建设?如果答案是肯定的,Composable 栈的投入回报率远高于买 CDP。如果你只想”买个工具就能用”,All-in-one 方案仍然有市场。

未来 5 年,数据栈会长什么样?

CDP 供应商不会坐以待毙。Segment 在 2024 年推出了 Warehouse-first 模式,支持直接从你的 Snowflake 读数据;Amplitude 也在做类似的事。但这些本质上是防御性动作——承认”数据主权”的趋势不可逆,试图在 Composable 架构里保留一席之地。

真正的赢家可能是”混合模式”:数据存在你的仓库里,但 CDP 提供上层的 identity resolution、segmentation、real-time activation 等增值功能。你不为数据存储付费,只为高级能力付费。这比按 MTU 收费更合理,也更符合 2026 年数据团队的工作方式。

十年后回看,2026 可能会被记住为”数据回归企业自有”的转折点。不再是把数据交给 CDP 托管,而是自己掌握数据,按需调用工具。这不是技术的胜利,而是常识的回归:数据是你的资产,不是工具的副产品。

Stay updated with our latest AI insights

Follow FuturePicker on Google
滚动至顶部