你有没有发现,越来越多公司在拆掉自己的数据栈?
Segment、mParticle 这些 all-in-one CDP 曾经是标配,现在却被 Snowflake + dbt + Hightouch/Census 的组合慢慢替代。这不是个例,这是趋势。
2026 年,”Composable Data Stack”(可组合数据栈)成了数据团队的新共识。Reverse ETL 从一个边缘概念变成了核心组件。Warehouse-native 架构从实验变成了主流。
为什么会这样?拆掉 all-in-one 方案不是更复杂吗?
答案藏在成本、灵活性和控制权的三角博弈里。
All-in-One CDP 的问题:锁定、黑盒、账单失控
传统 CDP 的逻辑是”把数据给我,我帮你搞定一切”。听起来省心,用起来麻烦。
供应商锁定是第一个痛点。你的客户数据进了 Segment 的专有格式,想换工具?先把数据导出来,再映射到新系统的 schema,折腾几个月。很多公司发现,CDP 不是工具,是陷阱。
黑盒处理是第二个。数据进去后怎么处理的?你不知道。身份识别用了什么逻辑?不透明。客户档案怎么合并的?看运气。数据团队想调优,发现根本没有调优空间。
按行计费是第三个。Segment 按 MTU(月活跟踪用户)收费,你的用户量涨了,账单就涨。流量突然翻倍?恭喜,下个月账单也翻倍。很多公司发现,CDP 的成本增长速度比业务还快。
2026 年的一份调研显示,中型 SaaS 公司的 CDP 年费用中位数是 12 万美元,而 Composable Stack 的总成本(仓库 + 工具)通常在 6-8 万美元。省下来的钱够养一个数据工程师。
Composable Stack 的逻辑:仓库为核心,工具可替换
Composable Data Stack 的核心思路是:数据仓库是唯一的事实源,其他工具都是可替换的组件。
典型架构长这样:
- 数据仓库(Snowflake / BigQuery / Databricks):存储所有原始数据和清洗后的数据
- ETL 工具(Fivetran / Airbyte):把数据从各个系统同步到仓库
- 转换层(dbt):在仓库里用 SQL 建模,定义客户档案、指标、分群
- Reverse ETL(Hightouch / Census):把仓库里的数据推送到营销工具、CRM、广告平台
- BI 工具(Looker / Metabase):直接查询仓库,不需要再导出数据
你会发现,数据只在仓库里存一份。ETL 工具换了?没关系,数据还在。Reverse ETL 工具换了?也没关系,SQL 模型还能用。
这就是”可组合”的意义:每个组件都可以单独替换,不影响整体。
Reverse ETL:从仓库到工具的最后一公里
Reverse ETL 是 Composable Stack 的关键环节。
传统 ETL 是”把数据从工具搬到仓库”,Reverse ETL 是”把数据从仓库推回工具”。听起来反直觉,但这是 warehouse-native 架构的核心逻辑。
举个例子:你在 dbt 里用 SQL 定义了一个”高价值客户”分群(最近 30 天消费 > $1000),Reverse ETL 工具(Hightouch)可以把这个分群自动同步到:
- Salesforce(更新线索优先级)
- Braze(触发专属优惠邮件)
- Google Ads(创建相似受众)
- Zendesk(标记 VIP 客户)
同步频率你自己定:实时、每小时、每天。同步逻辑你自己写:SQL 查询结果直接就是推送内容。
Hightouch 和 Census 是这个赛道的双雄。2026 年,Reverse ETL 市场规模达到 8.5 亿美元,增速 67%。越来越多公司发现,Reverse ETL + 仓库的组合比传统 CDP 更灵活、更便宜。
为什么企业选择 Warehouse-Native?
成本优势是第一个原因。
Snowflake 按查询量计费,Hightouch 按同步行数计费。你的用户量涨了,仓库成本几乎不变(查询量不一定涨),Reverse ETL 成本只跟你推送的数据量挂钩。
对比 Segment:用户量涨 50%,账单直接涨 50%。Warehouse-native:用户量涨 50%,成本可能只涨 10-20%。
灵活性是第二个。
你想加一个新的客户分群逻辑?在 dbt 里写几行 SQL,5 分钟搞定。在传统 CDP 里?要么用他们的拖拉拽界面(功能受限),要么找客户经理申请定制开发(等几周)。
你想换一个营销工具?Warehouse-native 架构下,Reverse ETL 工具通常支持 100+ 集成,换工具只需要改配置。传统 CDP?看他们支不支持,不支持就卡住了。
数据主权是第三个。
数据在你自己的仓库里,你有完全控制权。想备份?随时导出。想审计?直接查询。想做 AI 训练?数据就在那。
传统 CDP 的数据在供应商那里,你只有 API 访问权限。供应商倒闭了?数据可能就没了。
但 Composable Stack 不是银弹
说了这么多优点,Composable Stack 也有问题。
复杂度是最大的挑战。
All-in-One CDP 只需要对接一个供应商,Composable Stack 要对接 4-5 个(仓库、ETL、转换、Reverse ETL、BI)。每个工具都要学习、配置、维护。
出了问题,排查链路更长。数据没同步到 Salesforce?可能是 dbt 模型写错了,可能是 Reverse ETL 配置有误,可能是仓库权限问题。
延迟是第二个问题。
传统 CDP 的数据流是实时的(或接近实时)。Warehouse-native 架构有多个环节:ETL 同步(通常每小时一次)→ dbt 转换(手动或定时触发)→ Reverse ETL 推送(分钟到小时级别)。
如果你需要实时个性化推荐(用户点击后立刻推送相关内容),Warehouse-native 架构可能跟不上。这也是为什么有些公司会保留 CDP 用于实时场景,用 Warehouse-native 架构处理批量分析和激活。
人才门槛是第三个。
Composable Stack 需要数据工程师。你得懂 SQL(写 dbt 模型)、懂数据建模(设计客户档案)、懂 API 集成(配置 Reverse ETL)。小团队可能养不起这样的人。
All-in-One CDP 的好处是:市场人员也能用。拖拉拽就能建分群,不需要写代码。
2026 年的主流选择:Hybrid Stack
现实中,很多公司不是”非此即彼”,而是混合架构。
典型的 Hybrid Stack:
- 用 Segment 做实时事件收集和分发(充分利用它的 300+ 集成)
- 把 Segment 的数据同步到 Snowflake(用 Segment Warehouse Connector)
- 在 Snowflake 里用 dbt 做深度建模和分析
- 用 Hightouch/Census 把仓库里的高级分群推送到营销工具
- 用 BI 工具(Looker)直接查询仓库
这样既保留了 CDP 的实时性和易用性,又获得了仓库的灵活性和成本优势。
2026 年的调研显示,60% 的中型和大型企业采用的是 Hybrid Stack,而不是纯 Composable 或纯 All-in-One。
选择建议:你该用哪种架构?
用 All-in-One CDP,如果:
- 你的团队没有数据工程师,主要是市场和运营人员
- 你需要快速上线,不想自己搭建数据管道
- 你的数据量不大(月活用户 < 10 万),成本可控
- 你主要做简单的客户分群和自动化营销
用 Composable Stack,如果:
- 你有数据团队,能写 SQL 和管理数据管道
- 你的数据量大,传统 CDP 的定价模型不划算
- 你需要深度定制客户档案和分析逻辑
- 你已经有数据仓库(Snowflake/BigQuery),想充分利用它
用 Hybrid Stack,如果:
- 你需要实时事件处理,但也想做复杂分析
- 你的团队既有市场人员(用 CDP 做日常操作)也有数据人员(用仓库做深度分析)
- 你愿意为灵活性付出一些架构复杂度
未来:AI 会改变游戏规则吗?
2026 年的一个新趋势是:AI 让 Composable Stack 更容易用。
Hightouch 和 Census 都在加 AI 功能:用自然语言描述分群逻辑,AI 自动生成 SQL。你说”最近 30 天消费超过 $500 但最近 7 天没登录的用户”,AI 写好查询,你检查一下就能用。
dbt 也在做类似的事:AI 辅助建模,自动发现数据质量问题,推荐优化方案。
这会降低 Composable Stack 的技术门槛。可能几年后,市场人员也能直接操作仓库和 Reverse ETL 工具,不再需要数据工程师写每一个 SQL。
但也有人认为,AI 会让 All-in-One CDP 重新占上风。如果 CDP 能用 AI 自动处理数据、自动优化分群、自动推荐营销策略,那它的黑盒问题就不再是问题,反而变成了优势(”你不需要懂,AI 帮你搞定”)。
2026 年,这场博弈才刚开始。
小结
Composable Data Stack 不是炒作,是真实的架构转型。
越来越多公司发现,把数据仓库作为事实源、用 Reverse ETL 激活数据,比把数据锁在 CDP 的专有系统里更灵活、更便宜、更可控。
但这不意味着 All-in-One CDP 会消失。它仍然适合小团队、快速迭代、实时场景。
2026 年的主流选择是 Hybrid:既用 CDP 做实时事件处理,又用仓库做深度分析和定制激活。
你的公司用的是哪种架构?如果还在用纯 CDP,可能是时候看看 Composable Stack 能省多少钱了。



