三年前,Segment 是每个 SaaS 公司的标配。一个 CDP 解决所有数据问题:收集、清洗、分发、激活。但 2026 年,越来越多企业拆掉了 Segment,换成了 Snowflake + dbt + Hightouch 的组合。
这不是技术潮流,是成本和控制权的战争。
All-in-One CDP 的三个死穴
第一个死穴是定价黑箱。Segment 按 MTU(月度追踪用户)收费,听起来合理,但实际账单像开盲盒。你的产品增长 50%,账单可能涨 200%。更糟的是,Segment 不告诉你哪些事件在烧钱,你只能看着账单发呆。
Twilio 收购 Segment 后,这个问题更严重了。据 Valiotti Data 的调研,2026 年 Segment 的平均合同额比 2023 年涨了 60%,但功能更新速度反而慢了。
第二个死穴是数据孤岛。你的客户数据存在 Segment 里,分析数据在 Snowflake 里,财务数据在 ERP 里。想做跨系统分析?要么把 Segment 数据导出到 Snowflake(又是一笔 ETL 费用),要么在 Segment 里重建所有逻辑(但它的 SQL 编辑器烂到让人想砸电脑)。
第三个死穴是灵活性差。Segment 只能做 Segment 支持的事。想接入一个新的 SaaS 工具?等官方集成。想自定义数据转换逻辑?受限于 Segment Functions 的沙盒环境。想用机器学习模型做用户画像?抱歉,Segment 不是为这个设计的。
Warehouse-Native 架构:数据栈的新范式
2026 年的新共识是:数据仓库才是唯一的真相来源(single source of truth)。
组合式数据栈长这样:
- 数据收集层:RudderStack 或 Segment(但只用它的 event tracking,不用它的 CDP 功能)
- 数据仓库:Snowflake、BigQuery 或 Databricks
- 数据转换层:dbt(把原始事件转换成业务模型)
- 数据激活层:Hightouch 或 Census(reverse ETL,把仓库数据同步到下游工具)
核心逻辑是:所有数据先进仓库,在仓库里做统一建模,然后用 reverse ETL 把结果推送到 Salesforce、HubSpot、Facebook Ads 等下游系统。
这个架构有三个优势:
优势一:成本可控。Snowflake 按计算和存储分开计费,你能清楚看到每个查询花了多少钱。Hightouch 按目的地(destination)收费,比 Segment 的 MTU 定价透明多了。据 DataForest 的案例研究,一家 10 万 MAU 的 SaaS 公司从 Segment 迁移到组合式架构后,每年节省 8 万美元。
优势二:灵活性强。dbt 是纯 SQL + Git,你可以写任何逻辑。想用 Python 做复杂建模?在 Snowflake 里跑 Snowpark。想接入新工具?Hightouch 和 Census 都支持自定义 API 集成。
优势三:数据主权。数据在你自己的仓库里,不被任何 SaaS 供应商锁定。Segment 倒闭或涨价?你随时可以换掉 reverse ETL 工具,数据模型不受影响。
但组合式架构不是免费午餐
最大的代价是工程复杂度。
All-in-One CDP 是托管服务,你不用管基础设施。但组合式架构需要你自己维护:
- dbt 模型的版本管理
- Snowflake 的权限控制
- Hightouch 同步任务的监控
- 数据质量检查(Great Expectations 或 Monte Carlo)
这需要至少一个全职数据工程师。据 CDP.com 的调研,企业从打包 CDP 迁移到组合式架构,平均需要 3-6 个月。
第二个代价是延迟增加。Segment 的实时同步延迟是秒级,但组合式架构的链路更长:事件 → 仓库 → dbt 转换 → reverse ETL → 下游工具。如果你的 dbt 模型每小时跑一次,用户行为到达 Salesforce 的延迟就是 1 小时起步。
2026 年的解决方案是用流式架构(Kafka + Flink + Snowflake Streaming),但这又增加了复杂度。
2026 年的选型建议
你应该用 All-in-One CDP,如果:
- 你的团队没有数据工程师
- 你的数据需求简单(只是收集事件,同步到几个固定工具)
- 你的 MAU < 1 万(Segment 的免费额度够用)
- 你需要秒级实时同步
你应该用组合式架构,如果:
- 你有至少一个数据工程师
- 你需要复杂的数据建模(比如 LTV 预测、用户分层)
- 你的数据量大(> 100 GB/月)
- 你想控制成本和数据主权
- 你已经在用 Snowflake 或 BigQuery
中间路线:Composable CDP
2026 年还出现了一种折中方案,叫 Composable CDP(可组合 CDP)。代表产品是 RudderStack 和 Lytics。
它们的核心思路是:把仓库当作 CDP 的存储层,但提供托管的数据激活能力。你不需要自己维护 reverse ETL,但数据主权还在你手里。
比如 RudderStack 的架构是:事件先进你的 Snowflake,然后 RudderStack 直接从 Snowflake 读数据,同步到下游工具。你不用管 dbt 和 Hightouch 的集成,但数据还在你的仓库里。
这个方案适合”想要组合式架构的灵活性,但不想招数据工程师”的团队。
行业趋势:Warehouse-Native 正在吃掉 CDP 市场
Gartner 2026 年的报告显示,超过 40% 的企业在考虑从传统 CDP 迁移到组合式架构。推动这个趋势的有三股力量:
第一是 dbt 生态的爆发。dbt 从数据转换工具变成了数据栈的操作系统。现在有超过 1000 个 dbt packages,覆盖营销归因、用户分层、LTV 预测等场景。这些逻辑以前只能在 CDP 里实现。
第二是 reverse ETL 工具的成熟。Hightouch 和 Census 在 2024-2025 年拿到大额融资,产品迭代速度很快。它们现在支持 200+ 下游集成,覆盖了 Segment 能做的 80% 场景。
第三是数据仓库的降价。Snowflake 和 BigQuery 的存储成本在过去三年下降了 50%。对于数据密集型公司,把数据存在仓库里比存在 CDP 里更便宜。
但这不意味着 CDP 会消失。Segment 的核心价值——事件收集和标准化——依然不可替代。真正在发生的是角色转变:CDP 从”数据栈的中心”变成”数据栈的边缘”,只负责收集,不再负责存储和激活。
最后一个问题:你的团队准备好了吗?
技术选型最终是组织能力的选型。
组合式架构不是技术上更先进,而是把复杂度从供应商转移到你的团队。如果你的团队能消化这个复杂度,你会获得更低的成本和更高的灵活性。如果你的团队消化不了,All-in-One CDP 依然是更好的选择。
2026 年的数据栈没有标准答案,只有适合你的答案。



