微信扫码
添加专属顾问
我要投稿
小红书如何用增量计算重构数据架构,实现成本与复杂度双降?揭秘3.5亿用户社区的数据平台进化之路。 核心内容: 1. 小红书业务场景与数据挑战:从社区互动到电商交易的全链路数据需求 2. 架构演进关键:用通用增量计算替代Lambda架构,实现三大成本指标降低1/3 3. 混合云战略实践:完成500PB数据迁移后,向自建云与AI驱动方向持续进化
1. 小红书数据框架的演进
2. 通用增量计算概述
01
小红书数据框架的演进
在小红书 APP 中,用户可以浏览社区笔记、与朋友进行互动、可以观看直播,也可以在商城购买商品,而这些都是强数据驱动的业务。小红书用户的体量以及其业务复杂度超高,因此对其数据平台对应的数据能力有着比较大的挑战。
1. 小红书业务及数据概览
目前,小红书的整体数据平台是采用业界通用的数仓标准和建模方式来进行维护管理的,包括但不限于自建的调度平台、运维平台、资产管理平台、治理平台、报表平台等一系列产品型工具能力,共同辅助数据资产在企业中发挥更大的价值。
其中,价值输出主要分为四类:
第一类是数据分析。例如支持面向高管的报表、支持一线运营及销售的自助分析产品;
第二类是数据产品。例如小红书面向广告主、商家、博主、内部需求方的数据平台;
第三类是数据服务。例如提供给推荐、搜索、算法团队的用户画像以及特征标签等;
第四类是 AI 相关。例如使用 AI 来帮助用户更轻量地获取数据洞察、生成数据报告和给出经营建议等;
2024 年,小红书的基础设施层从 AWS 迁移至阿里云,迁移数据 500PB,任务 11 万,参与人数 1500 人,涉及部门 40 多个,整体的迁移和改造的复杂度创下了业界记录。截至目前,小红书已有部分业务在自建云上试跑,未来将向混合云架构发展。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-13
一句话,我用豆包 AI 做出《红楼梦》互动游戏
2025-11-13
深度体验TRAE SOLO 正式版,总结一点技巧(附完整可重现提示词和源码)
2025-11-13
构建生产就绪的智能体系统:来自 Shopify Sidekick 的经验教训
2025-11-13
GPT-5.1凌晨突袭,奥特曼听劝!全网呼唤的人味回来了
2025-11-13
OpenAI推出GPT-5.1小小小小更新!!!
2025-11-13
刚刚,GPT-5.1 正式发布,OpenAI 这次有点「不对劲」
2025-11-13
GPT-5.1来了!更快更懂更可靠
2025-11-13
AI 联网搜索的两个致命缺陷:信息投毒与隐私泄露
2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-10-02
2025-09-08
2025-09-19
2025-09-17
2025-08-19
2025-09-29
2025-11-12
2025-11-10
2025-11-09
2025-11-09
2025-11-08
2025-11-06
2025-11-06
2025-11-06