垂直机器学习在时尚推荐系统的实践:从冷启动到400万用户增长
1. 从零到四百万一款时尚应用的增长叙事与垂直机器学习实践做一款面向女性的时尚应用从零用户到拥有四百万高活跃度用户这听起来像是一个遥不可及的梦想。但今天我想分享的正是我们团队如何一步步实现这个目标的核心故事。这个故事的关键不在于我们烧了多少钱做广告也不在于我们有多么华丽的界面设计而在于我们早期就坚定选择并持续深耕的一条技术路径垂直机器学习。很多人听到“机器学习”会立刻联想到那些需要海量数据、庞大算力的复杂模型觉得这是大厂的专利。我们最初也面临同样的困境用户为零数据为零预算有限。传统的、追求大而全的推荐系统对我们来说无异于空中楼阁。因此我们决定反其道而行之放弃“水平”的、试图理解一切用户和一切商品的通用模型转而构建一个“垂直”的、只专注于“女性时尚穿搭”这一个狭窄领域的智能引擎。这个决定成了我们产品增长的真正引擎。这篇文章我将拆解我们如何将垂直机器学习理念从产品冷启动贯穿到用户增长、留存与商业化的每一个关键环节。你会看到在没有先天数据优势的情况下如何通过领域知识的深度注入和精巧的系统设计让机器变得更懂“美”和“搭配”从而吸引并留住数百万用户。无论你是产品经理、创业者还是技术开发者希望这个聚焦于一个垂直领域深度挖掘的增长案例能给你带来一些不一样的启发。2. 垂直机器学习为何在时尚领域它是破局关键在深入我们的具体实践之前有必要先厘清一个核心概念什么是“垂直机器学习”以及为什么在时尚、美妆、家居等强领域属性的赛道它往往比通用模型更有效。2.1 通用推荐系统的局限与垂直化的优势通用推荐系统比如你在大型综合电商平台看到的那种其目标是服务数亿用户和数千万乃至上亿的SKU库存单位。它的核心逻辑是从海量的用户行为数据点击、购买、浏览中挖掘出“用户-商品”或“商品-商品”之间的关联关系。例如“买了手机的人通常也会买手机壳”。这种模式依赖的是统计相关性它强大但有时是“黑盒”且“肤浅”的。当我们将这套逻辑平移到时尚领域尤其是穿搭推荐时问题就出现了冷启动灾难对于一个新用户或一件新上架的衣服由于缺乏历史交互数据系统无法给出有效推荐导致用户体验断层。语义理解缺失通用模型能知道“A连衣裙”和“B高跟鞋”经常被一起购买但它无法理解为什么——是因为颜色搭配莫兰迪色系呼应是因为风格统一都是复古港风还是因为场合匹配都适合通勤缺乏领域知识推荐结果可能合理但不出彩无法提供“穿搭灵感”这种高阶价值。时尚的强主观性与快速变化时尚趋势瞬息万变且对“美”的判断有极强的主观性和文化、社群因素。纯粹依赖历史行为数据系统只会越来越保守推荐“安全”但过时的搭配无法引领潮流或满足用户个性化的审美表达。垂直机器学习就是针对特定领域垂直领域的特点将领域知识Domain Knowledge深度整合到机器学习模型的设计、特征工程和优化目标中。对我们而言这个领域知识就是“穿搭美学”。我们的做法不是简单地把“时尚”作为一个标签而是构建了一套机器可理解的“时尚知识图谱”。例如我们将一件衣服解构成多个维度颜色RGB值、色系、版型A字、H型、修身、材质棉、丝、羊毛、设计元素泡泡袖、方领、碎花、风格法式、韩系、街头、适用场合通勤、约会、度假等。同时我们定义了这些维度之间的搭配规则例如“同色系深浅搭配”、“上紧下松廓形原则”、“材质软硬对比”等。这些规则最初由我们的时尚编辑团队输入作为模型的“先验知识”。这样一来即使面对一个全新的用户和一件全新的商品我们的系统也能基于这些美学规则生成合理的搭配建议完美解决了冷启动问题。这就是垂直思维带来的根本性优势用领域知识弥补数据量的不足让智能在数据贫瘠的早期就能发挥作用。2.2 我们的核心假设质量优于数量深度优于广度在项目启动时我们内部有一个激烈的争论是应该先快速铺开用简单的标签匹配和热门推荐留住用户积累数据后再做算法升级还是应该从一开始就投入资源搭建更复杂但更精准的垂直推荐系统我们选择了后者。我们的核心假设是在女性时尚这个决策成本高、情感投入深的领域推荐内容的质量和精准度是增长的第一催化剂。一个用户因为看到一组惊艳且适合她的搭配而下载、留存、分享其价值远高于十个用户因为看到平庸内容而快速流失。这个假设决定了我们的技术架构必须是以“质量”为核心而非“规模”。我们放弃了早期盲目追求推荐列表的长度和多样性而是集中火力优化“前3条”推荐的相关性和惊艳度。垂直机器学习正是实现这一目标的工具它允许我们在一个狭窄的领域内做极致的深度优化。3. 系统架构如何构建一个懂穿搭的机器学习引擎将垂直机器学习理念落地需要一个坚实的系统架构来支撑。我们的系统并非一蹴而就而是随着业务发展逐步演进的但其核心思想始终如一数据与知识双轮驱动。3.1 数据层从零构建时尚专属的数据管道没有数据机器学习就是无米之炊。但我们的起步数据不是用户行为而是商品数据。第一步结构化商品信息抽取。我们建立了一个“商品数字化中心”。对于每一件新上架的商品无论是我们自营还是平台商家都不允许仅仅上传图片和填写简单标题。我们强制要求通过后台工具对商品进行多维度标注。这个过程部分是人工时尚编辑团队部分是自动化利用CV模型初步识别颜色、品类。我们构建了一个丰富的特征体系视觉特征通过卷积神经网络CNN提取衣服的深层图像特征向量用于视觉相似度计算。文本特征对商品标题、描述进行NLP处理提取关键词、风格词。结构化属性品类、子品类、颜色十六进制码、材质、版型、设计细节、品牌、价格区间等这些构成知识图谱的基础节点。搭配关系早期由编辑手动创建“搭配套装”这些“套装”成为我们监督学习模型的黄金标准训练数据。第二步用户行为数据的精细化埋点。当有用户开始使用后我们埋点的重点不在于记录了“多少次点击”而在于记录“什么样的交互”。例如不仅仅是“点击了某件衣服”而是“在浏览了A套装后点击了其中的裤子B”。不仅仅是“收藏”而是“收藏了由上衣C和裙子D组成的整套搭配”。我们特别重视“负反馈”的收集忽略某条推荐、快速划过、在搭配详情页停留时间极短等这些信号和“点赞”、“收藏”同样重要用于优化排序模型。实操心得定义正确的行为信号早期我们犯过一个错误过于看重“加入购物车”和“购买”作为正样本。但在时尚探索阶段用户大量行为是“浏览”、“收藏搭配灵感”、“分享给闺蜜”。将这些行为赋予合理的权重甚至为“保存搭配图”设定比“点击单品”更高的权重让模型更早地理解用户是在寻找灵感而非立即购物。这对提升内容推荐质量至关重要。3.2 模型层混合模型策略与知识图谱的嵌入我们的推荐系统不是一个单一的模型而是一个混合模型体系核心包括以下几个部分1. 基于内容的推荐Content-based Filtering引擎这是我们的冷启动基石和垂直化核心。它的工作原理是匹配用户偏好画像与商品/搭配的内容特征。用户画像初期通过注册信息年龄、地域、身材特点和明确的风格偏好选择让用户从多组图片中选择喜欢的风格构建基础画像。后期通过行为数据持续丰富例如用户反复点击含有“碎花”、“收腰”元素的连衣裙系统会强化其画像中“浪漫风”、“显瘦需求”的标签。物品画像即我们为每件商品和每个编辑创建的搭配套装打上的丰富标签和特征向量。匹配算法计算用户画像向量与物品特征向量之间的相似度。这里的关键是相似度计算函数不是简单的余弦相似度而是融入了我们定义的穿搭规则。例如当用户画像显示偏好“通勤风”系统会在匹配时给“西装裤”、“衬衫”、“乐福鞋”等品类更高的权重同时确保推荐搭配的颜色饱和度较低、廓形利落。2. 协同过滤Collaborative Filtering的渐进式引入当用户量和行为数据积累到一定程度大约10万日活我们引入了协同过滤。但我们没有做传统的“用户-物品”协同而是做了“用户-搭配套装”的协同。因为我们的核心产品单元是“整套搭配”而非单件商品。我们发现用户A和用户B都喜欢了同一套“法式针织衫牛仔裤芭蕾鞋”的搭配那么用户A喜欢的其他搭配也很有可能推荐给用户B。这种方式在时尚领域非常有效因为它本质是在发现“审美相似”的人群。3. 知识图谱Knowledge Graph的深度应用这是我们系统的大脑。我们将所有商品、属性、风格、场合、甚至流行趋势关键词都作为实体和关系构建成图谱。实体商品、颜色、材质、风格如法式、品牌、场合。关系“属于某种风格”、“采用某种材质”、“适合某种场合”、“与某某颜色搭配和谐”、“与某某品类常搭配”。应用场景可解释性推荐当系统推荐一套搭配时可以生成解释“推荐这套因为您喜欢蓝色系且这套采用了同色系深浅搭配原则同时符合您最近浏览的通勤场合需求。”多样性探索当用户陷入“信息茧房”总是看同一风格系统可以利用图谱进行可控的探索。例如用户常看“韩系甜美风”图谱知道“韩系甜美”与“轻熟通勤”都共享“高腰线”、“柔和色调”等元素可以尝试推荐一些融合了通勤单品的混搭拓宽用户视野但又不显突兀。新品冷启动一件新上衣入库系统可以通过图谱快速找到与其颜色、材质、风格相匹配的现有下装和配饰瞬间生成多个搭配方案无需等待用户行为数据。4. 排序模型Learning to Rank的终极优化召回阶段上述1-3步可能会产生数百个潜在的搭配候选。排序模型的任务是将其精排成用户最终看到的Top 10列表。我们使用梯度提升树如XGBoost/LightGBM模型来做排序。特征工程是这里的灵魂特征包括用户特征静态属性、近期行为序列过去一周点击/收藏的风格分布。物品搭配特征搭配本身的视觉吸引力分数通过一个预测“点赞率”的CV模型预估、搭配内单品的价格协同度、风格一致性分数基于知识图谱计算。上下文特征时间工作日/周末、地理位置南北地域温差导致的穿搭差异、当前流行趋势热度。交叉特征用户历史偏好风格与当前搭配风格的匹配度、用户消费档次与搭配总价的匹配度。排序模型的目标不是预测点击率CTR而是预测一个我们定义的综合满意度指标该指标由点击率、收藏率、分享率、详情页停留时长等加权组合而成。这迫使模型去学习推荐那些真正让用户感到“有用”和“惊艳”的内容而不仅仅是吸引点击。4. 增长飞轮机器学习如何驱动用户获取与留存技术架构是基础但增长是结果。我们的垂直机器学习系统是如何具体驱动用户从0到400万的增长飞轮的呢这个飞轮可以概括为优质内容吸引精准用户 - 用户行为产生高质量数据 - 高质量数据训练出更精准的模型 - 模型产出更优质的内容。4.1 冷启动阶段用“知识”创造“吸引力”从0到1万用户我们几乎没有付费推广。种子用户来自社交媒体Instagram, Pinterest和小红书的内容运营。内容生产我们的时尚编辑团队利用内部的搭配工具背后就是基于知识图谱的推荐引擎高效地创作出大量高质量、风格多样的穿搭内容OOTD。这个工具能帮助编辑快速找到符合特定主题如“春季通勤”、“度假长裙”的单品并进行虚拟搭配生产效率是传统方式的数倍。内容分发我们在社交平台发布这些精心制作的穿搭图并明确引导用户“想获得更多类似搭配推荐可以下载我们的App”。因为内容质量高、风格垂直且标注清晰如#小个子穿搭 #梨形身材吸引了非常精准的初始用户。App内体验用户下载App后在注册流程中会进行简单的风格偏好选择。基于此结合她下载的源头内容例如她是因为一条“法式连衣裙”的帖子来的系统能在她首次打开首页时就展示出高度相关且质量上乘的搭配推荐。这第一印象的惊艳感是早期留存的关键。4.2 增长加速阶段个性化与社交裂变从1万到100万我们开始引入适度的增长策略但核心驱动力依然是个性化推荐带来的高粘性。个性化发现流首页的“推荐”信息流成为用户使用时长最长的模块。随着用户每次点击、收藏、分享模型都在微调她的画像推荐变得越来越“懂她”。很多用户反馈“这个App好像比我更知道什么适合我”。场景化探索我们推出了“场景衣柜”功能。用户可以选择“明天要去参加婚礼”、“下周要去海边度假”系统会基于知识图谱和用户画像生成符合该场合的完整穿搭方案。这个功能极大地提升了工具属性价值用户不仅来看更来用。社交裂变引导当用户收藏或创建了一套满意的搭配时我们鼓励她生成精美的分享图带App水印分享到社交平台。分享出去的图片会带有追踪参数新用户通过此链接下载后系统能直接将其兴趣指向原搭配风格实现精准的社交推荐闭环。这就是“高质量内容带来精准用户”的典型体现。4.3 规模扩张与留存阶段智能运营与生态构建从100万到400万单纯靠自然增长和社交裂变会放缓。此时我们机器学习系统的另一个能力开始凸显智能运营。用户分群与精细化触达我们利用聚类模型将用户分为数十个精细的群体如“追求性价比的职场新人”、“热衷设计师品牌的高端用户”、“忠实的复古风爱好者”等。对不同群体我们推送不同的活动、内容和商品。例如向“复古风爱好者”推送古着主题的线上搭配大赛其打开率和参与度远高于泛泛的全体推送。流失预警与干预我们训练了一个预测用户流失风险的模型。对于高流失风险用户运营策略不是发优惠券而是通过推送她历史上最感兴趣的风格内容、或者她关注博主的新动态来重新激发兴趣。这种基于兴趣的挽回比基于利益的挽回长期留存率更高。创作者生态激励我们引入了资深用户和时尚博主作为“穿搭达人”鼓励他们发布自己的搭配。系统会为他们的内容自动打标并推荐给可能感兴趣的用户。同时我们开发了“相似搭配发现”工具当达人发布一套搭配后系统可以自动从海量商品中找出风格、款式相似的平价替代单品生成“类似风格”专辑这既丰富了内容又促进了商品转化形成了“达人创作 - 系统增强 - 用户发现 - 交易达成”的生态闭环。踩坑实录数据反馈延迟与模型迭代速度在用户量快速增长期日活从10万到50万我们曾遇到推荐质量短期下降的问题。原因是用户行为数据激增但我们的模型更新频率天级别跟不上兴趣变化的速度。新涌入的用户带来了新的审美偏好而模型还在用昨天的数据理解今天的用户。解决方案是建立更实时的特征管道和在线学习Online Learning试点。我们将用户最近30分钟的行为序列作为实时特征加入排序模型并尝试对某些简单模型进行近实时更新。这要求我们对数据基础设施进行大幅升级但带来的体验提升是显著的。5. 技术挑战与实战解决方案在构建和运营这套垂直机器学习系统的过程中我们遇到了无数挑战。分享几个最具代表性的问题和我们的解决思路。5.1 挑战一时尚趋势的快速演变与模型滞后问题机器学习模型从历史数据中学习但时尚是向前看的。当“芭蕾风”突然兴起时我们的系统可能还在大力推荐昨天的“Y2K”风格。解决方案建立“趋势感知”模块。外部信号采集我们爬取并分析主流社交媒体Instagram, TikTok, 微博上时尚话题的声量、增长率以及我们站内搜索关键词的变化。内部数据监测监控站内新出现的“收藏”行为模式例如突然有一小群先锋用户开始集中收藏带有“针织护腿套”的单品。趋势注入模型将识别出的新兴趋势如“芭蕾风”作为一个强特征加入到排序模型中。对于被标记为“趋势参与者”的用户通常是年轻、高活跃度用户模型会提高符合趋势的内容的排序权重。同时我们的知识图谱会快速纳入新的趋势词及其关联元素。A/B测试验证小流量测试趋势推荐的点击率和满意度确认有效后逐步放量。5.2 挑战二穿搭的“整体性”与“单品”推荐的矛盾问题我们的核心价值是提供整体穿搭灵感但商业变现又需要引导用户点击购买具体单品。如何平衡解决方案“套装即单品”的视角与渐进式披露设计。系统层面在召回和排序阶段我们的主要处理对象始终是“完整的搭配套装”。我们将一个搭配套装视为一个特殊的“超级单品”。产品设计首页信息流、场景推荐等主要入口全部以精美的整套搭配图片呈现。用户点击进入搭配详情页后首先展示整体效果、风格解读和场合建议强化灵感价值。然后才展示构成该搭配的各个单品列表。系统会为每个单品提供“智能替代”选项——点击后基于知识图谱和用户画像推荐类似风格、颜色或版型的其他单品。这既满足了用户“找同款”或“找平价替代”的需求又将用户的探索行为从一套固定搭配引导至更广阔的商品池同时保持了“整体风格”的上下文不丢失。5.3 挑战三评估指标的选择——如何衡量“好”的穿搭推荐问题电商的终极指标是GMV成交总额但作为穿搭灵感平台如果唯GMV论会迫使模型推荐高单价、易冲动的商品损害长期用户体验和信任。解决方案设计一个综合的、面向长期用户价值的“健康度”指标体系。 我们建立了一个仪表盘核心监控以下几类指标参与度指标人均每日有效浏览搭配数、收藏/分享率、详情页平均停留时长。这衡量用户是否“喜欢看”。探索度指标用户每周接触的新风格比例、点击“智能替代”功能的频率。这衡量系统是否帮助用户拓宽了视野而非陷入信息茧房。满意度指标通过NPS净推荐值调研和App Store评论情感分析来间接衡量。商业效率指标不是简单的GMV而是“浏览搭配到查看商品的转化率”、“查看商品到加入购物车的转化率”以及更重要的“基于搭配灵感的购买GMV占比”。我们追求的是推荐内容能高效地激发购买意图而不是生硬地推销。我们的排序模型优化目标就是上述多个指标的加权组合。这个权重需要业务和技术团队定期复盘调整以平衡短期商业目标和长期用户体验。6. 团队、文化与未来展望最后我想谈点技术之外但同样关键的东西。实现这样一套系统不仅需要正确的技术路线更需要与之匹配的团队和文化。跨职能深度协作我们的团队不是“算法工程师闭门造模型”。它包括了算法工程师、时尚编辑领域专家、数据科学家、产品经理和UI/UX设计师。每周都有“穿搭算法评审会”编辑会直接反馈最近推荐结果的“美感问题”工程师则需要解释模型逻辑共同讨论如何将编辑的“感觉”转化为可量化的特征或规则。这种沟通弥合了技术与艺术之间的鸿沟。拥抱“小步快跑”与“数据驱动”我们没有追求一步到位的完美系统。每一个新的想法——无论是新的特征、新的排序目标还是一个新的推荐场景如“根据你的衣橱智能推荐”——都会先进行小流量的A/B测试。用真实的用户行为数据来验证价值而不是会议室里的争论。这让我们避免了无数方向性的错误。关于未来我们仍在探索。例如如何利用生成式AI如扩散模型来虚拟生成全新的、符合用户个人风格的穿搭图片如何将用户的线下穿搭通过用户自愿上传的照片反馈到系统中形成线上线下风格的闭环垂直机器学习的道路越往深处走越能发现技术与人文、数据与美感结合的无限可能。回顾从0到400万的旅程最大的体会是在垂直领域最深的知识护城河往往来自于你对这个领域“常识”和“美感”的数字化与算法化能力。它不是算力的简单堆砌而是领域知识、数据思维和工程能力的深度融合。当你构建的系统开始真正理解并能够创造你所在领域的“好内容”时增长便成了一个自然而然的结果。