标签化系统

虎鱼标签化系统从内容丨产品丨用户入手,为三者打上结构化标签,为个性化推荐系统提供了全面丨精确丨便捷的前期准备。

内容

产品

用户

全面丨精确丨便捷

产品化标签

虎鱼商品标签化系统为每一件商品打上结构化标签,从而构建出商品的360度全景画像。商品的标签包括品类丨品牌丨颜色丨款式丨型号丨价格丨库存丨人群丨浏览量丨购买量丨用户评价等不同维度。商品标签化系统是深入解剖商品DNA的基础以及构建用户画像的先决条件。

品牌丨颜色丨口味丨季节
适用人群丨型号丨功能丨场地

价格丨库存丨品牌影响力

用户交互丨用户评价丨用户打分

产品领域

虎鱼网络商品标签化系统覆盖数码电子丨旅游丨汽车丨生鲜食品丨家电丨本地生活丨珠宝饰品丨服装等20多个行业,每个行业下分三级/四级类目,涵盖了市场上绝大部分移动电商系统的类目。本系统构建了一个标准品牌库,覆盖上述20多个行业,品牌数目超过10万个,不同类目的基本属性标签有所区别,如生鲜食品类基本属性包括:口味丨LBS信息丨购买力丨目标人群年龄丨目标人群性别等。

覆盖
数码电子丨旅游丨汽车丨生鲜食品丨家电丨
本地生活丨珠宝饰品丨服务等20多个行业

用户标签化

用户标签化即对每一个用户都打上结构化的标签,构建出一个用户的360度全景画像。用户的标签包括人口属性丨地理属性丨购物偏好丨口味偏好丨消费能力等不同维度。用户标签化深入解剖用户DNA丨支撑个性化推荐丨自动化营销,个性化推荐系统重要前期处理。

人口属性
年龄 性别 地域 行业 教育程度 子女状况

消费能力
消费周期 消费金额 消费级别

购物需求
商品品类 商品品牌 商品属性 价格区间

购物偏好
商品品类 商品品牌 商品属性 价格区间

阅读兴趣
财经 汽车 房产 娱乐 八卦

上网特征
上网时长 上网时段 上网频次 终端信息

用户兴趣图谱

虎鱼网络用户标签通过分析每个用户的交互内容绘制用户兴趣图谱,用户的交互行为可以分为"点击丨收藏丨点赞丨分享丨加入购物车丨购买丨评价"七种,通过这七个行为来判断用户对某一商品的需求程度,举例:当一个用户点击过iPhone 6丨并不能马上给他推荐iPhone 6,因为浏览仅仅代表"兴趣"而非"需求";当收藏丨分享丨点赞了这个商品iPhone 6时,可以判断他对于iPhone 6有"偏好",这种"偏好"可能是基于购买需要也可能是基于了解需要;当这个用户将iPhone 6放入购物车并提交订单时,最终流露出他真实"需求"

用户数据图谱

分析第个用户的交互内容绘制用户兴趣图谱

用户的交互行为可以分为丨点击丨收藏丨点赞丨

分享丨加入购物车丨购买丨评价,七种

推荐系统应用场景

虎鱼网络的推荐算法是与实际场景丨业务规则相对应的,使得推荐更精准丨涵盖范围更广丨适用性更强。目前覆盖场景主要包括:

搜索页面:个性化排序

详情页:浏览了还浏览

收藏夹:喜欢的还喜欢

购物车:购买了还购买

已买宝贝:你可能需要

个人中心:猜你会喜欢

详情页:附近的人喜欢

首页:最热门/猜你喜欢

用户数据分析

用户访问量店铺的所有用户数据管理,

分组管理,详细记录用户的微信号、手机号码等

单个商品的用户量访问统计

自定义时间段查询用户访问流量数据

智能推荐算法

基础算法:聚类算法丨预测算法丨分类算法等,主要用于产生基础知识库

推荐算法:content-based,collaborative-based,Association Rules等等

预测算法:logistic回归,以点击率为目标,结合多个指标建立模型选择优质商品

基于内容推荐:通过给用户和商品标注Tag,通过内容匹配算法,推荐商品给用户

分类算法:朴素贝叶斯丨商品性别判断(男性丨女性丨中性)丨用户性别判断等

协同过滤推荐:基于相似用户和基于相似商品的信息为用户推荐其“可能喜欢的商品

聚类算法:人群丨用户细分丨用于降维

关联规则推荐:类目的相关性丨商品的相关性丨用户的相关性

算法 说明 应用举例
User-based CF 依据相似用户的群体喜好产生推荐结果 用户推荐丨赞过的微信文章丨正文页相关推荐
KeyUser-based CF 依据相似专家用户的协同过滤推荐,利用少数人的智慧;推荐的信任来自好友丨社会认同 用户推荐(兴趣维度)丨热点话题
Item-based CF 依据用户的历史item消费行为推荐 实时推荐丨用户推荐
Edgerank 群体动态行为的快速计算 智能排序丨错过的微信文章
Min-hash/LSH 群体动态行为的快速计算 智能排序丨错过的微信文章
归一化算法 Weight的归一运算,如类idf计算丨分布熵,量化节点丨边的价值 面向关键节点的内容推荐丨用户推荐
推荐系统效果评测

Offline : 从日志系统中取得用户的行为数据,数据集的80%作为训练数据,20%测试数据,建立用户兴趣模型。

Online : 并对不同组的用户采用不同的推荐算法,进行ABTest。

衡量指标:预测准确度丨多样性丨惊喜度丨健壮性丨新颖性丨覆盖率丨用户满意度等。

除了核心的推荐算法外,推荐架构需要考虑具体场景,即具体业务应用,虎鱼推荐架构包含了计算层丨数据层丨应用层丨展现层四个部分。

业务应用
商品详情
收藏夹
购物车
历史记录
推荐系统层
排序
过渡
AB分流
日志收集
核心数据
排序丨过滤
AB分流丨优质宝贝库
TOP榜丨用户偏好
用户购买力
离线计算
用户偏好丨相似矩阵
优质宝贝库丨用户基础数据
商品基础数据丨店铺基础数据
日志基础数据