专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN201710121176.6
申 请 日:20170302
申 请 人:江苏省烟草公司常州市公司
申请人地址:213000 江苏省常州市钟楼区吊桥路131号
公 开 日:20210518
公 开 号:CN107103488B
代 理 人:张岳
代理机构:32401 常州品益专利代理事务所(普通合伙)
语 种:中文
摘 要:本发明涉及一种基于协同过滤算法和聚类算法的卷烟消费研判方法,包括以下步骤:1)样本采集;采集样本消费者对卷烟各品规的偏好度;2)特征采集:选取多个用户特征信息的特征值构建消费者特征向量,得到消费者特征矩阵;选取多个商品特征信息的特征值构建卷烟特征向量,得到卷烟特征矩阵;3)聚类:运用K‑means++算法对消费者和卷烟进行聚类;4)计算偏好度:通过协同过滤算法获得消费者对各品规卷烟的偏好度。本发明运用K‑means++算法将消费者和卷烟聚类,再运用协同过滤算法的思想对某消费者对某卷烟的偏好度进行测算,进而通过样本消费者的偏好度,预测个体消费者的消费需求。
主 权 项:1.一种基于协同过滤算法和聚类算法的卷烟消费研判方法,其特征在于包括以下步骤:1)样本采集;通过样本消费者的浏览记录、点赞情况、查询频繁度、购买记录以及注册时填报的卷烟偏好,获得样本消费者对卷烟各品规的偏好度;2)特征采集:选取多个用户特征信息的特征值构建消费者特征向量,得到消费者特征矩阵;选取多个商品特征信息的特征值构建卷烟特征向量,得到卷烟特征矩阵;3)聚类:运用K-means++算法分别对样本消费者和卷烟进行聚类,并计算各类类中心的偏好度;步骤包括:A、先从输入的数据点集合中随机选择一个点作为第一聚类中心;B、对于数据集中的每一个点,计算它与最近聚类中心的距离D(x);C、选择另一个新的数据点作为新的聚类中心;原则是:D(x)较大的点,被选取作为聚类中心的概率较大;D、重复步骤B和步骤C,直到k个中心被选择出来;E、利用这k个初始的聚类中心来运行标准的k-means算法;4)相似度计算:根据所聚消费者类别,运用余弦距离计算公式,计算目标消费者与所属类中心的距离,以距离大小获得目标消费者与所属类中心的相似度大小;根据所聚卷烟类别,运用余弦距离计算公式,计算目标卷烟品规与所属类中心的距离,以距离大小获得目标卷烟品规与所属类中心的相似度大小;5)偏好度计算:根据协同过滤中user-based思想,结合计算所得相似度,计算目标消费者对目标品规user-based偏好度;根据协同过滤中item-based思想,结合计算所得相似度,计算目标消费者对目标品规item-based偏好度;将根据user-based和item-based计算的偏好度求平均,得到某消费者i对某品规卷烟j的偏好程度rij,据此,rij是消费者i对品规卷烟j需求的研判值。
关 键 词:卷烟 偏好度 算法 协同过滤 聚类 消费者特征 构建 样本 矩阵 商品特征信息 用户特征信息 聚类算法 特征采集 特征矩阵 特征向量 消费需求 样本采集 向量 采集 测算 预测
IPC专利分类号:G06K9/62(20060101);G06Q30/02(20120101)
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...

