产品
解决方案
产品说明
关于我们

Data Analytics

这是一款用于企业数据可视化分析的自助式敏捷BI产品,可以针对企业业务数据进行自由维度的探索式分析,释放IT压力,真正将数据分析工作交还给最懂业务的人,提高企业决策效率。

典型客户:小米、克丽缇娜、雀巢、联合利华.....

Data Analytics 点击试用

Data MAX

这是一款用于企业数据可视化展示呈现的标准+自由定制化产品,将业务数据经过处理后以实时的炫酷的可视化形式展示出来,广泛应用于领导驾驶舱、指挥中心、展览展会等场景。

典型客户:人民日报、富力集团、OPPO、民生银行.....

Data Max 点击试用

咨询电话

400-1024-262

关注DH小助手

可随时微信沟通

首页 > 关于我们 > 媒体报道 > 文章详情
就因为“连衣裙”低于128元,我连对象都找不到了?
2019-03-01

这几天,网上开始流传起来了“连衣裙指数”,说是淘宝连衣裙客单价是否低于128元是评价一个女性是否值得与其谈恋爱的重要标准之一。评价的方式也很简单易操作,那就是打开你的淘宝搜索“连衣裙”,如果出现在搜索结果第二个和第三个的连衣裙平均价格低于128元,那么恭喜你,你已经被很多人从潜在的恋爱对象名单中去掉了。

看到这条消息,吓的小编赶紧登陆了自己的淘宝搜索了一下,还好,尽管自认为是属“非促销不能买也”的草根阶层,购物车中更是沉积了不少“十元包邮”的廉价货色,但我的“连衣裙指数”还是成功突破了128元,莫非谁偷偷用我的账号买了一件阿玛尼?

这个指数很快就得到了淘宝官方的回应。淘宝小二表示,所谓128元客单价以下被系统默认为“低价人群”的事并不存在。用户的偏好不是静态的,算法难就难在要做出个性化推荐,对每个人的推荐,都是基于对其消费习惯的动态捕捉上。

翻译一下:我们没说过购买连衣裙的价格低于128元就是低价人群,但是为每个人打上标签这种事,我们还是经常干的。

 
我们是如何被分类的?

美国经济学家、史学家克拉克曾经写了一本书,叫做《The Son Also Rises》,里面有一个很有意思的观点,说是从出生那一刻起,我们的阶层就在很大程度上已经决定了。而在大数据的世界之中也同样残酷,通过对我们行为的分析,大数据已经暗中为我们分好了类,你是穷还是富,是大手大脚还是勤俭持家,都有一套标签系统为自己而准备,这套标签系统收集的数据越多,那么我们的真实身份就愈加难以隐蔽。

那么,这些决定着网站要像我们推销什么商品、或是提供什么服务的用户标签到底是如何得出来的呢?

原理其实并不复杂,大数据系统在收集了用户的身份信息、人口等社会信息、账户信息、特征偏好之后,会进行统一的分析,并将相对的数据维度进行聚类,继而对用户打上相应的标签。其还会根据不同数据的权重来对用户价值进行评分,从而指导其具体业务的实施。

 阿里云上的用户行为分析模型

回到我们文章开头提到的连衣裙指数,这更接近于客户关系管理中的RFM模型。该机械模型通过一个客户的最近一次消费(Recency)、消费频率(Frequency)以及消费金额(Monetary) 3项指标来描述该客户的价值状况。

RFM模型

如果你在某个网站上消费频率较高、消费金额也较大,那么恭喜你,你可能被该平台归类于高价值客户,给你推送的也可能都是一些高价格的商品。当然,这并不一定是好事,因为在成为高价值客户之后,你往往会惊讶的发现,为什么同样一件商品,卖给我的价格要比朋友高很多?原因不难理解,大数据会认为你对高价格的商品有更强的支付能力,因此就偷偷的把东西以更高的价格卖给你。

所以,最容易得到实惠的往往是那些“纠结类”的用户,这会被系统认为是高挽留价值的用户。有人曾经支了一招,说是只要你在某平台上将商品反复加入购物车,几天之后就会收到平台给你的优惠券。因为大数据分析系统会认为:你对价格很敏感,很容易跳到其它的平台上购买,还是给你点优惠,让你赶紧把东西买了才是王道。

大家有没有发现,这套用户标签系统虽然看起来很厉害,但是还是有着不小的漏洞,那就是只能按照现在的数据进行判断,如果用户输入的数据就是错的呢?岂不是这个标签系统就会得出完全背离的结论。举个例子来说,用户完全可以伪造、或者随便填一下自己的性别与出生日期,这些错误的数据会误导标签的计算结果。再比如说,一个用户的标签可能随时都在变动之中,今年可能是窘迫的穷学生,明年就可能成为月薪数万的金领,简单的用户画像显然无法应对这些变化。

自从深度学习、机器学习等技术出现之后,深度用户画像技术将可以很好的解决这一问题。其基于已有数据或者一定规则加工而来,并通过神经网络计算,以及数据的实时采集与更新,对于模型进行不断的训练,感知数据在时间、空间等不同维度上的变化。以下为某专家建立的感知时序数据的RNN模型,能够对用户某段短时间内的购买行为综合分析学习,从而对用户画像进行调整。

深度时序模型

 
用户行为分析没问题,但不要用来评判个体

显然,我们需要大数据分析,因为这可以帮助我们获得更为个性化的产品与服务,但同时,更多的人拒绝异化成为冰冷的数据,以大数据的标签来对个体进行评判更容易带来人性的灾难。还是以连衣裙指数为例,谁知道那个只会在网上买廉价连衣裙的女孩,不是一个善良持家,将更多钱用来捐助贫困学生、追求精神层面提升的好女孩呢?

对于商家来说,在生成精准的用户标签的同时,还应该更加关注整体数据层面的运营,并通过人工决策来对策略进行更加精准的调整。DataHunter 建议称,商家可以借助 Data Analytics 等 BI 数据分析平台,通过自助式的数据处理方式,从销售、渠道等各种数据之中获取相应的洞察。这一数据监控与管理需要严格脱离个体层面,而是应该从整体上为商家的运营决策提供支撑。

DataHunter 为某客户建立的用户增长系统

为了避免人性被数据“异化”,需要严格来界定个人隐私与用户行为分析之间的界限。在数据层面,DataHunter 建议,数据需要在脱敏加密之后放进“数据黑箱”,由机器学习等系统来自动的进行聚类与分析,这不仅有利于得到更精准的用户画像,也能够更好地保护用户隐私。

热门文章
免费试用DataHunter产品
Data Analytics
业务驱动型BI工具
免费试用
Data MAX
极致性价比的大屏可视化产品
免费试用
Data Formula
敏捷型数据中台
免费试用
Copyright © 2018 北京数猎天下科技有限公司 | 京ICP备16063904号-1