涨姿势,学习一下大数据是如何抓嫖客的~

以下内容是引用某银行工作者的原话,感觉在你眼里没有的信息或数据就成了开门的钥匙般,非常的有意思。我想商家用的更是炉火纯清了吧~

–原文开始–

我从事银行数据科学工作,对大数据隐私比较敏感。银行有专门对接公安的部门,辅助进行黄赌毒排查工作。以黄为例,聊聊大数据如何用最基本的信息和最简单的手段, 找出LSP和不法分子。

每个银行都有一张最基本的用户收支明细表,记录每个用户的每一笔收支记录。如【时间】2021年7月5日8点15分,【持卡人】Jack在【商家】永和豆浆早餐店花【金额】5.5元买了一杯豆浆、一根油条和一个荷包蛋。这份数据可以用来解读非常多的信息!

如何扫黄?

第一步,找出那些晚上11点至凌晨3点仍有活跃交易的账户;

第二步,如果这些金额也符合金额特征如”398元”、“498元”等,那就把这笔交易标记为可能涉黄;
这里需要特别指出的是为什么不用商家名称,因为有些搞黄色的按摩会所非常狡猾,很少有使用直接商户名的(如”红浪漫按摩养生会所”的收款名称可能摇身一变成了”永久便利店”);

第三步,假设一个商家1个月有1万笔交易,且70%的交易都符合上述特征。那么大概率这个商家就是涉黄的。银行会把这批名单输送到公安,至于公安下一步怎么做那就不知道了。

一个特别搞笑的事情是4月份月度排查的时候,名单里居然出现了一家”**市解放路空气净化器”的商家,我们觉得不可思议,是不是数据搞错了。再次核实后确认,这个商家4月份共有989笔交易,有304笔交易是398元,483笔交易是698元,而且交易发生的时间都是在凌晨。后来同事们笑称,这哪里是空气净化器,,明明是列腺净化器。

–原文结束–

是不是如开头所说,非常的有意思呢,我想这只是大数据最简单的实际应用之一吧~

原文链接:,转发请注明来源!

发表评论