360|360数科首席数据科学家沈赟:数据决定模型算法的天花板

【TechWeb】9月1日消息 , 日前 , 在“2020第二届中国零售金融发展峰会”上 , 360数科首席数据科学家沈赟就“白户风险”、“身份伪冒”、“中介风险”、“传销风险”、“黑户风险”、“恶意欺诈”、“借新还旧”七大欺诈场景 , 给出了针对性技术解决方案 。
据沈赟表述 , 针对主动式欺诈 , 360数科凭借GBST等自研算法 , 不断优化FTG自适应反欺诈特征体系 , 在千万级别黑名单库、黑中介库以及数亿白名单库的数据支持下 , 搭建起涵盖超过18亿关系节点和200亿关系边的金融知识图谱 。在全场景反欺诈方面 , 基于位置、设备、推荐、联系人等关系 , 360数科建立起关联网络 , 并利用社群发现、风险传播等无监督算法发现黑产团伙、识别潜在和新型欺诈威胁 。利用LBS网格化特征、App2Vec特征等技术加工手段 , 360数科还提升了深度学习算法的敏感度与精度 , 挖掘了模型算法的灵活性 , 即时拦截中介及黑产风险 , 从而实现有效实现反欺诈 。截至2020年6月30日 , 360数科由于欺诈造成的坏账率为0.2% 。
【360|360数科首席数据科学家沈赟:数据决定模型算法的天花板】沈赟表示 , 对于数据科学如何赋能信贷业务 , 360数科已实现从获客、贷前、贷中到贷后的全生命周期风险管理 , 有效抵御欺诈攻击 。在此过程中 , 每个阶段都需要大数据与人工智能技术的参与 , 这也是金融科技区别于传统金融机构的最大原因 。
同时 , 沈赟进一步表示:“反欺诈需要辨别出以骗款为目的黑色产业 , 在这方面 , 我们通过构建关系网络 , 以知识图谱等形式找出风险点 。同时 , 还会维护诸如黑中介电话号码库之类的数据库 , 通过社交关系网络 , 找到与黑中介关联上的人 , 并认作潜在的欺诈风险 。”
沈赟称 , “针对风险较高客户 , 我们会提前采取拒绝、调额、调价等风控措施 。此外 , 在实际业务中 , 我们还会在多个贷中时间点对用户进行重新评估 , 来预测其多头可能变化的情况 。”
据介绍 , 360数科在贷后环节制定了不同的催收的策略 , 通过对用户去进行客户和分群 , 来制定相应的催收方式 。沈赟表示 , “我们从积累数据 , 从数据当中去挖掘各种各样的特征 , 使用机器学习的模型去学习 , 不断去优化调整这个模型 , 从而促进业务的发展 。从这个角度讲 , 数据决定了模型算法的天花板 。反过来 , 在业务发展后 , 我们也可以获得更多的有标签、有指导意义的数据及模型 , 这是一个不断正向的循环 , 是整个的建模、数据模型以及业务三者有机的一个融合 。”


    推荐阅读