合合信息李明:AI+Data 关联关系图谱赋能银行业智能风控
中国电子银行网讯 , 9月24日至26日 , 由中国金融认证中心(CFCA)、中国电子银行联合宣传年、中国电子银行网主办 , 中国银联重庆分公司协办的“2020中国数字金融生态论坛”在重庆举行 。 论坛涵盖夜话、主题演讲、知名科技企业走访等丰富内容 , 一百多家银行及金融科技企业高管、学术专家齐聚山城 , 论道银行数字金融生态发展新“基”遇 。

文章图片
合合信息智能解决方案事业部总经理李明
合合信息智能解决方案事业部总经理李明出席本次论坛并在金融科技创新“人气挑战赛”环节分享案例:AI+Data关联关系图谱赋能银行业智能风控 。
以下为案例分享全文:
【合合信息李明:AI+Data 关联关系图谱赋能银行业智能风控】各位嘉宾 , 下午好 , 我应该是今天压轴的 。 三位选手都姓李 , 都是两个字的名字 。 刚才两位嘉宾谈到他们带来对个人端的业务、对个人端的方案 , 而我是三个方案里面唯一一个对公方案:关联关系图谱赋能银行业智能风控 。
首先 , 介绍一下大背景 , 最近银行业的监管比较收紧 , 央行发文其实对于银行来讲 , 识别一个对公客户的画像越来越难 。 对公客户不是一个人 , 不是一个组织 , 可能是一堆人 , 一堆组织 。 我们怎么样利用科技的手段 , 利用AI , 利用大数据去分析单个个体复杂的关系 , 除了业务关联还有其他的关系 , 怎么样用科技的手段擦亮眼睛去洞察风险 。
我们来洞察一下银行业识别金融企业主体大概有哪些问题?其实我们现在在座的每一位 , 在最近几年 , 大家都生活在乌卡时代(VUCA) 。 我们对公客户也是一样 , 很多对公业务都是凭着经验 , 凭着关系在展开 , 怎么样在多变复杂的环境当中去洞察主体复杂的关系 , 这个时候就用到我们科技的能力 。
我们来看一下 , 从行方的角度特别希望做什么事情?希望洞察企业全方位的数据 , 同时加上银行内的业务数据 , 哪些节点发生多少业务量?这些就是通过全面了解客户整体关联关系图谱来实现业务的感知 。 怎么来实现?我们推出底层大数据技术 , 包括挖掘技术 , 当然还有旗下一款底层数据原料 。 其实 , 数据根本不缺 , 怎么样把多元的数据做一个贯通 , 怎么样把一个组织的资质信息做一个统一的规划和规整 , 这个用到数据的多元层 , 还要把行内业务数据打通 。 这个时候 , 基于数据去挖掘基础层 , 用数据的异构去做判断 , 底层的数据都进入之后 , 利用算法进行海量数据关系的挖掘和建立 。
我们是可以基于基层的数据原料和数据方式实时构建显性的关系 , 然后洞察一些隐性的关系 。 至于底层的数据原料和数据的加工处理层 , 把处理结果反哺给业务方 , 我们帮助很多银行在做风险管理、风险传达的感知 。 另外 , 我们还做合规上的优化 , 比方说集团的归属 。 另一点 , 我们还在利用全量的企业进行商机的挖掘 , 你所辖区的分行有哪些优质的客户是你没有挖掘到的 。 我刚才说的是基于底层的数据层 , 把数据转化成业务 , 这个就是我们利用合法合规的外部数据 , 加上数据分析能力和大数据平台来反哺银行对公业务的结合 。
基于工商、纳税 , 甚至 , 基于很多经营行为 , 以及很多知识产权 , 这些数据做聚合之后 , 其实是可以提供优质的外部数据给到行内 。 有了这些数据之后 , 行内需要把数据进行存储 , 进行运算 。 这个是我们当时输送给国内一家商业银行整个交易数据的量 。 把优质的外部数据带到行内之后 , 需要进行融合 。 去分析内部的业务数据 , 包括交易、担保和外部数据融合之后 , 做一个统一业务感知和展示 。 当时我们整个项目用到72台服务器 , 638核的CPU , 包括40多T的存储空间 。 我们当时做的是实时算法 , 在移动端和PC端都有落地 。 对外投资等复杂关系 , 我们做了统一的实时构建 。
基于这个支付和挖掘之后 , 给到业务场景最核心是:我们帮他去归属最准确的派系 , 分析资金交易往来、担保资金和担保链 , 同时 , 应用我们风险的预知和风险的传导 , 这个风险会向哪些主体传导 。 丰富优质客户——基于对外集团关系 , 我还能发展哪些集团属性其他客户 , 这些其实都是基于客户端的关系 , 进行业务的推理和挖掘 。
我们看一下场景 , 有了优质数据之后 , 我自己有一个亲身的体验 , 在上个月刚刚成立北京分公司 , 我们需要为北京负责人做一个开户 。 对公开户用时算一下 , 当天下午花了3个小时办了一笔这样的业务 , 前前后后填了差不多20多张表 , 每个表填写的第一项 , 都是写名称、注册资本金 , 完全可以通过数据流的方式直接代入 , 对业务提升非常大 。 基于全量的基层数据 , 还能进行实时的查询 , 实时自觉的反哺 。
这是另外一个产品 , 我知道这家企业是我的潜在目标客户之后 , 或者说我受理之后 , 其实我要客观分析他的路径 。 利用支付系统 , 对他上下股权全部无限层级地穿透 , 有多少节点是有我行的开户 , 这样容易反哺业务、更深入的业务沟通和业务落地 。 当我发觉对授信主体授信的时候 , 我可以做间接的洞察 , 通过几个节点产生间接的股权关系 , 这个也是可以通过运算获知 。
另外基于监管 , 其实我们去识别一个集团公司特别难 , 当我们给这家银行上线了之后 , 就在大几百个集团客户原先的数据库里面纠正了差不多100个集团派系 , 这样就不会选错 。 其实这样过度授信风险是存在非常大的隐患 。 除了这个之外 , 其实我们还深刻识别整个集团关系复杂节点 , 哪些是我的风险点?哪些是业务节点?机会节点?通过全面识别进行全面的认知 。
其实 , 深入分析之后 , 我们可以去了解很多潜在商机和风险点 , 这个当中利用我们的技术去分析整个行业的担保链 , 给这家银行上市之后 , 帮他复杂分析、互保 , 担保频次这个也是我们数据的核心能力 。 另外 , 在移动端做一个很好的展示 , 实时的分析 , 我们通过很多条件去挖掘 , 比方说两家企业历史上有共同的自然人 , 这个时候认为两家企业疑似关联 , 两家企业邮箱后缀都是一致的 , 这些都是关系的节点 , 业务人员很难调查 , 但是利用我们的底层数据 , 加上模型和算法就可以把隐性关系浮出水面 , 便于我们去判断 。
同时 , 还有另外一块支持企业智能搜索和匹配 , 有全量的信息加入到我们信息里面 , 我们任何业务员在搜索框里面找关健词 , 就到找到关健词所在的企业 , 将企业所需要的信息自动填入 。 这个当中其实也做上线效果的展示 , PC端、移动端都是一样的展示 , 这样一个股权结构可以用图谱方式统一做展示 , 来进行整个股权的计算 。
另外 , 其实我们去分析行内各种担保关系 , 依托于我们图运算来实现的 , 也能按时间属性不同分类的图展示 。 刚才我说的疑似关系 , 只要触发到疑似原因 , 我们就会做展示 。 两家企业有共同的对外的注册地址 , 我们可以展示 , 这是集团属性的展示 。
以下为提问互动环节:
提问:您好我是重庆银行后勤部 , 请问你刚刚提到亲属关系 , 亲属关系这个数据怎么来?
李明:整个输出能力基于公开公示合规合法的外部数据 , 另外一个就是自有产生的数据 。 但是目前整个亲属关系在整个国家层面是没有官方对外输出的 , 也就是说亲属关系只能依托行内的业务人员 , 通过人为方式添加 , 你只要构建了亲属关系 , 我就在图展示当中 , 运用这个关系做运算 。
提问:刚刚您提到公司的曾用名这块 , 用在哪些公司关联构建上?
李明:目前采集的工商信息 , 我们目前对外输出的数据库最原始记录是1988年 , 整个追溯在业内是最久的 , 整个数据做了一个融合 。 您提到曾用名其实是根据企业发展历次更改都有一条相关联线 , 曾用名不一定用于隐性关系的挖掘 , 但是曾用名对这家企业过往发展经历有非常好的参考因素 。 其实我们触发很多隐性关系超过20种 , 当中曾用名不一定用在这个场景 。
提问:人事这块 , 法人身份证是公示 , 股东的身份证号码是不公示 , 这一块能建立关系吗?
李明:基于我们自我的系统 , 我自己用了唯一识别号进行关系的运算 , 每一家企业在我的数据库都有唯一的识别号 。
推荐阅读
- 扇贝最好吃的做法,适合冬日里吃,做法简单好吃不腻,家人超爱吃
- 白菜腌肉面,简单的做法,完美的营养组合
- 几道家常菜,食材健康,做法简单快捷,一年四季适合吃的
- 大虾沙拉子造型美观,味道香鲜,特别适合小孩食用
- 冬天就适合用此物烙饼,鲜香营养,孩子爱吃,早餐吃一个暖心暖胃
- 几道很适合晚餐吃的素菜,快点学起来吧
- 鲜香四溢的21款菜肴推荐,荤素合理搭配超好吃超下饭,值得尝试
- 天际|罕见“红颜笑脸”再现天际,双星合月你观测到了吗?
- gitlab|GitLab成立中国合资公司极狐,强调“独立运营”
- 溯源|新冠病毒溯源研究刻不容缓,中方专家释放大量信息,法国遇大麻烦
