请选择 进入手机版 | 继续访问电脑版
立即注册 登录
 找回密码
 立即注册
搜索
钱来也理财网 首页 投资理财 查看内容

如何做好风控模型?其中的精髓,你get到了吗

原创 2019-10-20 04:39| 发布者: 中国财经网| 查看: 63| 评论: 0

想要高手的水平,首先要有高手的心态。想要高手的心态,自然要有高低起伏的丰富经历。所谓的高手的心态不是宠辱不惊,而是真的已经看淡得失。内心坚强的人,都会有自己的信仰,这份信仰不是来自于俗世的财富,而是发


想要高手的水平,首先要有高手的心态。

想要高手的心态,自然要有高低起伏的丰富经历。

所谓的高手的心态不是宠辱不惊,而是真的已经看淡得失。

内心坚强的人,都会有自己的信仰,这份信仰不是来自于俗世的财富,而是发自内心的满足。

交易如棋。

棋是牌面上博弈,更是人心的博弈。

交易也是如此。

投机市场本身没有输赢,输赢自在人心,可是什么输赢又有什么是绝对的?什么是绝对的输,什么又是绝对的赢呢,一笔交易平仓以后你赚了不少钱这算是赢,可是因为做到了及时的止损,只是付出了很少的代价,这算是输么?你的对手是市场?是别的交易者?还是你自己?

这个问题的答案市场自己永远都不会给你,与其纠结于本身就没有标准的输和赢,不如专注于对和错,你可以看淡或者有不同理解输和赢,但是你骗不了自己什么是对和错。

每一个背负输赢禹禹前行的交易人,在场一日,纠结一日,痛苦一日,希望一日,恐惧一日,谁不曾在恐惧里轮回?谁又不曾在贪婪里沉沦?诚然败者有败者的悲凉,但仅存的那些许胜者,又有几时可以放松片刻的荣光?其实与其说是胜者,真不如说是剩者,没有谁可以战胜市场,所谓胜者不过是在大浪淘沙过后懂得了该什么收敛个性顺应市场,学会了怎么生存的人。

自古得大道的顿悟者,无不是感叹,看山还是原来的山,看水还是原来的水,所谓经历和洗礼原来也不过是帮助找回最开始的自己,阅尽千帆,洗尽铅华,虽然看起来我们还站在原地,但更珍贵的是返璞归真的初心。

从迷茫痛苦到轻松洒脱,再从轻松洒脱到迷茫痛苦,循环往复,只有足够坚韧的交易者才够资格获得那非凤凰涅槃般的平和,波澜不惊的心态才是时间最难得的幸福。

“你的模型准么?”

“你的模型真的有用么?”

“你的模型对风控有价值么?”

在建立风控评分模型过程中,这是最常见的问题。为了回答这一问题,我们想先讨论下如何从实际业务出发,以怎样的开发流程才能建立一个有效、有用、有价值的模型,希望读后能给你一定的启发。

在互联网金融风控体系中,量化分析需要贯穿始终,评分卡模型是其中非常重要的一环。

在互联网金融评分卡开发过程中,我们仔细研究了企业风控操作流程,反复推敲了模型构建步骤,最后我们认为从业务应用角度,评分卡开发应用应遵循:

业务定义 -> 风险定义-> 风险分解 -> 风险策略 这几个步骤。

业务定义

为什么把业务定义放在最底层呢?

从商务智能的角度说,模型,1评分,策略等都是为业务服务的,脱离了业务场景的模型和评分是无本之木,无源之水;脱离了业务场景谈模型的准确性,没有意义。

不同的业务场景,产生了不同的数据,不同的数据包含的规律,体现在数据分析中就是不同的模型、不同的参数和不同的评分。

比如,同样是网上的个人信用贷款,主要包含个人和企业主两大类客群。在中国,由于小微企业贷款困难,如果小微企业有了贷款需求,一般都是企业主以个人名义在网上贷款,但是这类客户显然是和普通个人信用贷款客户是不同的,所以这类客户的属性信息一般都包含了一些企业的信息,如资产,对公、对私流水等等。我们在做模型的时候,就会把他们分开:个人消费信贷模型和企业主信贷模型,企业主模型会包含一些反应小微企业财务状况的变量。

但是互联网金融所包含的业务种类远不止这两个,单纯的信用贷款类,就有专门放贷给学生的学生贷;在朋友圈之内贷款的朋友贷;给外企白领贷款的白领贷……

如果你拿学生贷的模型给农民贷客户来用,或者拿给上海白领开发的模型给甘肃、西藏的白领用会怎么样呢? 我不说你也明白了。

业务定义之后,还有一个要求,即业务模式的稳定性。即在一定时间范围内,用于构建模型的数据依赖的业务模式是相对没有变化的,前后一致的。只有满足这个条件,历史数据模拟出来的模型,和后面的数据才是匹配的。这在学术上有个术语,稳定性,Stationary/stability.

同理,我们也假设,符合同一类属性特征的个体,其表现行为也是一样的,即打分相同的人,表现也相同。这也回答了有人提出的另一个问题“我以前从没贷过款,也没信用卡消费记录,能用你的模型打分么?”

风险定义

简单地说就是判定哪些是好客户,哪些是坏客户。

互联网金融业务模式的多样性,导致了对好客户和坏客户的定义标准也不尽相同。这里有人会问:“怎么会呢?欠钱不还的不就是坏客户么。”好吧,我来举个例子。

在我们清洗数据的时候,看到对客户信用评价中有这么一类“少量逾期”,这个类别占了相当大的比重,而且在模型中作用也比较显著,和其它类别“信用好”“信用差”等比肩。

一开始我们的技术人员对这个“少量逾期”这个分类很疑惑,不能理解这个分类到底是好还是坏。直到我们和某p2p公司的风控经理实际交流后才明白这其中的含义。宋总说:“……在传统银行信用卡业务中,是很喜欢这类少量逾期的客户的,因为他们能给银行创造罚息,但是又不是恶意违约那种客户。但对于我们P2P公司来说,是不敢养这类客户的,一旦有了逾期情况,就必须马上采取措施……”

说到这里您可以明白了吧,“少量逾期”是传统银行信用卡业务中经常出现的一个分类,而且算一个银行比较喜欢的类别,但是你把它也用到互联网金融试试?

风险分解

风险分解,就是用模型把目标客户分类。我们举个例子:

某跨国IT北京研发的总裁,提到发生在自己身上的案例:由于家里有急事,临时用钱,想申请某行的信用卡多给5万额度,但是某行不批。为什么呢? 因为刘总用这个卡主要是发工资的,每月到账后,夫人就会把钱拿去购买理财产品。因此卡上一般没多少钱。但是刘总是不是高风险客户呢?

显然,依据某行简单的分类方法,刘总被划为不能多给5万额度的类别了。长此以往,类似刘总这类高质量、低风险客户就有可能流失。

因此,选择正确的方法,合理分类,才能为进一步采取合理的商业策略提供正确有力的数据支持。评分卡是其中一个比较有效的工具。

在信用风险管理领域,评分卡是简便易行的风险管理工具。

什么是评分卡?

评分卡是综合个人客户的多个维度信息(如基本情况、偿债能力、信用状况等,重点关注偿债能力、还款意愿),基于这些信息综合运用数学分析模型,给个人综合评分,判断违约的可能性的工具。

生活中存在许多“显性”或“隐性”的“评分卡”。

例如:选购汽车--综合价格、油耗、安全系数、性能、外观等来因素。-> 买? 还是不买?

就分析方法发而言,现在分类算法有很多种,决策树,逻辑回归,支持向量机,神经网络等等,都可以实现这个目的。在以后的文章中,我们会详细讲解一下数据和模型的匹配性。数据决定了用什么模型。

风险策略

在给客户正确分类之后,即准确地风险分类。我们就可以采取相应的商务策略,优化业务:

- 流程简化:通过模型对客户分层,降低审核人员的工作量,提高审批速度。

- 风控优化:以客观分数代替主观评断,保证审批标准及风险偏好一致性。

- 风险定价:按照模型计算的违约率进行产品的定价

大数据风控模型的基本流程来主要分为四个部分:数据收集、数据建模、构建数据画像和风险定价。

具体考核数据如下图所示:

数据收集

大数据精准营销的蓝海领域,消费金融数据。这里简要归纳一下,互联网大数据包括:

00001. 用户行为数据(精准广告投放、内容推荐、行为习惯和喜好分析、产品优化等)

00002. 用户消费数据(精准营销、信用记录分析、活动促销、理财等)

00003. 用户地理位置数据(O2O推广,商家推荐,交友推荐等)

00004. 互联网金融数据(P2P,小额贷款,支付,信用,供应链金融等)

00005. 用户社交等UGC数据(趋势分析、流行元素分析、受欢迎程度分析、舆论监控分析、社会问题分析等)

数据建模

模型包含四大方面的数据:

一、个人/公司的基本信息,包括个人资历、个人/公司的信用信息、公司财务指标、家庭结构关系、家庭社会地位关系、个人社交关系、工商注册信息等;

二、个人/公司商务信息,包括线上零售交易信息、专利信息、个人/公司资质、土地出让/转让信息、质押抵押信息等;

三、个人/公司社会公众信息,包括涉诉信息、专利信息、被执行人信息等;

四、个人/公司社会关联方信息,包括自媒体、证券社区、行政监管/许可、行业背景、商标、招中标、行政处罚、抵押担保等。

常使用的模型:

1.聚类:比如常见的相似文本聚类,大量用户发相似帖子是常见的灌水行为,需要处理。

2.分类:比如我们根据已经识别的有风险和无风险的行为,去预测现在正在发生的行为,根据关键字动态去识别预测效果不错。

3.离群点检测:比如登录行为,当同ip登录大量登录失败,这种行为可能是暴力破解,当同ip登录基本全部成功,这种行为可能是机器登录,采用离群点检测发现这两类行为并处理等。

目前国内90%以上的建模团队都使用Logistic回归做评分卡,当然还有少数人使用决策树,神经网络和机器学习目前还没在此行业有显著成果。Logistic制作评分卡模型的衡量标准是K-S值的大小,依据数据质量和建模能力在0-0.5之间,一般在0.3以上才可用,好的模型可以达到0.35。芝麻分模型的K-S值在0.32左右。

应用案例:

1、欺诈风险用到模型主要是社会关系网络模型,通过每笔案件之间的关系,判断新案件是欺诈申请的可能性。

2、信用风险主要用到模型是逻辑回归建立评分卡(也有的用决策树),量化新申请人可能违约的概率,根据评分高低制定不同的授信规则和催收策略。

3、贷后管理也用到行为评分卡,例如额度调整和客户风险分池管理等。

大数据风控对模型的挑战:

1.模型的泛化能力:复杂的特征和模型可以增强模型的泛化能力,采用复杂特征和更多维度的特征是很有效的。

2.模型的可解释性:风控模型识别出来的数据需要做相应的处理,任何机器识别处理都不可能完全避免用户的投诉和异义,对于模型一定要了解业务特征,能够转化为客服和用户可以理解的语言去解释,使得任何处理我们都有理有据。

3.模型的更新速度:高对抗性场景下,模型快速更新是关键。

数据画像

用户画像的底层是机器学习,那么无论是要做客户分群还是精准营销,都先要将用户数据进行规整处理,转化为相同维度的特征向量,诸多华丽的算法才可以有用武之地,像是聚类,回归,关联,各种分类器等等。

对于结构化数据而言,特征提取工作往往都是从给数据打标签开始的。比如购买渠道,消费频率,年龄性别,家庭状况等等。好的特征标签的选择可以使对用户刻画变得更丰富,也能提升机器学习算法的效果(准确度,收敛速度等)。

我们在项目中根据不同维度提取了数十个多个标签,下图展示了其中的一部分。这些标签主要有三个来源:

一个类是在IT系统中可以取得的信息,比如办会员卡时留下的信息(性别,年龄,生日),购买渠道,积分情况等;

第二类是可以通过计算或是统计所获得的,比如用户对某类促销活动的参与程度,对某种颜色/款式商品的偏好程度,是否进行过跨品牌的购买等;

第三类则是通过推测所得,比如送货地址中出现“宿舍”,“学校”,“大学”等字样,则用户身份可以推测为学生,出现“腾讯大厦”,“科技园”等信息时,则可判断是上班族,并有很大概率是技术从业者。

在标签的设计上也带有较强的行业性,比如是否偏好购买当季爆款或是新品多于经典款(时尚度);是否更倾向购买低价或打折商品(价格敏感度);是否喜欢购买高价商品或限量版(反向价格敏感度)。

对于已经打好的标签,根据不同的分析场景进行离散化,或将分类类型的标签拆成多个0/1标签,就可以进行一些机器学习的建模了,比如聚类,分类,预测,或者关联性分析,最终生成的向量维度在数千个。

风险定价

量化风险管理的一个核心是风险定价,根据银行自身的风险偏好来对资产进行定价,高风险资产定价较高,低风险产品定价较低,根据风险高低来制定资产收益,RBP(基于风险定价)已经成为主流。

虽然对技术的应用日趋成熟,但现实的情况是,行业的业务模式仍然大量基于人海战术,与上世纪八九十年代传统金融企业的业务模式类似,在信用评级和风险定价方面过多依赖人的经验。

目前的互联网数据+金融已经开始改变这一状况。尤其是在P2P风控领域,互联网大数据积累已经让风控进入2.0时代。通过数据的积累,可以实现客户开发和数据采集通过人工完成。

多维度的风险定价系统

中国现实的难处是,个人信用数据缺失,央行征信只能覆盖25%人群。同时金融机构风险定价水平不高,导致市场难以发展。

目前京东用定价自己积累的数据推出了“京东白条”,蚂蚁金服开发淘宝购买者数据推出了“花呗”,这些都有一个限制就是只能在指定的服务商消费才可以用。但这也从一定程度上说明利用大数据可以实现业务的功能。目前,已有一些p2p平台通过接入了多家第三方数据用于风控。

通过对数据的整合、补充、调用、评判等,使风控模型运算结果更加准确。

定制化的风险定价系统

从商务智能的角度说,模型、评分、策略等都是为具体的业务服务的,脱离了具体场景的模型和评分是无本之木,无源之水,脱离了业务场景谈模型的准确性,没有意义。不同的业务场景,产生了不同的数据,不同的数据包含的规律,体现在数据分析中就是模型、参数和评分。

这也要求评分的模型在设计之初,就要考虑如何更加智能。不同的人风控模型也会不同,因此定制化的风险定价系统将成为未来的趋势。

投资不过是一场关于如何衡量胜算的游戏,你所要做的是计算每一笔交易的风险报酬比,并判断这笔交易是否划算,然后投入你所能承受风险的资金。记住永远给自己留下下一次交易的机会。30%交易技术+30%风险控制与资金管理+30%纪律+10%运气=投机成功。

老石公众号( gp688030


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

温馨提示:以上内容仅为信息传播之需要,不作为参考,投资需谨慎!
p2p理财
鲜花
p2p理财
握手
p2p理财
雷人
p2p理财
路过
p2p理财
鸡蛋

最新评论

  • 黄奕说生活中没有你是风儿我是沙黄奕说生活中没有你是风儿我是沙
  • 2020年国庆节中秋节放假 十一放假安排2020年2020年国庆节中秋节放假 十一放假安排2020
  • 黄之锋到警署报到时被拘捕 涉参与未经批准集结黄之锋到警署报到时被拘捕 涉参与未经批准
  • 周杰伦妈妈好会穿,时尚潮流走红毯都没问题周杰伦妈妈好会穿,时尚潮流走红毯都没问题
  • 第三者责任险重要吗 车损险第三者责任险重要吗第三者责任险重要吗 车损险第三者责任险重
热门新闻

热门新闻

关注我们

关注我们

关注微信公众号,了解最新精彩内容

网贷理财投资理财平台

热门推荐

网贷名词|平台介绍|P2P交流|薅羊毛|关于我们| xml|钱来也理财网 ( 豫ICP备17032623号 )

p2p网贷平台,p2p理财平台,p2p网络借贷,p2p投资理财,p2p理财产品,p2p投资平台

Powered by 钱来也理财 文章仅供参考,不构成投资建议!

网贷查询,p2p理财,p2p平台,p2p理财公司排名,p2p排名,p2p网贷

返回顶部