一、如何查询企业征信信息?
可以使用国家企业信用信息公示系统查询,不过现在也有很多专业查询企业征信信息的软件,比如启信宝这类的产品,只要输入企业名称,就能查询到公司自身风险及关联风险,如果企业有失信记录,会有相关的司法涉诉或者经营预警,包括裁判文书、被执行人、失信被执行、限制高消费、开庭公告、法院公告、立案信息、终本案件、股权冻结、司法协助,经营预警包括行政处罚、环保处罚、经营异常、税务异常、严重违法失信、严重违规建设、司法拍卖、清算信息、破产重整,还有动产抵押、股权出质、新闻舆情、企业年报等多种数据维度展示,若企业发生动态变更,启信宝会非常及时地向用户推送相关信息。
二、企业大数据之大数据征信及风控应用
企业大数据之大数据征信及风控应用
互联网人口红利区已经过去,获客成本增大,用户对产品的要求也越发提高,高价值和低成本服务是当前的一种趋势。其中,企业服务致力于为企业在生产,销售和沟通等环节提高效率,降低成本,受到越来越多的资本青睐。
随着人工智能对行业的渗透,以及数据量的剧增,越来越多的企业服务产品正利用人工智能,大数据等相关技术提供更智能服务,大数据作为人工智能模型中的训练"粮食",占据重要位置,如何挖掘和利用企业数据,是做好企业服务的一个重要途径,企业大数据来源主要有以下几个方面:
a.企业内部数据化档案,例如人事资料,纸质化资料等;
b.企业自产数据,例如企业内部OA,ERP和CRM系统所沉淀下来的客户数据,办公数据,生产经营数据,社交数据,电商数据,支付数据,供应链数据等;
c.企业信用数据
政府公开数据-比如工商的企业信用信息公示数据,失信被执行,被执行数据,裁判文书,开庭公告,法院公告,税务数据,动产融资数据,招投标,司法拍卖数据等,专利商标,行政处罚等数据。互联网公开数据-比如新闻数据,招聘网站数据,上市披露数据。
征信概述
1.征信定义
征信一词源于《左传·昭公八年》中的“君子之言,信而有征,故怨远于其身”。其中,“信而有征”即为可验证其言为信实,或征求、验证信用。现代征信是依法收集、整理、保存、加工自然人、法人及其他组织的信用信息,并对外提供信用报告、信用评估、信用信息咨询等服务,帮助客户判断、控制信用风险,进行信用管理的活动。
2.政策/技术/市场环境分析
政策
中国社会由熟人社会慢慢转变为陌生人社会,信用风险和信用危机也随之产生,加快信用体系建设迫在眉睫,然而,行政过程中尚未全面建立起“守信激励、失信惩戒”的机制,《政府信息公开条例》虽然已对政务信息公开作出了具体规定,但执行过程中,政务信息的公开尚不全面,部分信用信息的缺失,削弱了信用信息的完整性,不利于形成准确的信用状况判断.
技术
其次,互联网时代早已成为大家共识,企业和个人在网络上留下的大量数据,为征信带来了数据基础,且随着大数据,云计算,人工智能的发展,为智能化征信提供了技术支撑。
市场
另外,我国市场经济体制建立的时间不长,全社会信用意识和社会信用环境还比较薄弱。为争取经济利益而失信的行为时有发生。这既有信用意识淡薄的原因,也有失信成本过低的原因。征信作为金融的一个重要组成部分,是风险控制的核心,随着互联网金融的快速发展,适应互联网,大数据征信模式也营运而生,也亟需建立完善的征信制度来为征信发展保驾护航。
3.国内外征信模式
我国的征信出于初级阶段,目前国际上的征信模式主要有以下几种
a.市场主导型,美国,Equifa、Experian和TransUnion三大管理局按照市场经济的法则和运作机制,并对外提供服务给贷款授信企业,英国是P2P的发源地,以Zopa为代表网络贷款平台根据风险和利率水平促成借贷双方完成交易、使借贷双方都共同获益,在某种程度上发挥了信用中介职能。
b.政府主导型,德国,中国。以中国为例,主要是以政府主导,授权中国人民银行征信系统创建,收集,维护和整合全国部分企业和个人征信,目前已经覆盖了银行机构,法院,电信,社保,小额贷款等机构数据,目前覆盖个人和企业的数量上一直维持着增长势头,从2015年4月的8.64亿自然人、2068万户企业及其他组织增加到2017年5月的9.26亿自然人、2371万户企业及其他组织,中国大陆将近14亿人,企业及其他组织数量也在不断增加,征信系统覆盖范围还有很大的增长空间,总体上来讲,对企业的数据覆盖度不够,难以满足当前各种创新的金融模式对企业征信的需求。
c.行业协会共享,行业会员制,分享数据,并以行业协会为核心建立信用共享中心,加入协会的组织可以共享数据,并提供一定的数据支撑,以此扩大协会的数据源。
d.混合型,韩国、印度为例,以政府和市场混合,协同发展。
4.征信产品模式
征信行业的产品模式主要有按业务模式划分的企业和个人征信,按服务对象划分为信贷征信、商业征信、雇佣征信以及其他征信,各类不同服务对象的征信业务,有的是由一个机构来完成,有的是在围绕具有数据库征信机构上下游的独立企业内来完成。按征信范围可分为区域征信、国内征信和跨国征信等。
5.征信行业产业链
征信产业链包括上游的数据生产者、中游的征信机构及下游的征信信息的使用者,其中中游的征信机构运行模式主要有采集数据、加工数据及销售产品。数据供应商主要包括银行等金融机构、政府部门、工商企业和个人,几乎涉及人们生活的方方面面。征信机构从数据供应商处获得数据通过一定的模型进行加工处理得到信用评级结果,然后进行服务输出。征信报告使用方主要有房地产商、招聘企业、P2P平台、金融机构等,多数发生在个人购房和购车、个人小额信贷、企业信贷、债券买卖等场景。
6.面临问题
1.征信监管和法律健全亟需提高,政府信息公开有待加强,征信法律法规不够完善;
2.数据处理算法计算能力有待提高,随着大数据与征信的结合,对数据的处理,分析和建模能力提出了更高的要求,才能更好的挖掘出企业信息价值。
3.信用信息安全问题严峻,虽然国家一直在出台政策保护征信数据,但个人,企业的隐私数据安全面临十分严峻的挑战,催生了巨大的黑色产业发展,由此带来了金融诈骗,电信诈骗,网络诈骗,木马病毒窃取隐私数据进行交易获利等违法犯罪活动。
7.大数据征信与传统征信的区别
1.覆盖群体更丰富,随着网络的普及和互联网金融的大力发展,更多的人或企业将会留下数据到相关平台,扩大了征信覆盖的群体。
2.数据来源更广泛,传统征信的数据来源比较单一,但大数据征信会整合互联网公开半公开数据,第三方机构合作数据以及自由数据,数据来源变得更加广泛。
3.数据价值的深入挖掘,随着大数据和人工智能在征信行业的运用,机器学习,NLP,文本抽取等技术对企业数据的挖掘更加深入。
企业信用数据的行业运用
1.信贷风控,金融的核心是风险管理,目前主要由政府信用公示机构,比如国家企业信用查询网,中国失信被执行网,中国被执行信息网,法院网,信用中国等公开查询数据,为信贷金融机构提供贷前,贷中,贷后的信息查询,信用报告和监控等服务。
2.融资租赁,为融资租赁公司提供融前尽调,融后监控服务,提高工作人员效率,并通过集团化账号系统深入各个业务部门,提升工作质量和效率。
3.信用评级,根据企业的工商,法务,新闻,经营,债卷等多维度数据,对企业进行信用评级,常见的是债券评级.
4.供应链金融,围绕核心企业,管理上下游中小企业的资金流和物流,并把单个企业的不可控风险转变为供应链企业整体的可控风险,通过立体获取各类信息,将风险控制在最低的金融服务。
5.其他,比如招聘,商业调研和律所。
企业征信的未来展望
1.数据共享
数据作为征信和风控行业的核心资产,也是构建信用社会的基石,过分孤立或过分共享都不利于行业发展。所以,如何在实现共赢,保护隐私的基础上做到数据共享,打破数据孤岛,打通各个平台的数据通道,让不同的数据汇集在一起,共同打造征信体系,是未来的发展趋势。
2.挖掘数据价值
随着大数据征信技术的不断发展,征信产品将从信息的初次挖掘向深层次挖掘发展。初次挖掘是指围绕企业相关数据,通过自身爬取入库,第三方API接口或数据合作等方法整合并进行数据汇总分类,并以信息报告,图片等方式简单罗列呈现。深层次挖掘是将收集到的数据与征信专业知识相结合,构建风险识别与量化,规则引擎,企业关联图谱,数据可视化等产品,对数据进深度挖掘,从而深化征信产品与服务,提高征信产品的专业性。例如利用企业工商信息,建立企业关联网络,当网络上某一企业出现负面信息时,能够迅速识别风险并预警其他企业,并根据风险情况量化预警等级。
3.提供垂直,细分领域服务
随着征信市场规模的不断扩大,部分征信机构基于自身特点及优势,开始出现专注于某一细分领域或某一业务环节提供具有针对性、定制化的征信产品服务的趋势。例如提供爬虫技术,一站式爬取,清洗,整合和入库;针对新闻的舆情监控服务;提供企业获客服务,为金融机构筛选优势客户,实现精准营销;提供企业金融服务,比如理财,融资,支付和信贷;提供C2B,B2B的股权投资撮合平台等。
三、利用数据和专家模型实现对企业的信用评级
当一家企业申请贷款时,我们会对他进行一个评级,那么企业的评级是怎样产生的呢?首先我们来看一下什么是企业的评级,如下表所示:
从表中可以看出,企业的评级通常形式是AAA、AA、AA-等形式。那么是哪些因素决定了企业的评级呢?本文将简单阐述一个企业评级产生的过程。
首先,我们需要理解评级的含义,例如上文的AAA、AA+、AA-代表了什么?直观的理解肯定是AAA最好,但更为专业的解释是什么呢?我们引用标准普尔来作更为专业的解释:
从上图我们可以看到,评级更多的是对偿还债务能力的一种度量,通俗的来说,就是这个企业是否会产生违约。转化为数学描述,即该企业违约的概率。这样评级其实就转化为了一个二分类问题,我们就可以使用Logistic回归、GBDT、随机森林等机器学习方法来处理。
因此,我们Y值很容易可以判断为“是否违约”,我们X特征变量则可以表示为该“企业的相关数据”。
第一步我们需要确定我们的Y值,即是否违约。违约的定义可以参考《巴塞尔新资本协议》规定,同时需要考虑违约的时效性问题。比如用户在2018年违约了,但是在2019年偿还了,那么他只能算在2018年的违约样本中,如果用户在一年之内有多次违约,我们取最早的违约日期为违约日。因此,评级一般也是半年或者一年发起一次,遇到特殊情况,客户经理也可以手动发起评级。
一般企业的相关数据最重要的当然是财务报表,它主要包括资产负债表、损益表、现金流量表。财务报表的一般数据处理包括指标计算、量纲统一、勾稽关系检查、会计恒等式检测、新旧准则转换计算。财务报表口径又分为合并、本部、汇总,时间周期可以有月度、年度,在数据匹配时也应制定相应的优先级,在保证数据准确性的同时,也尽可能的增加匹配率。
财务报表匹配上有一个意思的问题是时间匹配。例如用户在2019年12月31日违约,那财报我们应该选择哪个时间点的呢?太近太远都会失去建模的意义,通常业内的做法是好用户匹配12个月以前24个月以内能匹配到的最近财报,违约用户则匹配违约时间前6个月以前18个月以内的能匹配到的最近财报。如下图所示:
为了更准确地对企业进行评级,除了财报之外,我们通常会通过购买等渠道,获取企业的征信、工商、税法数据。征信数据除了企业的征信,我们还会获取企业法人、实际控制人的征信数据。
工商、税法该类数据的主要问题是匹配度一般比较差,非常稀疏,通常不太适合应用在建模中,但我们可以在反欺诈、黑名单的第一道关卡中进行使用。
数据准备完成后,就是数据建模过程。通常企业评级的数据建模主要有数据清洗、单变量分析、相关性分析、变量转换、穷举模型、模型确定这几个步骤,本文不再详细描述建模过程,感兴趣的同学可以自行查找资料,建模是比较常规的过程。其中比较有意思的是变量转换,无论是个人还是企业,我们一般都喜欢最后生成一个分数来描述这个特征或者这个主体,简单的方法可以根据四分位法来确定0-100分的划分区间,需要同时考虑该指标是越大越好还是越小越好。
需要注意的是企业评级一般在数据量较小的时候会加入人工专家判断。例如在变量选择和模型确定上,除了考虑模型选择指标还需要考虑模型的可解释性,模型可解释性在金融领域是非常重要的,也涉及一定的监管要求。
由于企业授信一般额度特别大,但违约样本数据不足,业内很少有纯依靠机器学习的方式来进行评级,也要参考很多专家的意见,当我们在进行其他类似项目评级的时候,这种评级策略也给了我们很大的参考。试想,如果现在给你7个专家,你需要他们给你选出最重要的特征属性,你应该如何来汇总和综合他们的意见呢?这里我们使用层次分析法(AHP),方法的相关概念大家可以自行查找资料。我们会提供一种调查问卷的形式,将候选变量给专家们,让他们进行排序,生成一个表格如下:
其中1-9代表重要性越来越低,通过专家们的选择,我们有了一张各专家判断的指标优先级,也可以看出指标三是非常受到专家们的认可的。那么我们如何综合这些专家的意见呢?首先我们要得到每一个专家每一个指标的权重,然后再求得所有专家的每一个指标的平均权重。
计算步骤如下:
假设a 1 、a 2 、a 3 、……、a 9 代表重要性排序后的9个指标,以最重要的a 1 为锚点,各个指标和a 1 的重要性比较关系可以用公式表示为:
通过上面的模型计算后,最终我们产出了一个企业的分数,到这个时候就离最终评级AAA、AA+等等只有一步之遥了。
比较粗放的方式,我们可以直接拉出所有企业分数排序,然后根据你最终要的评级等级数量(AAA、BB、CC等级数量)进行均分,依次从高到低给予一定评级。但这种均匀分割存在一定弊端,例如AAA级和AA+级的间隔就和BBB和BB+级的间隔相同,这显然是不符合常识的。理论上来说,特别好的客户是相对较少的,特别坏的客户也是相对较少的,大量客户应集中在中部。我们自然的想到我们需要的评级区间的分布,Beta分布正好合适。
确定使用Beta分布后,我们需要调整α,β参数,调整参数就需要很多经验、不断尝试以及业务要求和监管政策要求了。比如每个评级等级分布增幅幅度、每个评级等级分布的违约概率,最终产生的整体违约概率等等。通过使用python的scipy.stats包pdf函数,我们可以很轻松地画出这个曲线。然后使用scipy.stats包的cdf函数就可以得到均匀分布点在Beta分布上累计分布函数值。
以α = 5.1,β=5为例,Beta分布曲线为:
最终通过这个分布区间来分割已排序好的所有企业的分数,映射到相应评级,这样我们就产生了一个企业的评级。
当有新企业来申请授信时,提交相应的财报数据,银行对财报进行勾稽检查和其他质量检测,获取相应的征信、工商、税法,应用我们配置好的模型,我们就可以快速的得到一个对应评级。
本文概述了面对一般企业的评级方法,详细阐述了比较有趣的专家模型产生的过程。当然,企业的评级远远比本文描述的复杂,例如遇到金融机构、事业单位、学校、医院等数据量较少且违约样本几乎为零的情况,我们如何对他们进行评级。同时,企业的数据质量相较个人来说存在很多问题,在特征处理时将耗费大量时间。并且企业的授信额度相对较大,模型更多还是参考为主,背后还得依赖于优秀的授信审批部同事。
得到企业的评级只是第一步,后续我们可以根据相关准入政策确定准入评级,并根据评级给予企业不同的额度。同时,评级是有时效性的,需要定期重新评级,并对企业进行实时监控,当突发情况发生时,及时调整评级。
最后,当我们得到了企业评级,预估了企业违约概率,但不同的债项发生违约时,有的可能全部损失,有的可能部分损失,这个应该如何量化呢?将在后续的文章中和大家分享。
四、浅谈征信修复行业
当下征信修复行业成为了热门话题,而这一行业为什么会出现?大家都知道这一行业很赚钱,其中奥妙在哪里?我们对行业前景做一个简单的分享:
首先要了解征信发展的历程,最早的是1932年第一家征信机构叫做中华征信所,他是我们征信业发展的开始,到了1993年专门从事企业征信的新华信国际信息咨询有限公司正式对外提供服务,这就标志着新华信国际信息咨询有限公司正式成立,他是专门从事为企业征信提供相关服务的企业,1996年开始人民银行在全国推行企业贷款制度当中,1997年上海开展企业信贷资信评级,经中国人民银行批准,
上海市进行个人征信试点,1999年上海资信有限公司成立,开始从事个人征信和企业征信服务。1999年底银行信贷登记咨询系统上线运行,2002年银行信贷登记咨询系统建成实现全国联网查询,2004年,人民银行建成全国集中统一的个人信用信息基础数据库,2005年银行信贷登记咨询系统升级为全国集中统一的企业信用信息基础数据库,2013年3月,征信管理条例正式实施,明确了中国人民银行为征信业监管管理部门,征信业步入了有法可依的轨道,以上就是我们中国征信业发展的历程。
随着我国相关法律的不断完善和健全,时至今日我国的征信系统已基本建成为一个基本健全的 社会 体系
我国征信体系涵盖四大征信系统
一、银行征信系统
二、等三方征信系统
三、信联征信系统
四、大数据征信系统
一、银行征信系统
记录了客户与银行之间发生的信贷交易 历史 信息,只要客户在银行办理过信用卡、贷款或者为他人担保过信贷业务,他在银行登记过的基本信息和账户信息就会通过商业银行的数据报送而进入个人征信系统,从而形成了客户的信用报告。
二、第三方征信系统
这些机构利用自身系统或者技术优势,对主体的信息进行采集、加工和整理,使用特定的模型得出主体信用,然后向授信机构提供服务,包括我们现在的支付宝或者京东等。
三、信联征信系统
信联是央行批准的第一家持牌征信机构,它记录的将是互联网金融行业全网的信用情况,百行征信由中国互联网金融协会和八家征信公司共同筹建,公司注册资本人民币10亿。其中中国互联网金融协会持股36%,芝麻信用,腾讯信用,深圳前海征信,鹏元征信,中诚信征信,考拉征信以及中智诚征信和北京华道征信这八家征信平台各持股8%,成立了我们现在的信联。
四、大数据征信系统
指无法在一定时间范围内,用常规的软件工具进行捕捉、管理和处理的数据集合是需要先处理模型,才能够具有更强的决策力,洞察发现力,和流程优化能力的海量信息资产,而大数据征信创新主要表现在覆盖人群广泛、信息纬度多远、应用场景丰富及信用评估全面四个方面,由此带来了征信成本的降低和征信效率的提高。当下大数据也是热门话题。
个人征信报告是个人征信系统提供的最基础的产品,记录了客户与银行之间发生的信贷交易 历史 信息,只要客户在银行办理过信用卡、贷款或者为他人做过担保等信贷业务,他在银行登记过的基本信息和账户信息就会通过商业银行的数据报送而进入个人征信系统,从而形成了客户的信用报告。个人信用报告中的信息主要有6个方面:1公安部身份信息核查结果2个人基本信息3银行信贷交易信息4非银行交易信用信息5本人声明及异议标注6查询 历史 信息
个人信用报告的使用目前仅限于商业银行,依法办理信贷的金融机构主要是住房公积金管理中心、财务公司、 汽车 金融公司、小贷公司等等;消费者可以根据使用对象的不同在人民银行获取自己的信用报告。
个人征信系统,提供不同版本的个人信用报告,包括银行版、个人查询版(详版和简版),征信中心内部版三种版本,分别服务于商业银行、金融机构、消费者和人民银行,不管是商业银行、消费者,还是人民银行查询者查询个人信用报告时都必须取得被查询人的书面授权,并且留存被查寻人的身份证复印件,个人征信系统已经实现了在全国所有商业银行分支机构都能接入并且查询任何个人在全国范围内的信用信息,根据个人信用基础数据暂行管理办法当中的规定商业银行仅在办理如下业务时可以向个人征信系统查询个人信用报告:
1、审核个人贷款、贷记卡或者准贷记卡申请时
2、审核个人作为担保人时
3、对于已经发放的个人信贷进行贷后风险管理时
4、受理法人或者是其他组织的一些贷款申请或者是其担保人需要查询其法定代表人以及出资人信用状况时
消费者可以向征信中心、征信分中心以及当地人民银行分支机构查询本人的信用报告提交书面申请
第三方征信来源于电商、公共平台、社交平台,通过这些平台来抓取相关信息纳入到第三方征信机构,再通过第三方征信机构输出给一些有需要的数据服务机构。
信联是中国各家征信机构的霸主,各有各的神通,各有各的领域,芝麻信用借助淘宝、天猫以及支付宝交易记录来判断一个商户或者一个人的信用;腾讯则利用社交工具和微信交易记录来判断一个人的信用;前海可以依托平安集团数以亿计的企业和个人的客户信息以及其在平安集团的平安保险的记录。换句话说互联网的第一大股东银监会及8家机构的信息整合共同构成了中国14亿人口的信用画像。
马云欢呼流泪:他期盼已久的让信用等于财富,让讲信用的人先富起来这个梦终于可以实现了!!以后只要扫一下一个人的脸你的信用值多少就一目了然,能不能和你做生意,敢不敢和你谈恋爱先看一下你的信用分值,所以我们百行信用为首、人无信而不立这些话即将真正成为现实,信用聚变、天罗地网。
大数据已经成为了全新的生产资源,数据的数量、种类以及速度在爆炸性方式增长,那么金融行业从来就是一个跟数字和风险打交道的行业,不管客户的体验提升还是金融分线广厚都需要有大数据能力的支撑和保驾护航,大数据技术日渐成为金融客户关注的焦点,而大数据帮助金融客户挖掘其拥有的海量信息,同样可以做到精准用户行为
信用的核心价值在于未来的信用应该从现在开始打造,因为未来我们都是用信用去融资,用信用去贷款,信用是可以放大的,信用是我们每个人最大的无形资产,所以我们一定要好好的珍惜信用、运用好信用、发挥信用带来的红利。
我们常听到,信用融资,下面说一下信用融资的组成?
组成了我们每个人的信用征信打造的一个数据的系统
1、55%有征信和大数据组成
2、25%的有形的资产,包括不动产,现金,理财等等
3、15%是属于你的无形资产,包括知识产权, 社会 地位,权利,口碑等等
4、5%属于环境因素,包括你的城市人脉关系等等
五、如何运用大数据为征信服务
二十多年间,伴随着经济体系的变革,我国企业信贷体系发生了重大的变化,由以大型企业为主要贷款群转变为中、小、微企业成为贷款主力军。面对新的贷款群体,银行等资金机构无法充分地给予资金,造成了日益严重的“中小微企业融资困境”。小微企业贷款的瓶颈是“缺乏高效率、低成本、高精度基础征信服务”。在此背景下,小宇宙给大家讲解几种大数据征信的探索之路。
一、 大数据征信诞生的背景
二十多年间,伴随着经济体系的变革,我国企业信贷体系发生了重大的变化,由以大型企业为主要贷款群转变为中、小、微企业成为贷款主力军。面对新的贷款群体,银行等资金机构无法充分地给予资金,造成了日益严重的“中小微企业融资困境”。林毅夫早在2001年《经济研究》发表的文章《中小金融机构发展与中小企业融资》,认为小型金融机构更适合服务于小企业,奠定了我国之后大力推动中小型金融机构发展的理论基础。城市商业银行、农村信用社、小额贷款公司纷纷成立,带动全社会的小微企业贷款产品激增,资金供给量大大提高,数年间小微企业融资环境得到了很大的改变。
然而,小型资金机构的出现并没有从根本上解决小微融资的困境,相对于大企业,小微企业对资金的占用比例极低(约30%),与小微企业对GDP的贡献(约70%)极不相称。近年来,小微企业的生存压力不断增大,传统行业竞争激烈,利润空间被不断挤压,赊销使小微企业面临残酷的资金周转压力,因资金链断裂倒闭的小微企业比比皆是。这种情况更加剧了资金机构“惜贷”行为,对小微企业贷款的负面预期导致小微企业贷款收缩,小微企业、小型金融机构两方陷入恶性循环。小微企业和小型资金机构处于整个信贷体系的最底层。
小微企业信贷的困局看似很复杂,牵扯宏观、微观各方的行为,但实际我们看所有小微信贷的难点,全部集中于一点:资金方认为无法看清小微企业的风险,自然不能放款,这称之为“信息不对称风险”;既然无法识别风险,资金方制定了回避小微借款的贷款政策,形成了“逆向选择”,小微信贷就此止步,陷入无钱可贷的困境。无论是大型银行,还是小型资金机构,都面临同样的问题,所以都对小微信贷无计可施。这个问题可以笼统地称为社会诚信体系欠缺导致信用风险高。
信用体系欠缺导致资金方难以看清小企业实际情况,这有着现实的原因。我国的小微企业内部管理是很随意的,很多交易不会以规范的方式记录下来。正规的资金方需要经过严密的尽职调查第一还款来源(依靠经营偿还借款),辅之以第二还款来源(抵押品),才能做出决策。这个过程可以称之为“征信”或者“信用审核”。前面我们已经分析过,由于资金方缺乏有效的可利用于小微企业的信用调查、审核手段,对于小微贷款项目,这个过程不但冗长成本很高,而且通常难以找到准确、真实、有价值的信息,阻碍了小企业信贷的成功率性。同样,对于那些私募资金机构、民间资金机构,本来没有能力进行相关调查,放贷只能靠感觉和其他手段,风险更大。
由此,我们可以得出结论:小微企业贷款的瓶颈是“缺乏高效率、低成本、高精度基础征信服务”。可以想象,如果资金方有能力以一种低成本的方式准确识别小企业是否可信,再加以辅助风控措施(担保、抵押等),小微业务将变得有利可图,资金通道可以就此而打开,小微信贷就会变得顺畅而有序。大数据征信正是在这种社会背景下应运而生的。
二、 大数据征信技术的几条探索之路
随着大数据技术在各行业的深入应用,运用大数据为征信打开一条通路,逐渐成为了社会主流的意识。信用服务从业者、政府信用办公室、互联网金融公司对此进行了不懈的探索,期待找到一种可以针对于小微企业的量化深度评判方法。下面我们分析一下当前主要几种方法的特点。
(一) 量化信用评价(评级)模型(由内而外型)
多年以来,信贷机构、征信机构和评级机构一直期待着能够形成一个量化信用模型,将各方面的数据导入模型之后,能够自动生成评级结果,提示是否可以放贷。经过长期的探索、研究、试验之后,这个理想的模型一直没有出炉。我国部分有实力的资金方引进日本、美国知名咨询公司的信用分析模型,但这些模型对我国的实际情况的适用性很差,没有达到期待的效果——导入相关数据后即可对企业偿还能力和偿还意愿作出可靠的判断。
国外的先进模型以及国内机构的多年模型探索,都没有形成一个普遍性有效的评判小企业的量化模型,主要原因是我国小企业的数据质量低下。由于无论国内外使用的企业数据主要是财务报表数据,而财务数据是会计师事务所出具的。我国诚信体系存在巨大缺失,会计师事务所出具的审计报告几乎是制造出来的,其可信度很低。对于诚信企业,这份报告具有较大的参考性,而对于蓄意骗贷企业,也未必能够从审计报告中看出破绽。各种量化模型的探索之所以没有得到令人满意的结果,正是由于其所依据的数据质量是低下的,所以无论如何也不可能得出真正有价值的信息。这种方法基本上宣告了是无效的。
(二) 外部数据库接入(由外向内)模式
在企业内部数据质量不佳的条件下,各类机构开始向外寻找广度更大、更加可靠的数据来源,例如政府各部门的数据,税务系统数据、工商信息、行业主管单位业务数据、海关数据等,各行业协会的经营性数据等,也有在电商平台上积累的交易数据(如淘宝上的交易数据)。基于这些数据查找与某企业相关的数据并进行综合分析。我们称之为“由外向内型”的数据体系,也就是企业征信服务不再是从被评价的企业提取数据,而是运用外部数据体系实现。
这种模式的优势在于:数据库系统形成之后,单个企业的征信信息采集将非常容易,征信服务的边际成本极低,且速度极快,直接带来的好处是征信服务的收费将非常低廉,并且服务量很大。但这种模式也存在自身的劣势:对接多部门数据入口是一项巨大的系统工程,建设、磨合的成本很高,当前除了工商信息可以达到全国联网外,其他部门信息均在分布在市级部门,整合工作相当巨大。另外,也是最严重的问题还是数据质量。我国的小企业对外报送的经营信息具有很大的随意性,都是根据具体需要编出来的,例如为了避税、贷款或者其他目的。有些地区政府为了鼓励当地企业发展,给予很高的纳税优惠,比如核定一个固定纳税额度,这样的话就不会要求企业如实报送。因此,从各部门搜集到的数据恐怕与实际情况相差较远,如果用做征信服务,可信性也会遭到质疑。同时,一个企业产生的数据并非全部对外报送,事实上,对外报送的数据仅占一小部分,如基础财务报表、应纳税额等,而大部分的能够说明企业情况的数据沉淀在企业内部,如供销信息、产品品类、资金流转等,这些数据无法通过外部数据库找到。外部数据库的数据量虽大,但针对于某单一企业,却显得容量不足了。如果是电商内部生态圈数据也相对片面,因为一个企业不会仅仅通过一个电商渠道销售,单一电商交易数据显然是不够全面的。
如果用外部数据编织数据网的话,这张网将是巨大的,几乎可以覆盖全国的企业。但由于关于某一企业的数据量不足,这张网的数据线条比较稀疏,也就是数据网眼很大,多数关于企业的有价值信息都被漏掉了,有效信息过小,不足得出可信的结论。这就是由外向内建立征信数据体系的探索。
自国务院交办发改委建立全国信用体系以来,各级政府信用办公室主导将辖区内各个掌握数据的政府部门连接起来,形成一个统一的信用信息平台,由专业的第三方公司或者设立下属公司运营,出具满足社会需求的征信报告。除政府外,也有社会征信机构做类似的事情,接入一些政府端数据并运营。从目前的发展来看,这类征信服务当前能够提供的最主要的信息是工商注册类的信息,以及少量的各部门备案信息。这类征信服务提供的信息简单,收费低廉,但对于信贷业务而言,基本上没有发挥太大的作用。
(三) 单体企业数据征信服务(由内向外)
另外一种数据征信服务,是从企业内部挖掘有用信息,从这个角度来说,这种方法和传统的征信方法是一致的,不同的是采集的信息和分析模式。现在有些专业征信公司也在研发由内而外的数据征信方法。这种方法利用的数据量不像社会征信的数据量那么大(因此称“小数据”),但与贷款相关度很高,再保证真实度的基础上,可以得到很多有价值的信息(“大信息”),并且均为信贷业务中资金方最关注的信息。该项服务可以帮助资金方在最短的时间内评判该企业是否能达到可以贷款的条件,为资金方节约大量的调研时间和成本,适应小微企业融资的效率要求和风控要求。
数据征信虽然应用的基础数据量不像政府部门数据那样多,那样大,但采集到的都是相关度最高的信息,可以捕捉企业真实经营情况和偿还能力。如果从数据网的角度看,这种方法形成的数据网较小(只适用于某单个企业),但数据“网眼”恰好适合保留住关于该企业的大量有价值信息,而筛查掉无关信息、干扰信息,形成深度、高质量的征信报告,为信贷决策提供可靠依据。
这种数据征信服务的优势是,启动快,无需长期建设成本,很好地适应我国现有的信息基础和社会现实。其难点在于如何取得借款企业的充分信任因此愿意提供深度数据。
企业数据征信技术已非一个技术上的构想,而是已经开始了大量的实践。数据征信已经在担保业务、小贷业务中发挥了重要作用,帮助担保公司和小贷公司排查风险、清晰评估项目、提高业务效率。相信随着市场环境的变化,将有越来越多的人意识到这种技术的价值。