大数据征信何去何从?盘点:海外大数据征信现状

作者:俞学劢 来源:鸣金网
2015-12-08 10:25:17

FICO评分

FICO评分体系是在美国被普遍应用的评分标准,由FICO公司于1989年发布。FICO公司成立于1956年,专业从事于商业分析和信用评估,随着时代的进步,现在的FICO公司已经成为了一家大型分析软件及工具开发商,客户遍布全世界,包括了摩根大通、戴尔、花旗、桑坦德、宝马等等(FICO,2015)。FICO评分体系是被最广泛运用于银行及授信机构的评分体系,其客户信息来源于三大征信调查机构:Experian,Equifax以及TransUnion。FICO评分通过5个方面的加权平均来衡量客户的信用评级,分别为30%的待还款额、35%的还款历史、10%的信贷组合情况、15%的信用资料存续时间以及10%的新申请授信内容。FICO公司开发过各种版本的评分标准,当前广泛被运用的是标准8。其余版本如车贷8、银行卡9、标准5等版本使用了不同的算法,以针对更为细分的授信用途(myFICO,2015)。FICO标准8的评分范围为300-850,越高的分数代表了更低的信用风险。据统计截止2015年11月,美国FICO标准8评分的平均数是695,为近十年最高数值,并且有近20%的申请者有高于800的评分(Hannon,2015),可见大多数美国授信申请者的信用状况也正随着经济状况的恢复逐渐提升。

然而,就从美国的情况来看,全美国仍然有多达3500万人由于无征信相关文档的原因无法被传统征信体系赋予信用评分(VantageScore, 2013)。于是人们迫不及待地开始了对新征信模式的探索。

大数据先行者YODLEE

YODLEE成立于1999年,通过提供大数据分析服务连接了4500万个人客户、以及富达投资、美国运通等美国前7大金融机构客户,也因此获得了多达12500个数据源头(Empson, 2011)。YODLEE通过整合大型金融机构的银行信息,为客户提供了一站式信息数据的查询与分析服务,并通过FinApps的形式为客户打造了一个移动理财平台。用户可以在FinApps上同时登陆多个银行账户,并轻松完成银行及金融机构间的转账、开户、还款等操作。用户还可以通过FinApps的记账功能获得自己的定期财务报告。事实上YODLEE针对个人客户的服务与当前支付宝所推行的集中式移动金融平台很相似。针对企业客户YODLEE则设计了零售银行平台、财富管理平台以及一般企业财务平台,帮助各类型企业提供集中式的金融与财务管理系统。

YODLEE的商业模式就是通过为客户提供数据的形式获得客户更多的数据,更多的数据也将使得YODLEE能够开发出更为完整的数据分析服务,提供更多元的商业解决方案。目前为止YODLEE已经获得了50项专利,并覆盖了80%的市场份额(YODLEE, 2015)。

手机数据源First Access

根据世界银行的报告(2014)全世界人口中有近1/3的人没有银行账户,因此对这些人来说不仅银行征信资料是缺失的,甚至任何资金的记录都是空白的。但相比而言,拥有手机的人口则占到了全世界的3/4(World Bank, 2012),也就是说拥有手机的人比拥有银行账户的人口数量更多。因此First Access就瞄准了非洲等发展中国家的市场,因为发展中国家的许多个体商户需要银行贷款的支持,但却由于没有任何银行数据,无任何信用记录可被用于贷款审查而难以获得贷款支持。First Access则通过查看客户的手机通话记录与短信记录来对客户的信用状况进行评判。First Access监控的并不是通话与短信的内容,而是通话的时间、时点、地理位置、频率、通话费用等数据,从而通过分析这些数据形成对客户的行为特征判定。在特点的客户的行为特征模型形成之后,他人与之的通话也将成为其他客户行为特征的判定因素之一。最终First Access通过内部算法算出相应的信用额度。整个过程由于是自动化算法分析所完成的,因此从客户同意提供数据到信用额度的公布仅需要几分钟的时间(Wolkowitz and Parker, 2015)。

心理学分析VisualDNA

不同于大多数致力于统计学或者数学模型的大数据分析,来自于英国的VisualDNA则以心理学为切口,通过用户回答问卷的答案及网络行为记录形成一个心理学特征,从而根据用户的心理学特征赋予相应的信用评级。VisualDNA的设立目的和First Access相似,意在为没有传统征信数据的申请者提供可信的信用分析。需要申请贷款的用户通过完成一份问卷并同意VisualDNA访问其Cookie数据,从而综合分析用户的行为习惯,形成一个相对完整的行为学分析结果。VisualDNA的行为心理学模型来自于剑桥大学、哥伦比亚大学以及伦敦大学学院,模型遵循现代个性心理学创始人奥尔波特的开放性、尽责性、外倾性、宜人性、情绪不稳定性的人格五大特质,并根据三大世界级高校30多年的心理学研究成果,形成了与时俱进的行为学分析新方法(VisualDNA, 2015)。

值得注意的是,VisualDNA正如其名,所有的问卷的选项设计均为图片,因为他们表示相比于文字,图片更能激发人的潜意识,从而形成更为真实的性格反馈。笔者也亲身完成了一次测试,获得的结果确实与大多数周围的人对我的评价相似,VisaulDNA还在结果中向我推荐了能够帮助我更积极面对生活的书籍,整个过程的互动性很强,也确实让我更好地认识了自己。

大数据据在何方

由于大数据的定义即在于数据量的庞大与繁杂,因此在高达几ZB数量级的数据量中几乎无法保证每一个数据的真实性。人们将这个时代形容为信息爆炸时代,也因此,在信息大爆炸中所产生的尘埃或者说无用数据也实际上在不断地侵蚀着大数据的数据质量。除了无意义的噪音数据之外,虚拟数据的易变性也挑战着这个大数据时代的数据质量。从文字的修改到图片的PS,再从声音编辑到影像特效,虚拟数据的表现形式几乎已经没有不可被更改的部分,当前的互联网架构也无法做到对每一次数据的更改进行历史性的留存,因此每一份数据的真实可信度变得羸弱不堪。

除了数据本身质量的难以捉摸,通过数据挖掘所进行的分析过程也神秘莫测。由于数据挖掘与分析的算法是各类大数据分析机构的核心商业机密,因此没有任何网站会将自己的算法完全公开。然而美国公平信用报告法(FCRA)中指出,任何针对用户信用评级的反向操作均需要向客户解释细节原因,也就是说信用评级机构若对特定客户的信用进行了降级,则需要向该客户具体说明降级的原因和背后的降级机制(Ammermann,2013),然而现实则是,不论正向或反向的评级操作,客户们都从来无法得知其中的缘由(Wolkowitz and Parker, 2015)。这就将大数据征信推到了一个合法、合规的领域去讨论。

事实上从合法性上来看,大数据还涉及到了隐私权益的侵犯。由于许多当前的大数据来源于互联网,但通过互联网所获取的数据来源却无法考证。根据世界隐私论坛的报告,当前可被用于买卖的数据包含了人口学信息、联系方式、就医记录、资产信息等各类个人信息(Alloway, 2015),而这其中涉及个人隐私的部分却显然无法在买卖的过程中征得数据源个人的同意。这些隐私数据的来源或许是黑客主动地非法入侵,亦或者是有安全漏洞的网站自身泄露用户的信息,不论如何,隐私数据的买卖显然触犯了法律。

除了合法性的问题,大数据征信还引起了人们对其所带来的道德问题的关注。一篇发布于美国国家科学院院刊的论文就针对Facebook的社交数据进行了人格特性分析,并将数据分析的结果与被调查对象的真实情况进行了比对,最终发现相比于是否吸烟、是否酗酒等行为习惯,数据分析针对于用户的肤色、性别、性取向、宗教信仰等因素的预测更为准确(Kosinski et al, 2013)。而互联网大数据的来源难免会涉及到网民们庞大的社交网络数据,于是大数据征信的结果是否符合人权平等的道德观也引起了社会的普遍质疑。事实上,由于大数据分析的数据均来源于历史行为,因此也有质疑认为这与传统金融并没有任何区别,仍然会造成需要钱的穷人拿不到钱,而有钱人却可获得更多的信用额度去挥霍(Alloway, 2015)。

数据世界的未来

也许针对于数据世界的真假验证,我们可以借鉴更多密码学的概念。类似于当前热门的区块链技术那样形成一个具有自证明特性的数据架构,每一份新更改数据的数据摘要中都包含了前一版本数据的信息,而在链上的用户都可以通过自身所保持的历史数据冗余验证每一步历史更改的变化,然而却因为加密的特性,链上的用户只能验证却不能更改,这样就保持了数据真实性和可追溯性。

而关于数据内容有效性的分析,或许真的应该更为人性化。如同VisualDNA那样以心理学的角度进行分析,而不是将多种数据简单地进行统计学的回归分析。就像谷歌最新的验证码识别插件reCAPTCHA取消了主动输入文字进行验证的过程,而是能够通过后台对用户行为的“人性”进行判断,即可将人类用户访问与计算机的机械访问区分开来一样(Google, 2015)。人工智能的目标是让计算机对数据的分析更为人性化,让计算机通过数据能对人的行为进行更完整的理解。或许大数据征信的未来将回归最原始的征信模式,信贷经理面对面地与客户交谈,查看客户的资料,并判断客户的信用状况。只不过在这里,整个过程可能只需要几分钟甚至几秒,但比起现在的算法所产生的简单逻辑,它/他/她的分析将更有人情味。

参考资料(Reference list):

Alloway.T (2015) Big data: Credit where credit’s due, Financial Times, Available from: http://www.ft.com/cms/s/0/7933792e-a2e6-11e4-9c06-00144feab7de.html#axzz3tF8B46LN [ Accessed on 07/12/2015]

Ammermann. S(2013) Adverse Action Notice Requirements Under the ECOA and the FCRA, CONSUMER COMPLIANCE OUTLOOK: SECOND QUARTER 2013,Available from: https://consumercomplianceoutlook.org/2013/second-quarter/adverse-action-notice-requirements-under-ecoa-fcra/ [Accessed on 07/12/2015]

CSC(2015) BIG DATA UNIVERSE BEGINNING TO EXPLODE, CSC, Available from: http://www.csc.com/insights/flxwd/78931-big_data_universe_beginning_to_explode [Accessed on 07/12/2015]

Empson.R(2011) With Top Banks In Tow, Financial Service Provider Yodlee Hits 30 Million Users, Tech Crunch, Available from: http://techcrunch.com/2011/07/06/with-top-banks-in-tow-financial-service-provider-yodlee-hits-30-million-users/ [Accessed on 07/12/2015]

FICO(2015)FICO At a Glance, FICO, Available from: http://www.fico.com/en/about-us#at_glance [Accessed on 04/12/2015]

Google(2015) Tough on bots Easy on humans, reCAPTCHA, Available from: https://www.google.com/recaptcha/intro/index.html [Accessed on 07/12/2015]

Hannon. K(2015) How To Get A Free FICO Score -- And Then Boost It, Forbes, Available from: http://www.forbes.com/sites/nextavenue/2015/11/18/how-to-get-a-free-fico-score-and-then-boost-it/ [Accessed on 04/12/2015]

Kosinski.M, Stillwell.D, and Greapel. T(2013) Private traits and attributes are predictable from

digital records of human behavior, PNAS, Available from: http://www.pnas.org/content/110/15/5802.full.pdf [ Accessed on 07/12/2015]

myFICO(2015)How my FICO Scores are calculated, myFICO, Available from: http://www.myfico.com/crediteducation/whatsinyourscore.aspx [Accessed on 04/12/2015]

王莹(2015)个人征信牌照未发指引先行,注册资本10%作为保证金,第一财经,链接:http://www.yicai.com/news/2015/12/4720333.html [访问于2015.12.4]

Wolkowitz.E and Parker, S(2015) Big Data, Big Potential: Harnessing Data Technology for the Underserved Market, Center for Financial Services Innovation.

World Bank(2012) Mobile Phone Access Reaches Three Quarters of Planet's Population, Available from:http://www.worldbank.org/en/news/press-release/2012/07/17/mobile-phone-access-reaches-three-quarters-planets-population [Accessed on 07/12/2015]

World Bank(2014) Financial Inclusion, Global Financial Development Report

VantageScore(2013) VantageScore 3.0 released, touts big changes, Available from: http://www.vantagescore.com/news-story/70 [Accessed on 07/12/2015]

VisualDNA(2015) Key States and Methodology, Maerketing Services, Available from: https://d3i35f0m1a0vwn.cloudfront.net/wp-content/uploads/2015/01/VDNA-Key-Stats-and-Methodology-Fact-Sheet.pdf [Accessed on 07/12/2015]

YODLEE,(2015) PFM and the Power of a Strong Data Platform…The Developer Opportunity, YI Whitepaper Power Of Platform, Available from: http://interactive.yodlee.com/sites/default/files/YI_WhitePaper_PowerOfPlatform.pdf [Accessed on 07/12/2015]

(文章仅代表作者个人观点,不代表鸣金网官方立场,如需刊登转载,请注明来源,违者必究。)