首页 百科知识 大数据与互联网金融

大数据与互联网金融

时间:2022-09-30 百科知识 版权反馈
【摘要】:大数据技术真正意义不在于掌握庞大的数据信息,而在于对这些庞大的数据进行专业化处理,得到有意义的信息。大数据产生和互联网的发展离不开,它是互联网发展到一定程度的一种表象或特征,没有那么神秘和可怕,人们对大数据要有客观现实的认识。互联网金融从某种意义上说就是大数据技术、云计算、互联网技术等多种技术交织融汇。

第二章 大数据与互联网金融

一、大数据概述

(一)什么是大数据

随着计算机技术的发展,现在已经迈入了互联网时代,这个时代最大的特点就是产生海量的信息,“大数据”一词也就应时而生了。无法使用常规软件工具在可接受的时间内进行捕捉、管理和处理的数据集合,称为大数据。由牛津大学的维克托·迈尔—舍恩伯格和英国新闻周刊最有权威发言人肯尼斯·库克耶编写的《大数据时代》一书中,认为大数据指不走随机分析法(抽样调查)的捷径,采用收集所有数据并对其进行分析处理。大数据研究机构Gartner认为大数据是海量、高增长率及多样化的信息资产,只有使用新处理模式大数据才能具备更强的决策力、洞察发现力及流程优化能力。

大数据的发展与云计算的发展息息相关。云时代的到来,大数据越来越受到关注,由大量非结构化和半结构化数据组成,而如果把这些数据下载,使用关系型数据库分析时花费时间和金钱会比较高。大数据分析常和云计算捆绑在一起,在分析实时大型数据集时通常采用MapReduce一样的框架向多台计算机分配工作。从技术角度,大数据和云计算的关系犹如一枚硬币的正反面有密不可分的关系。单台计算的处理无法满足大数据的需要,只有依托云计算的分布式处理,采用分布式数据库、虚拟化技术和云存储,构建分布式架构,对海量数据进行分布式数据挖掘,才能发挥大数据的作用。因此,大数据必须用特殊的技术,在可容忍的时间内有效地处理大量数据。大数据的技术所采用的技术,一般包括大规模并行处理数据库、分布式文件系统、云计算平台、数据挖掘电网、分布式数据库、互联网及可扩展的存储系统。

大数据技术真正意义不在于掌握庞大的数据信息,而在于对这些庞大的数据进行专业化处理,得到有意义的信息。另一个角度,可以认为大数据是一种产业,其实现盈利的关键,在于提高对数据的挖掘加工能力,通过挖掘加工实现数据的价值增加。

(二)大数据特点

大数据最基本的特点是4个“V”,一般大数据最明显的4个特征:大量(Volume)、高速(Velocity)、多样(Variety)、价值(Value),也通常称为4V。因此,可分为四个层面:一是数据体量巨大,从TB级别跃升到PB级别;二是数据类型繁多,信息可能是声音、图像、视频、图片、地理位置信息、交易数据等;三是与传统的数据挖掘技术有本质的不同,大数据处理速度惊人,遵循1秒定律,在这个时间内能够从各种类型的不同数据中快速获取高价值的信息;四是只要合理利用数据并对其进行正确、准确的分析,将会带来很高的价值回报。

大数据分析与传统的数据仓库应用相比而言,相对有数据量大、查询分析比较复杂的特点。大数据技术可以称得上是数据分析的比较前沿技术,具体点就是具备能够从不同类型的数据中快速获得有价值信息的能力。这种能力促使大数据技术具备走向众多企业的潜力,也是为什么受企业青睐的原因。比起其他技术来说,大数据具有廉价、迅速和优化的优点,对于海量数据进行存储与分析是大数据最核心的价值。

(三)大数据结构

大数据产生和互联网的发展离不开,它是互联网发展到一定程度的一种表象或特征,没有那么神秘和可怕,人们对大数据要有客观现实的认识。大数据技术就是在云计算的推动下,对于已有的各类数据进行充分挖掘和加工,产生数据本身没有体现出来的价值。如要系统地认知、全面地了解和分析大数据,一般可以从三个层面入手。

首先是理论。理论是认知的必经途径,只有把理论弄清楚和明白了才能更深入往下分析探究。一般对于大数据的定义,首先从特征上描述,然后从行业对大数据的整体分析描绘和定性。从大数据应用的领域和发展来全面深入探讨分析其真正价值趋向所在。理清大数据发展的方向,以及对于大数据发展过程中带来一系列关于对人的影响,如大数据技术可以危及人的隐私或其他价值取向。

其次是技术。大数据首先是一门信息技术,这是大数据根本属性。大数据的价值和用途最终都要落到技术上。这个技术是一个综合技术,大数据技术不断和其他技术融合形成新的技术。互联网金融从某种意义上说就是大数据技术、云计算、互联网技术等多种技术交织融汇。大数据技术在这里分别从云计算、存储技术、分布式处理技术与感知技术的发展来解释大数据从采集、处理、存储到形成结果的整个过程。

第三是实践。无论是理论还是技术最大价值体现就是实践。大数据可应用领域太多了,大数据可以和教育相融合,大数据可以和医疗相融合,大数据可以和金融相融合等,无论是政府、企业还是个人都可以和大数据联系到一起,在这个大数据时代,大数据无所不在,并且已经展现出美好景象,也正在绘制未来美好的蓝图。

(四)大数据处理工具

目前,用于分析大数据的工具主要包括开源生态圈和商用生态圈。

开源生态圈主要有:一是早期逐步形成的Hadoop生态圈,逐渐出现的HDFS、HadoopMapReduce和HBase、Hive;二是存在于Hadoop生态圈之外的Hypertable;三是有NoSQL、membase、MongoDb。

商用生态圈:一是一体机数据库/数据仓库如IBM PureData、OracleExadata、SAP Hana等;二是数据仓库,如TeradataAsterData、EMC GreenPlum、HPVertica等;三是数据集市,如QlikView、Tableau、Yonghong Data Mart。

(五)大数据采集、统计分析、挖掘

大数据采集是指采用多种轻型数据库来收集来自客户端的数据,用户可以使用这些数据库进行简单的数据查询和处理工作。其主要特点是并发系数高。主要使用的产品:MySQL、Oracle、HBase、Redis、MongoDB等数据库,这些产品具有各不相同的特点。

数据统计分析是指将来自前端的海量数据快速导入一个集中类型的大型分布式数据库或分布式存储集群,用分布式技术来对集中的海量数据普通查询与分类汇总,满足大多数常见的分析需求。主要特点是导入数据量比较大,查询所涉及的数据量大,查询请求比较多。主要产品有:InfoBright、YunTable、Hadoop(Pig和Hive)、SAP Hana及Oracle Exadata,除了Hadoop以离线分析为主,其他均可实时分析。

数据挖掘是指简单数据查询不能满足高级别用户需求,只有通过数据挖掘才能实现数据的价值。其主要特点是算法相对复杂,所涉及的数据量及计算量相当大。主要使用的产品有Hadoop Mahout等。

(六)大数据模型

1.SOA模型

SOA即面向服务的体系结构,是一个组件模型,将应用程序的不同功能服务,通过这些服务之间定义良好的接口和约定联系起来。接口是基本采用中立的方式定义,独立于实现服务的硬件平台、操作系统与编程语言。因此在不同的系统中的服务采用一种统一与通用的方式交互。SOA有数据即服务(DaaS)、物理层次结构与架构组件三个中心模型。其中数据即服务模型阐述了数据提供给SOA组件的过程。物理模型数据是存储和存储的层次图传送到SOA数据存储器上的过程,架构模型阐述数据、数据管理服务与SOA组件相互关系。SOA数据关系的三个不同模型如何处理管理大数据、云数据与数据层次结构,决定了以数据为中心的SOA还是以SOA为中心的数据。

2.Hadoop

Hadoop是指在对大型数据集进行扫描中,采用了一个高度可扩展的分布式批量处理的系统,产生结果。Hadoop项目一般包括三部分:Hadoop Distributed File System(HDFS)、HadoopMapReduce编程模型和Hadoop Common。Hadoop平台是操作非常大型数据集的强大工具。为了抽象Hadoop编程模型的一些复杂性,已经出现Pig、Hive和Jaql等多个在Hadoop之上运行的应用开发语言。

3.Streams

IBM infoSphere Streams简称Streams,有能力操控数据流的运算符在数据流过时,对其执行动态分析。当数据流过这些分析组件后,Streams提供的运算符将数据存储至相应位置,如果通过动态分析出某些数据后认定毫无价值,则会摒弃这些数据。一般会认为Streams与复杂事件处理系统具有非常相似的地方,Streams的设计比复杂事件处理系统更具有可扩展性,而且相比其他系统支持的数据流量多得多。除此,Streams还具有更高的企业级特性,一般有高可用性、高级调度及丰富的应用程序开发工具包。

(七)大数据应用典型案例

1.梅西百货使用数据技术构建了实时定价机制

坐落于美国纽约的梅西百货根据商品需求和其库存的情况,对多达7300万种货品基于SAS的系统进行实时调价。

2.Tipp24 AG对欧洲博彩业使用大数据技术构建的下注和预测平台

Tipp24 AG使用KXEN软件分析了十多亿的交易情况和每个客户的特性,对特定用户通过预测模型进行动态的营销活动。Tipp24 AG这样做能够大大提高效率,预测模型构建的时间减少了90%。KXEN(提供商业数据挖掘自动化)、SPSS/Clementine、SAS/EM称为三大数据挖掘软件,很有发展前景,因此SAP(全球性的企业应用软件与解决方案提供商)能够KXEN并强化预测分析能力。

3.沃尔玛利用大数据技术搜索

Walmart.com是沃尔玛官方网站,在网站中沃尔玛自行开发设计了搜索引擎Polaris,Polaris主要利用语义数据进行文本分析、同义词挖掘及机器学习等,即是语义搜索技术。根据沃尔玛统计,使用了语义搜索技术能够让该公司在线购物完成率有10%到15%的提升,这就意味着能为沃尔玛带来数十亿美元的金额。

4.使用大数据技术对于快餐业的视频分析

这项大数据技术应用是通过视频分析等候购物队列的长度,根据队列长短的情况自动变化电子菜单中显示的内容。如果队列较长,则电子菜单显示能够快速供给的食物;如果队列较短的话,则电子菜单显示那些利润比较高准备时间比较长的食品。

5.利用大数据技术品牌认知

在Morton牛排店的经营中,当一位顾客使用Twitter向Morton牛排位于芝加哥一家连锁店订餐,这位顾客将于一天后到达纽约Newark机场,需要Morton牛排店按时送餐到机场。当顾客下订单,Morton就开始了自己的社交秀。首先,通过Twitter数据分析,发现该顾客是Morton的常客,也是Twitter的常用者,通过大数据分析客户以往的订单,推断出其所乘的航班,然后派出侍者为客户提供晚餐。

二、大数据时代下的互联网金融

(一)大数据与互联网金融的关系

信息技术飞速发展的今天,互联网金融迎来了良好的机遇和发展契机。在互联网金融业务中有效应用的大数据,能够促进创新服务优化资源的配置和高度共享客户的信息。大数据有助于互联网金融的健康快速发展,所以应该得到高度重视。

互联网金融飞速发展,在各个领域应用中产生了非常巨大的各类信息。大数据时代已经到来,在这个时代中数据爆炸式的增长,几乎有这么一个规律:从全球范围看,每隔2年信息总量就可能增长一倍作用。大数据是科技发展的产物,也是继移动计算、云计算、物联网等信息技术出现后,在信息技术高速发展基础上产生和发展起来的又一个新兴事物。所谓大数据不仅仅是数据量非常巨大,也是指使用主流数据处理软件无法在想要的时间内进行数据采集、管理和处理的资讯。大数据与云计算有密切的关系,依托于云计算的分布式处理和数据库及云存储、虚拟化技术,应用于对巨量数据分布式数据挖掘,得到增值信息。互联网金融是互联网技术与金融的融合,也是金融互联网发展到一定程度的必然趋势。互联网金融主要依托互联网支付、云计算、社交网络和搜索引擎等工具,完成资金融通、支付及信息中介等各种业务的金融服务的延伸,不能简单理解为互联网和金融行业简单结合,可以认为互联网金融是一种服务。这种服务是建立在用户需求的基础上,充分借助互联网自身特性,彰显开放、平等、协作、分享的优势。在大数据时代,数据就是一切,数据就是企业的利润和用户服务需求,数据就是金钱和安全。互联网的时代开启了数据时代,传统金融如要生存发展,就必须跟上时代步伐,重视大数据技术。同时在互联网金融发展中几乎每个运行平台都离不了大数据和云计算的支持。

(二)大数据对互联网金融发展的价值

在当前大数据时代,互联网金融的发展时刻受到大数据的影响,在这个过程中互联网金融行业应该要充分认识到大数据对于互联网金融发展的价值:

一是助推互联网金融创新大数据的基本特征。互联网金融运行服务的核心过程就是对数据的收集、分析、处理的过程。对于互联网金融来说,对数据收集能力与对信息处理能力能直接影响业务成本和风险控制,如能够合理应用大数据技术,能够促进互联网金融服务的创新。在互联网金融的各种服务中,引入大数据,对交易数据、交易规模、交易过程进行全面分析,能够了解业务开展情况是否处于正常范围,如发现风险能够及时为决策者提供良好数据参考依据,帮助决策者正确做出应对策略。利用大数据技术能够分析互联网每种业务用户的态度和需求,预测用户将会感兴趣的产品发展方向,从而能够给决策者制定高效可行的投资策略。

二是促进互联网金融资源的优化配置。在互联网金融行业运行中应用大数据技术,能够促进优化资源的配置。开放、平等、协作和分享是互联网最大的特点,大数据时代互联网金融也具备这些特点,便于发布和交流投资方和融资方的信息,便于信息间的相互匹配。传统的金融,在信息发布和匹配过程中需要银行、证券或基金等部门参与,不仅有中介费用,而且时间成本比较高,相比较大数据下互联网金融就不需要这些中介参与,并且效率也比较高。如美国Lending Club公司,通过P2P网贷平台向客户提供相关贷款业务时,并没通过银行机构,为客户节省了大量时间和流程,因此提供了非常便利的服务。随着互联网金融在我国的发展,最近几年P2P网络平台在国内不断涌现,各种平台开展的业务种类也比较多,不仅局限于银行参与的融资项目,又有很多专门为中小微企业融资贷款的网络贷款平台,这样既分担了传统金融机构压力,也为中小微企业贷款提供更多的渠道,不仅完成资源的优化配置,也减少了企业成本投入。所以,在互联网金融提供各类服务中,应用大数据能够有效整合相关资源,为互联金融市场的拓展提供比较好的运营平台,其作用和意义深远重大。

三是利用大数据能够实现客户信息的共享。在传统金融领域,如商业银行大都需要投入大量的人、财、物等方面的力量,对其客户信息进行收集整理,来解决信息不对称问题。而对于互联网金融来说,只要应用大数据技术,通过相关互联网金融平台,就能够直接收集分析交易双方的信息,建立新的信息渠道,还可以进行收集金融服务相关的运输、价格、支付等信息,对客户的信用方面进行全面的评估,从而打破了传统金融机构对客户信息垄断的现象。与此同时,通过社交网络将信息快速有效传播,利用云计算强大的处理信息能力和搜索引擎强大的信息检索能力,创建成本低、高精度、更新快的网络信息平台。

(三)大数据是互联网金融的发展引擎

1.大数据为传统金融注入新活力

近几年,互联网金融产品犹如雨后春笋般诞生,发展迅速,效益明显,传统金融机构也意识到互联网金融时代已经来临,如固守阵地只能是螳臂当车,所以很多传统商业银行已经开展引入大数据、云计算、分布式数据库等技术,结合本行的特色推出了很多金融产品及服务。中国建设银行与阿里巴巴合作,将其平台与阿里巴巴平台对接,使用阿里巴巴的大数据信息用资源提供给阿里巴巴会员微贷服务,用户可以随借随还,而不像银行传统贷款那样需要用户提供各种各样资料,经过非常严格审核手续,在相当长的时间内才可能贷到款。对此很多无征信记录或者征信评价低的中小微企业就可以贷款获得普惠金融的资金了。中信银行启动互联金融发展战略,提出再造一个网络银行的规划,通过利用大数据技术在支付方式、财务管理、数据挖掘方面进行变革,开创新的经营和盈利模式。光大银行拟引入社交数据,和传统数据存储一起,构建立体的社交网络信息数据库,推出“V缴费”等新的金融模式。

2.大数据有利于助推银行做征信、客户画像

银行利用大数据征信能够解决传统征信中无征信记录、评分的中小微企业和信用不高的企业的借贷问题。如在美国ZestFinance公司的互联网征信体系中,传统金融信贷评分只占据35%,其他如社交、典当、租房信息及网络数据均被纳入大数据征信评估的范围,据该公司统计,采用了大数据征信体系以后,其信贷处理提高90%的效率,风险控制提高了将近40%。银行的客户画像分为个人用户和企业用户画像。个人用户的画像实际上就是收集分析客户各种各样信息,如个人资产情况、消费水平、个人爱好与兴趣、从事行业、身体状况、风险偏好等。企业用户的画像主要包括企业历史借贷的数据、生产、财务、销售、物流、上下游产业链、国内外市场空间及市场消费能力,仅靠银行内部的数据是不完整,非常容易出现错误的分析结果。

3.大数据有助于互联网金融与传统银行的融合

在大数据时代背景下,互联网金融不是对传统银行的完全替代或简单颠覆。发展的基本方向是使用互联网金融理念,改进传统银行的经营理念,争取把传统银行做的更好。将互联网金融与传统银行相互对接相互融合,尽可能发挥长尾效应、迭代效应及社区效应,来最大限度优化传统银行的模式。所谓长尾效应是指:传统银行一般都强调大客户、主流业务、大众市场及蓝海战略,虽然考虑“个性化定制”“小利润大市场”“二八效应”,没有采用先进的信息处理手段对数据收集分析、柔性生产、精准定位及无点对点营销,因此大银行忽略了微小用户,所以很难满足微小客户市场化的需求。在互联网金融充分展现了金融开放和互动的特点,云计算、数据重构及移动支付等技术得到积极应用,为银行把海量的中小微企业和普通大众消费个体纳入服务发展成为了可能。长尾效应最直接的体现是通过精准营销迅速增加个性化有效客户群。所谓迭代效应是指:传统银行被互联网金融改变的另一种路径。通俗讲,普通用户对银行推出的新产品或服务通过试验后,与银行互动将本人体验意见反馈给银行,银行根据用户反馈的内容迅速优化产品原型,不断完善创新服务,保证了这些产品和原型服务能够以最快的速度上线,且能够得到用户的好评和接受,从而提高自身的产品竞争力。所谓社区效应是指:大数据时代下,银行不能再单打独斗下去,传统金融体系已不能完全满足银行的发展,在银行的发展中与互联网运营商、电商企业信息处理公司、数据收集公司、重点客户咨询公司、网络安全公司、移动支付公司合作越来越密切。

在大数据的推动下,银行业的竞争模式发生巨大变化,不再完全是传统金融机构之间的竞争,而转变成为围绕着银行为中心的银行生态圈之间的竞争。特别是在互联网金融的冲击下,传统银行的发展未来趋势就是要向“智慧银行”发展。智慧银行理念强调银行要以数据应用为核心,对于不断增加的数据要用好,要对数据进行更深、更智慧的挖掘,为客户做“私人定制”的服务,不断地获取价值。互联网金融未来的发展,可能重构传统银行业务的各个环节。比如,在负债业务中,传统银行可以借助像阿里巴巴“支付宝”那样非常成功的“第三方中间支付平台”,发行新型理财产品(如直投实体经济),扩大筹资渠道、降低融资成本。具体可设计为:一是银行筹集资金以直接投向于传统银行优质项目与实体经济;二是银行具体的资金用途、贷款项目建设进度做到透明化、公开化,在有效监管的阳光下运作;三是对P2P模式资金运作过程中,省去了基金和协议存款等中间层,普通老百姓与投资者能够直接从项目中受益;四是可灵活调整收益率,收益率原则上选择在银行债券融资利率和一般理财产品利率之间,对投资人来说有较强的吸引力,同时又低于债券融资的成本,吸收资金来源的成本比较低;五是拥有传统银行相似较高信誉度,能够筹资资金数额巨大,使用期限比较长,相对规模也较稳定。

在大数据时代,互联网金融不断融入全球经济,传统银行要勇敢面对这场信息技术浪潮和互联网革命,积极主动与互联网金融逐渐融合。传统银行要拥有开放、包容、互动的心态与思维,不断寻求与互联网金融合作产生大交集。互联网金融的发展过程就是不断打破垄断的过程,而垄断恰恰是银行最明显的特征,银行要想发展或者说生存就必须逐渐打破垄断。银行在发展过程中,一向喜欢高大上的客户,对于企业的态度更是如此,一般对中小微企业不是很感冒,而在未来为中小微企业金融服务具有巨大市场空间,如果银行还不能降低姿态,那有可能分不到这块蛋糕。因此,银行不能再独善其身,要抓住机遇,研究跨行业重大商业模式,积极创新利用大数据技术、物联网技术、云技术、云计算、大数据挖掘等先进的信息技术,与互联网金融深度融合,抢占未来市场。对于新业务的创新开展,银行可以选择先部分再整体,初期先成立子公司或独立事业部,先涉足相对成熟稳定的互联网金融业务。

子公司或事业部相对具有较强独立性,能够在组织架构、激励机制和风险传递上,将银行涉足的互联网金融业务和传统银行业务进行分离。其一,传统银行对于互联网金融业务要勇于拓展和小心试行,在条件和时机成熟的情况下大力推行;其二,要不断摸索积累专业经验,储备培养专业人才,应对互联网金融迅猛发展后对传统银行的冲击,为银行调结构谋发展积极做准备。

4.大数据引领P2P信贷行业发展

互联网金融服务业是所有行业中数据最密集的行业之一,随着大数据技术发展和应用,互联网金融与大数据注定要不断融合。P2P网贷作为互联网金融的一种应用模式,通过云计算实时分析处理交易数据、交易记录、交互信息、购物行为等大数据,不断积累网络商户在电商平台中信用数据,通过分析数据作为信用记录,为用户提供贷款服务。大数据对于P2P信贷行业发展主要有以下几方面的意义:

一是大数据转变了借贷方式。基于大数据风险管理推动了风险管理理念与工具的调整。传统风险管理理念注重的是对财务分析以及可抵押资产或者权证评估借款人风险水平。然而随着大数据的应用,对交易行为的真伪和信用的可信度的分析变得越来越重要,从风险定价方式逐渐转变为实时、动态、全方位、立体的模式。

二是大数据提高放贷效率。P2P行业发展的方向和优势是为客户提供个性化、准确、快速、高效的服务。实现这些服务都需建立在长期大量信用和资金流大数据基础之上,有利于企业运用大数据金融快速得出信用评分,有利于管理匹配贷款期限,能比较有效地解决资金流动性的问题。P2P网贷平台通过网上支付方式,实时根据贷款需要及信用评分等大数据来放出贷款。

三是大数据提高了P2P借贷的利润率。资金融一般都是以大数据和云计算为基础,已经由人工审批转向非人工审核,且主要使用自动计算为主,因此降低了边际成本,并且容易分析出企业资金需求周期能够灵活决定贷款期限。还可以依托中小微企业大数据,通过整合碎片化的需求及供给,统筹做出财务规划,不断拓展服务领域,进一步降低企业的运营和交易成本。

四是大数据提高了P2P行业科学决策及风险管理的水平。大数据技术也能够帮助企业解决信用分配、风险评估、实施授权或识别欺诈问题。P2P网贷利用分布式计算能够做出风险定价和风险评估模型,这些模型不但可以替代风险管理和风险定价,而且能够自动生成保险精算。基于交易借贷行为基础上的大数据也可以实时得出违约率、信用评分等指标,有利于金融风险控制。

5.大数据为互联网金融筑起了防火墙

对于互联网金融行业来说,大数据的价值应用非常高。互联网金融几乎每天都会在业务网络平台上产生大量的交易、报价、消费者研究报告、业绩报告和官方统计数据公报等。如何利用科学合理高效的手段,把有价值信息从庞大复杂的大数据中提取出来,对于互联网金融风险的防范非常有益。大数据被誉为“定海神针”,它能够为互联网金融安全筑起一道防火墙。大数据是一种解决问题的方法,通过收集与分析海量的数据,获得有价值的信息,或通过实验、算法、模型发现不同数据之间的规律,收集有价值的信息,完善新的商业模式。通过分析利用看似杂乱无章的数据,通过数据关联和挖掘把这些数据串联起来后,枯燥的大数据就鲜活起来了。当大数据形成逻辑链条,那些杂乱冰冷的数据就有了价值。使用大数据,可以发掘商机和辨别诚信。

对于互联网金融的安全来说,很大程度上信息安全占据风险的大部分。而信息的安全风险恰恰是由互联网金融巨量数据产生的,在这些杂乱无章数据中很难发现或辨别哪些是安全的或哪些是不安全的。互联网金融的发展又需要从这些数据中得到有用的信息。大数据的功能和特点,对于解决互联网金融数据问题恰当好处,所以可以通过大数据技术对互联网金融威胁进行挖掘分析,把潜在的威胁识破,充分起到互联网金融防火墙的作用。

6.大数据征信在互联网金融的应用

征信通常是指依法对自然人、法人和其他组织的信用信息的收集、整理、加工、保存,并对外提供信用报告、评估、信息咨询等服务,帮助客户判断和控制信用风险,进行信用管理的活动。追根溯源,征信的出现源于信用风险,而信用风险则要看信用及与信用有关的活动。传统的征信数据源于传统的金融机构、个人收入、消费、房地产等。随着大数据技术的应用,网络信贷、电子商务、通讯社交等项目纳入了个人征信的数据源。大数据征信采集的个人信息领域非常开放,从个人网络信贷、网上消费支付、通讯缴费、出行住宿等方面,来纳入个人的社交信息。如果个人的朋友圈信用不好的话,就有可能影响本人的大数据征信。

大数据征信一度成为公众热议的话题。但是,我国征信体系的构建相对滞后。一直到2006年,“全国集中统一的个人征信系统”才正式上线运行。我国于2013年1月和12月先后颁布了《征信管理条例》和《征信机构管理办法》,至此我国征信市场才逐渐完善。目前,美国征信市场规模大约为40亿美元,而我国才刚刚迈入起步阶段。由于中国庞大的人口基数,未来预测国内个人征信市场空间规模可达到千亿元。而在中国有将近14亿人口,大约10亿人在中国人民银行征信中心数据库中没有完整的借贷数据,对于目前整个第三方征信市场是分散割裂的。对近千亿征信市场的大蛋糕,各大互联网金融企业筹划布局大数据征信市场,力争抢下一片蓝海。

2015年1月,中国人民银行出台了《关于做好个人征信业务准备工作的通知》,并公布了首批获得个人征信牌照的机构名单,要求8家机构积极做好个人征信业务的前期准备工作,时间期限为6个月。这8家机构分别是:芝麻信用管理有限公司、深圳前海征信中心股份有限公司、腾讯征信有限公司、鹏元征信有限公司、中智诚征信有限公司、拉卡拉信用管理有限公司、中诚信征信有限公司、北京华道征信有限公司。这个信息表明,我国征信业向市场化的方向发展迈出了一大步,对于处于不断完善中的我国征信市场来说,集中度逐步提高。首批征信机构业务获批逐步推行后,很多互联网企业已经整装待发准备拿下下一批牌照。大数据能形成量化模型开拓信用评估领域实现其价值。

大数据征信如何发展,发展中也要面临着不同的挑战。随着大数据征信发展,2015年6 月6日,国内首家个人征信机构芝麻信用开放全国范围公测。芝麻信用是支付宝APP端推出的一个独立的第三方信用评估和管理机构,利用大数据和云计算技术客观呈现个人的信用状况,把个人征信业务加工成了实际数据。芝麻信用是根据不同等级划分不同分数,称为“芝麻分”。“芝麻分”是运用大数据方法评估个人用户的信用历史、履约能力、行为偏好、身份特质、人脉关系五个维度的信息,综合评定结果。芝麻信用,在将来会提供更多的信息采集渠道。同时,每个用户的芝麻分并不是永远不变的,会随着信用履行的情况不断变化。在日常生活中,如能够及时履约各种信用约定有助于提高“芝麻分”,如及时付款和还信用卡等。对于这些芝麻分到底能干什么有什么用?在首轮个人信用推广活动中,将个人信用分数与办理国外签证挂上了钩。芝麻信用与阿里旅行合作推出“信用签证”服务,如果个人信用芝麻分超过700,用户可以用“芝麻分”及芝麻信用报告就能够直接申请新加坡签证,无需再提交资产和在职证明或户口本等复杂资料。如个人信用“芝麻分”超过750分,用户可以申请卢森堡签证,能够自由出入欧盟国家。与此同时,芝麻信用还在北京和杭州两地推出了“无人超市”,在超市中不设收银员,顾客在购买物品时既可以用现金也能用支付宝付款,而对于是否付款及付多少款完全由客户自主决定。与“芝麻分”相似的是拉卡拉公司推出的“考拉分”,它是基于征信产品的“考拉分”,继推出个人短期信贷产品“替你还”后,又与衣食出行等多个领域商家联合共同推出考拉信用圈,实现个人用户凭借考拉信用分即可享受到考拉信用圈中商家提供的优惠服务。

虽然中国征信行业发展比较晚,但是随着国内征信市场开放,有很多互联网机构积极参与和新的技术的不断得到应用,互联网产品方式逐渐变革,中国的征信将会实现腾飞。消费信贷的市场规模增长和互联网金融快速崛起能够驱动征信市场的发展。当然大数据信用发展也不是一马平川的,前方有很多困难和问题。主要存在几个方面:一是未来在大数据征信行业的发展中数据的分享及个人信息隐私问题有可能成为制约其发展的瓶颈,因为没有明确的规定和界限来区分哪些信息是隐私,有哪些信息可以被分享;二是大数据征信的数据全面性的问题,因为征信需要长时间不断地积累,但不同的大数据征信企业很有可能各自为营没有形成联盟,制约了数据的全面性,也限制了大数据信用市场的发展;大数据信用的数据真实有待不断增强,因为在目前大数据征信中有些数据间存在相互矛盾的问题,造成原因是没有非机构化数据征信手段,行业之间的信息共享还不是很通畅,信息的覆盖率、准确率有待进一步提高;大数据征信面临信息安全风险,因为大数据信用高度依赖对互联网以及技术,可能会出现信息被非法访问或被截取,数据被非法篡改,信息系统也有可能遭受不可逆的破坏,个人隐私和客户权益有可能遭受严重威胁。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈