未经授权的爬取数据的大数据公司接连被查

  • 时间:
  • 浏览:0
  • 来源:5分彩注册平台-5分彩官网平台_5分彩官网

一场席卷大数据风控行业的风暴仍在继续。

从9月下旬开始,多个业内闭门交流会紧急召开,每个会场都摆出严防死守的架势。“参会者中不乏近期被查或有关联的大数据公司高管。”一位接近会议的业内人士向《中国新闻周刊》透露,那先 闭门会严格保密参会名单,拒绝内部管理报名,会场门口都会严格逐一核验参会者身份,尤其严禁媒体进入,“大伙儿删剪都会来讨论前一天为什么办,需用活下去删剪都会个问题。”

这是一场针对大数据服务商的强监管风暴。自9月初起,多家杭州、上海的大数据风控公司被调查,业内知名的集奥聚合、新颜科技、公信宝等多家公司的核心高管被警方带走调查,连什儿 与类似数据公司有过交易经历的公司高管也被警方带走协助调查,其中包括中国电信旗下征信机构天翼征信的多位核心高管。但在消息传出后,天翼征信和新颜科技方面仍向《中国新闻周刊》表示,“公司业务一切正常。”

业内已风声鹤唳,尤其以惯用网络爬虫技术爬取并违规使用数据的公司最为恐慌。

所谓网络爬虫,即一种生活按照一定规则,自动抓取互联网信息的tcp连接池池。在大数据风控行业中,以网络爬虫获取信息数据的做法盛行,而违规使用、买卖爬虫得来的数据则是原因分析分析数据泄露、隐私泄露等一系列问题的根源。

“爬虫技术一种生活是中性的,关键在于不是合规使用爬虫数据。”中关村大数据联盟副秘书长陈新河在接受《中国新闻周刊》采访时表示,机会通过爬虫抓取网络公开信息或授权信息,并不违规;但机会抓取的是未公开、未授权的买车人敏感信息,且违规留存、使用、买卖那先 隐私数据,就属于违规行为。

“真正合规的公司数据来源删剪都会有官方授权的,能获得类似授权的公司少之又少。”一位长期与大数据公司打交道的甲方公司高管告诉《中国新闻周刊》,大数据风控行业门槛低,业内鱼龙混杂,且监管难度大,“行业混沌,监管层能能了先一刀切”。

大数据公司被查的蝴蝶效应比较慢传导至信贷市场。最近一个 月里,多家中小银行和金融机构纷纷收紧信贷产品审批,多家网贷公司和贷款超市平台大面积下架借贷产品。

“什儿 中小银行和金融机构的风控模型对第三方数据有较大依赖性,自身风控体系不完善,依赖的内部管理数据被切断,风控势必会受到影响。”一家与持牌金融机构有多年相互合作经验的第三方风控公司高管告诉《中国新闻周刊》。

调快,监管层表明了督促银行加强自主风控的态度。10月12日,北京银保监局印发《关于规范银行与金融科技相互合作类业务及互联网保险业务的通知》,要求规范辖内银行与金融科技相互合作类业务及互联网保险业务,有有助于于银行保险机构加强风险管控和合规管理,明确强调要严格落实自主风控原则。

“监管层对数据公司的整顿酝酿已久,但完备的数据安全法还暂时没人 多再出台。”一位接近监管层的人士向《中国新闻周刊》透露,“咋样界定买车人数据的法律性质,仍然是一个 需用探讨的问题。”

暂停爬虫业务

什儿 轮强监管从深圳、杭州、上海等地开始,机会比较慢席卷了整个大数据风控行业。整顿力度之大,令业内和相关相互合作方人人自危。

“现在行业内基本暂停了爬虫业务,所以 前一天做爬虫的也删剪都会清理数据库,就怕被查。”一位大数据金融业内人士告诉《中国新闻周刊》,不仅是互联网金融公司,连与大数据公司能能了过零星相互合作的招聘公司、风控公司最近也纷纷切断了相互合作,“数据公司被查,相关行业都会受到波及。”

在大数据行业中盛行的爬虫技术,主要分为公开爬虫和授权爬虫两类。前者能能了爬取机构或网站公开发布的信息数据,如工商信息等;而后者则需用取得用户的买车人授权,以爬取买车人通讯录、邮箱、网银、电商平台等买车人隐私数据。

根据全国信息安全标准化技术委员会于今年6月发布的《买车人信息安全规范》征求意见稿,买车人信息控制者在收集买车人敏感信息前,应征得买车人信息主体的明示同意,并应确保买车人信息主体的明示同意是其在删剪知情的基础上自主给出的、具体的、清晰明确的意愿表示。

“所有数据授权都需用明显明确地告知消费者,授权获取数据是关键。”深圳中兴飞贷金融科技公司副总裁孟庆丰在接受《中国新闻周刊》采访时表示,“不可组阁 的是,数据行业内人太好趋于稳定什儿 不合规的做法,尤其是未经授权的爬取数据。”

“这次事件前一天,正常情况表下,即使是已获得用户授权的爬虫,在爬取数据并合规使用后,数据就消失了。”中关村大数据联盟副秘书长陈新河向《中国新闻周刊》举了个例子,“譬如你申请A银行的一项贷款产品,就需用授权A银行去查询获取你的社保、公积金、航班出行等数据,银行机会通过一个 底下数据服务商去授权爬虫,爬虫得到的信息提供给A银行,在双方约定的规则上,那先 数据的使用就到此为止,不得留存或卖给第三方”。这次事件前一天,以北京银保监局2019年10月12日组阁 的《关于规范银行与金融科技相互合作类业务及互联网保险业务的通知》为代表,其明确规定“严禁与以‘大数据’为名窃取、滥用、非法买卖或泄露客户信息的企业开展相互合作。”底下服务商的合规评估、认证需用时间,为降低风险,A银行将多采用“断代购直”,采用直连数据源的模式,底下数据服务商的模式将大大受到限制。

值得注意的是,正是什儿 大数据服务商获取了未经授权的数据或授权后擅自留存的数据,才滋生出游走于灰色地带的数据生意。

有互联网金融公司人士向《中国新闻周刊》提供的一份数据服务商报价单显示,常规数据服务一般分为身份验证类、联系人验证类、位置验证类、基础属性标签类等,既有身份证号、手机号、姓名等信息,也蕴藏近一个 月联系人活跃度排名、通讯录名单、常用位置信息等隐私数据。所有服务均按次收费,单次有效查询的价格在0.38元~0.98元不等。“在数据行业,每条信息删剪都会明码标价,机会包年还有额外折扣。

业内人士介绍,什儿 数据公司既提供信息查询服务,宣称“毫秒级响应”,也支持数据输出打包买卖。除了通讯类买车人信息数据,在互联网金融公司日常接触的各数据公司报价单中,关于买车人社保、公积金、司法信息、网银支付宝账号密码、淘宝京东等电商平台交易记录、社交平台信息等重要隐私数据,也赫然在列。

“什儿 数据公司对数据来源避而不谈,只强调数据一种生活的价值。”上述互联网金融公司人士向《中国新闻周刊》表示,“很难说大伙儿是通过那先 渠道获取那先 数据的,也很难去验证数据来源。”

2017年6月1日开始施行的《网络安全法》中已明确规定,网络运营者收集、使用买车人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、土法子和范围,并经被收集者同意;网络运营者不得收集与其提供的服务无关的买车人信息;未经被收集者同意,不得向他人提供买车人信息。

一块儿,《买车人信息安全规范》中也明确提出,买车人信息控制者在共享、转让买车人敏感信息前,应向买车人信息主体告知涉及的买车人敏感信息类型、数据接收方的身份和数据安全能力,并前一天征得买车人信息主体的明示同意。

“未经授权的爬取、使用、贩卖数据合适偷窃。”深圳中兴飞贷金融科技公司副总裁孟庆丰向《中国新闻周刊》直言,“什儿 数据公司既没人 获得授权,又擅自利用爬虫技术去违规采取内部管理数据,这要是不被允许、不合规的。”

“爬虫技术好比是一把刀,刀一种生活没人 错,关键看用刀的人是谁,用刀的目的是那先 ,能能了机会一个 罪犯用菜刀杀了人,便判定所有菜刀删剪都会杀人工具而被删剪禁止使用。”陈新河在一个 蕴藏目前主流金融科技公司的362人“01数据爬虫危机讨论群”抛出什儿 观点得到大伙儿的一致认可。陈新河对《中国新闻周刊》强调,“这次所谓的“爬虫危机”,罪名删剪都会问题,爬虫与危机没人 直接的逻辑关系,真正的问题没哟于爬虫技术,而在于数据的合规获取和合规使用。”

在10月12日举行的2019中国普惠金融国际论坛上,Visa大中华区首席风险官杨景香提出:“数据即是问题也是处理方案。不需用存储的数据一定并不存储,敏感数据一定并不存储。”

大数据风控之兴

回溯大数据风控行业的兴起路径,很难发现其与互联网金融的爆发关系密切,一个 行业的发展也亦步亦趋。

自2013年起,各种消费金融机构、互联网贷款平台比较慢兴起,依靠互联网大数据的风控与获客体系,比较慢成为消费金融市场的主力军,一块儿倒逼传统银行加快互联网转型。在抢夺市场的战争中,金融机构纷纷加快脚步,线上获客与风控的需求暴增。

“中小型银行和各类金融机构、网贷公司删剪都会大数据风控的需求方。”一位资深城商行高管告诉《中国新闻周刊》,大银行一般拥有坚实的数据基础和较强的数据下沉能力,而对于基础和能力都较薄弱的中小银行和网贷公司来说,第三方数据服务则需用作为提升风控能力、提高信贷速率的重要帮手,“有的机构会从第三方购买数据来完善买车人的风控模型,有的小机构会直接购买第三方的数据模型或评估结果。”

需求刺激之下,大数据风控行业应运而生。根据亿欧智库2018年11月发布的《2018中国智能风控研究报告》(下称《报告》)显示,截至当时,金融风控企业机会达到573家,其中超过六成企业成立于2014~2016年。

行业的比较慢崛起离不开风投的助推。根据上述《报告》数据,在当时的573家金融风控企业中,有192家企业获得投资,投资金额超过60 0亿元,其中三成企业获得三次及以上的投资。

野蛮生长的浪潮中,依靠爬虫技术违规爬取和使用数据的公司比较慢壮大,凭借丰富的数据来源和极低的操作成本,跻身行业前列,市场份额甚至大大超过合规数据公司。

“真正合规的公司数据来源删剪都会有官方授权的,有严格的官方指定,一种生活数量占比小,市场份额也占比小。”一位长期与大数据公司打交道的甲方公司高管向《中国新闻周刊》透露,“那先 做非授权数据的公司,一般成本和价格都较低,但核心数据一旦出问题就非常麻烦。”

鉴于大数据风控公司良莠不齐的现状,金融机构与大数据公司实际业务相互合作往往采用“一对多”的模式,以期获得尽机会丰富的数据源,尽机会加强大数据风控的可靠性。

“大次要相互合作的金融机构都会一块儿和十几家第三方数据风控公司有业务往来,会购买多家公司的数据产品来交叉验证,以求更有保障的风控。”一位互联网金融公司人士向《中国新闻周刊》表示,“越大的金融机构我应该 购买更多数据源来完善买车人的风控模型,什儿 自身就不规范的小型网贷公司甚至只会直接买评估结果。”

“有实力的金融机构会强调大数据的全流程应用,贯穿获客、风控、反欺诈、催收等多个环节。”苏宁金融研究院院长助理薛洪言在接受《中国新闻周刊》采访时谈到,对大机构而言,什儿 环节是需用买什儿 原始的数据来完善已有的模型,补齐用户画像,起到辅助风控作用;但对小公司而言,奉行“拿来主义”的成本更低,更倾向于直接采用第三方的处理方案,比如黑名单、智能营销策略等。

随着监管层对大数据行业的监管收紧,既无官方授权,也无完善用户授权的大数据公司面临生存危机,类似大数据公司大多已开始尝试转型。

有业内人士向《中国新闻周刊》透露,目前业内以未授权爬虫的数据源为主要业务的公司基本机会停摆,删剪都会尽机会地做合规业务。相关相互合作方也删剪都会清查相互合作数据公司的数据源合规性,对于数据源授权语焉不详的都会主动切断联系。

“能获取的数据源变少后,公司的风控模型都会变。”深圳中兴飞贷金融科技公司副总裁孟庆丰告诉《中国新闻周刊》,“任何一个 风控模型删剪都会基于一定的数据源而建立,且需用一定时间来进行完善和验证效果,数据源的更改尤其是变少,会显著影响模型的精准度。”

苏宁金融研究院院长助理薛洪言认为,什儿 轮对大数据公司的整顿无疑是一次行业洗牌。“不合规公司的客户必然流失,实力匮乏的公司也会因数据源的减少引起模型预期准确率的下降,同样面临客户流失的困境。”

“强监管的效果老是持续到明年,大数据行业都会有一次彻底的洗牌,该退场的不合规公司都会退场。”孟庆丰直言,“随着监管层对数据安全的持续发力,前一天数据行业内能活下来的必定能能了获取了官方授权的合规公司。”

银行堵漏洞

10月上旬,多位业内人士向《中国新闻周刊》确认,最近央行已将《买车人金融信息(数据)保护试行土法子(初稿)》收集到各家银行,目前正在征求意见中。根据今年4月发布的《中国人民银行2019年规章制定工作计划》,该《土法子》是中国金融领域落实《网络安全法》确立的网络信息安全和网络运行安全两大制度的最高位阶部门规章。

10月12日,北京银保监局印发《关于规范银行与金融科技相互合作类业务及互联网保险业务的通知》(以下简称《规范通知》),明确提出银行需用加强相互合作机构管理,严禁与以“大数据”为名窃取、滥用、非法买卖或泄露客户信息的企业开展相互合作。

实际上,自9月初开始的大数据公司被查风波后,已有多家中小银行主动切断了与涉嫌不合规的大数据公司的相互合作,但随之而来的是银行信贷审批的收紧。

“现在中小银行和金融机构删剪都会太敢去买第三方的数据产品了,开始强调用买车人的风控部门获取用户授权后爬,业务规模和审批速率都受到了很大影响。”一家与持牌金融机构有多年相互合作经验的第三方风控公司高管告诉《中国新闻周刊》。

“不可组阁 ,这几年城商行、农商行的比较慢发展,离不开线上大数据公司的帮助。”前述高管表示,“什儿 中小银行和金融机构的风控模型对第三方数据有较大依赖性,自身风控体系不完善,依赖的内部管理数据被切断,风控势必会受到影响”。

值得明确的是,什儿 大数据风控公司的确对中小银行完善风控体系起到了一定积极作用。以最近被调查的知名数据公司同盾科技为例,其官网上展示的客户案例仅有一则与渤海银行的相互合作,称为渤海银行量身定制了覆盖业务全流程的风控体系,其信用评分模型的KS值达到40%,比行业平均水平提升10%。

在10月11日召开的中国普惠金融国际论坛上,方付通董事长兼CEO孙宏宇提出,大数据不决定一切。在匮乏线上数据的前一天,需用通过线下数据补充,再结合线上的科技手段验证,从而提高中小银行客户数据的删剪度。

“值得肯定的是,近年来大数据公司对金融机构提高风控能力、提升速率人太好起到了积极作用。”浙江泰隆银行首席经济学家郑勇军在接受《中国新闻周刊》采访时表示,大数据等金融科技广泛应用于小微金融、普惠金融领域,有有助于于处理小微客户信用数据不删剪的问题,“对于中小金融机构而言,大数据的应用多体现在风控环节”。

郑勇军认为,大数据的应用一般可贯穿金融机构贷前、贷中、贷后一个 环节。其中,贷前环节包括审核、反欺诈、征信等信息验证,贷中环节需用起到辅助信用评分、风险定价、加快审批等作用,贷后环节需用起到监控资金去向、管理存量客户等效果。

“需用注意的是,如今主流的风控模式仍然需用线打上去线下一块儿组成,能能了删剪单纯依靠线上的大数据风控模型。”郑勇军强调,“在现阶段,线下审查仍然具有必要性。”

在方付通董事长兼CEO孙宏宇看来,在很长一段时间内,线上、线下相结合仍然是主流风控模式。“所谓纯大数据风控,中国机会还需用时间,机会得百行征信再丰满前一天都能能实现。”

对此,监管层的态度与业界一致。北京银保监局印发的《规范通知》中也明确提出,银行要严格落实自主风控原则,不得将贷款“三查”、风险控制等核心业务环节外包给相互合作机构,不得仅根据相互合作机构提供的数据或信用评分直接作出授信决策。

买车人金融信息隐忧

早在什儿 轮大数据行业清洗前,监管层在2017年5月、2018年11月,已针对电信诈骗、爬虫原因分析分析的买车人信息泄露有过两轮整治。其间,《网络安全法》在2016年11月组阁 ,并于2017年6月1日正式实施,并查处了多个非法获取数据的案例。

2017年,曾号称“数据第一股”的北京数据堂被警方调查,也成了大数据爬虫公司中第一个 入刑案例。这家在2014年就挂牌新三板的科技公司,经查涉嫌利用网络爬虫技术违规获取、倒卖买车人信息数据,在8个月时间内日均传输公民买车人信息1.3亿多条,其中包括重要隐私数据。2018年8月,山东省费县人民法院一审判处数据堂首席运营官柴银辉、营销产品部副总裁胡晓敏有期徒刑三年。

中关村大数据联盟副秘书长陈新河向《中国新闻周刊》直言,在监管进一步收紧前,国内游走于灰色地带的数据买卖体量不可小觑,“最常见的有买房后被装修公司营销、买车后被保险公司营销等。随着大数据的覆盖没人 广、应用场景没人 来没人 多,数据合规使用和买车人数据隐私保护更加迫在眉睫。

今年以来,关于加强买车人金融信息立法保护的监管信号密集释放,有关部门正在抓紧推进数据保护方面的规章制度、标准等的制定工作。

截至10月,国家互联网信息办公室机会会同各行业主管部门研究起草了《数据安全管理土法子(征求意见稿)》《网络安全审查土法子(征求意见稿)》《买车人信息出境安全评估土法子(征求意见稿)》《儿童买车人信息网络保护规定(征求意见稿)》《App违法违规收集使用买车人信息行为认定土法子(征求意见稿)》,并面向社会公开征求意见。此外,工业和信息化部也会同有关部门起草了规范性文件《网络安全漏洞管理规定(征求意见稿)》,正在向社会公开征求意见。

值得一提的是,央行于10月收集到各银行的《买车人金融信息(数据)保护试行土法子(初稿)》(以下简称《土法子》)正是近几年业界老是呼吁出台的统一的买车人信息保护法规。

早在4月发布的《中国人民银行2019年规章制定工作计划》中,就机会包括制定该《土法子》。6月14日,央行副行长朱鹤新也表示,要研究推动买车人金融信息保护立法,明确各方的权益义务,使买车人金融信息保护取得实效。

“监管并不原因分析分析要取缔或禁止大数据行业,让行业规范化发展才是监管的本意。”苏宁金融研究院院长助理薛洪言向《中国新闻周刊》表示,金融行业离不开数据的支持,数据需用作为一种生活资产去有有助于于金融科技的发展,有有助于于金融业的转型,有有助于于金融业更好地服务实体经济、普惠金融的发展,“能能了偏激地理解成要为了数据保护牺牲金融科技,监管的真正意义在于规范发展”。

在监管层面之外,买车人金融知识教育则是数据保护的基石。亚洲开发银行研究院(ADBI)研究经济学家黄必红心红心红心红心红心红心猕猴桃 议,需用借鉴日本的经验,从学生、工作人口、老年人口一个 宽度分别推进金融知识教育。“近年来,金融科技发展非常比较慢,也代表着未来的产业发展方向。除了传统金融知识的教育,金融科技知识教育也应该纳入国民教育体系,包括什儿 新的金融产品,新的金融科技风险的防范。机会受到欺诈,消费者知道通过那先 样的渠道保护买车人。”

“从过往经验看,数据灰色交易人太好已趋于稳定三十多年甚至更长的时间,要是在大伙儿步入大数据时代后,问题会被进一步放大。”中关村大数据联盟副秘书长陈新河对《中国新闻周刊》说,“目前大数据行业趋于稳定的问题仍属于发展中的问题,行业整体仍在向积极的方向前进,应该保持信心。”

注:文章内的所有配图皆为网络转载图片,侵权即删!