加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

大数据公司又被查,爬虫措施员在内20余人被抓!

发布时间:2019-12-02 03:14:11 所属栏目:移动互联 来源:站长网
导读:克日江苏淮安警方依法冲击了 7 家涉嫌加害国民小我私人书息犯法的公司,涉嫌犯科缓存国民小我私人书息 1 亿多条。 个中,拉卡拉付出旗下的考拉征信涉嫌犯科提供身份证访魅照查询 9800 多万次,赢利 3800 万元。 警方已将考拉征信处事有限公司及北京黑格公司的法定代

克日江苏淮安警方依法冲击了 7 家涉嫌加害国民小我私人书息犯法的公司,涉嫌犯科缓存国民小我私人书息 1 亿多条。

大数据公司又被查,爬虫措施员在内20余人被抓!

个中,拉卡拉付出旗下的考拉征信涉嫌犯科提供身份证访魅照查询 9800 多万次,赢利 3800 万元。

警方已将考拉征信处事有限公司及北京黑格公司的法定代表人、董事长、贩卖、技能等 20 余名涉案职员抓获。

大数据公司又被查,爬虫措施员在内20余人被抓!

01.“爬虫”软件“爬出”的犯法链条

警方发明,涉案的广州诺涵公司固然披着科技公司的外套,着实从事的是收集放贷、软暴力催收、销售国民小我私人书息等违法犯法举动。

在他们销售的国民小我私人书息里,乃至还呈现了国民身份证照片信息,这样十分隐私的小我私人书息他们从哪儿获取的呢?

大数据公司又被查,爬虫措施员在内20余人被抓!

警方发明,在广州诺涵科技公司,国民小我私人书息被称为“流量”,公司本身开拓有“乐花管家”等多个小贷平台,在自身购置国民小我私人书息用于倾销贷款、软暴力催收的同时,也和其他公司彼此互换国民小我私人书息,还开拓有爬虫云等软件,通过技妙本领爬取其他小贷公司的国民小我私人书息,用于公司放贷和犯科出售牟利。

大数据公司又被查,爬虫措施员在内20余人被抓!


锁定相干犯法证据后,淮安警方在长沙、深圳别离将湖南九象公司的法定代表人和技能主管抓获。

审判得知,九象公司黑爬虫网站的“身份核验访魅照”营业端口来自北京黑格科技有限公司,而黑格公司是从北京考拉征信处事有限公司等四家公司购置的查询接口。

随即,警方将北京黑格公司和考拉征信处事有限公司的法定代表人、董事长、贩卖、技能等 20 余名涉案职员抓获,并于本年 4 月在北京将他们上游公司的 5 名涉案职员抓获。

经查,北京考拉征信处事有限公司从上游公司获取接口后又违规将查询接口出卖,并犯科缓存国民小我私人身份信息,供下流公司查询牟利,从而造成国民身份信息包罗身份证照片的大量泄漏。

违规缓存相等于把国民小我私人书息复制了一份,存在何处,下流公司再向它通过数据接口调取数据的时辰,它就不必要再向上游调取,也是节减了开支,这个是违法的。

大数据公司又被查,爬虫措施员在内20余人被抓!

经查,2015 年 3 月以来,北京考拉公司犯科提供查询访魅照 9800 余万次,赢利 3800 余万元,在公司处事器中查获并收缴被犯科获取、存储的国民姓名、身份证号、相片近 1 亿条。

02.我只是个写爬虫的,跟我有什么相关?

很多措施员都有这样的设法,技能是无罪的,我只是个打工的措施员,公司干违法的营业,跟我不要紧。。。只能说,措施猿们真是图羊图森破了。

我们先来看几个真实的法院讯断案例:

案例一:数据拥有者有证据可以或许举证你的数据是抓取来的。如下,今天头条对告状上海晟品法院宣判功效。

大数据公司又被查,爬虫措施员在内20余人被抓!

(图片笔墨来自中国讯断文书网)

从文书描写来看,修改UA、修改device id、绕开网站会见频率节制这是写爬虫的根基,这些技妙伎俩反而成了开罪的依据。

案例二:抓取用户交际数据,尤其是用户隐私相干。

大数据公司又被查,爬虫措施员在内20余人被抓!

(图片笔墨来自新浪网)

案例三:用爬虫技能侵扰对方网站策划法则,且牟利。好比这个:

大数据公司又被查,爬虫措施员在内20余人被抓!

(图片笔墨来自中国永嘉公号)

图上描写做搜刮引擎排名的技能,着实就是操作爬虫技能局限化的会见网页。

在我们凡是的认知里,由于互联网推许分享精力,以是以为只要是收集果真数据就可以抓取,可是通过上面的案例来看,有几个禁忌,抓取的数据最好不要直接商用,涉及交际信息/用户信息要审慎。

老板交接你抓取敏感使命时,让老板先看下刑法第285条。公司从事违法营业,不代表小我私人举动就没事,只是还没入有关部分的高眼。

03.措施员怎样停止,面向牢狱编程?

爬哪些数据会得罪法令?

第一、著作权法掩护的全部作品数据

好比一些网站颁发的内容,如文章、评述等都是有著作权的,假如只是纯真的通过赏识器查察是不会得罪法令的。

可是,对付有著作权的作品,假如未经著作权人容许,以红利为目标,对其作品用任何本领举办复制是犯罪的。

假如是行使了爬虫技妙本领爬取数据之后将其生涯下来可能撒播,而且举办红利,这种都是属于犯法的。

第二、网站用户的小我私人书息可能隐私信息

网站上的小我私人用户的小我私人书息,纵然是用户本身放到一些网站长举办果真可能部门果真,如微博、微信等,不代表这些数据就可以被其他人任意获取,这个要出格留意。

以是,假如爬取的数据涉及到小我私人书息或隐私信息,都是违法的!

尚有些爬虫阴谋绕过权限校验等,爬取用户未果真的信息,如小我私人私密相册照片等,都是属于加害用户的小我私人隐私的,不要认为本身技能玩得溜,这些可都是违法举动。

第三、反不合法竞争法中明晰掩护的数据

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读