网络爬虫技术相关犯罪辩护要点 | 江西吉安刑事律师王吉成

引言

网络爬虫（Web Crawler）是一种自动获取网页内容的程序，广泛应用于搜索引擎、数据分析、价格比较等领域。然而，随着数据价值的凸显和监管力度的加强，不当使用爬虫技术可能触犯刑法。

近年来，多起因爬虫技术被追究刑事责任的案例引发关注。本文将从刑事辩护角度，分析爬虫技术相关的法律风险和辩护要点。

一、网络爬虫相关的主要罪名

1. 非法获取计算机信息系统数据罪

《刑法》第二百八十五条第二款：违反国家规定，侵入前款规定以外的计算机信息系统或者采用其他技术手段，获取该计算机信息系统中存储、处理或者传输的数据，情节严重的，处三年以下有期徒刑或者拘役，并处或者单处罚金；情节特别严重的，处三年以上七年以下有期徒刑，并处罚金。

2. 侵犯公民个人信息罪

《刑法》第二百五十三条之一：违反国家有关规定，向他人出售或者提供公民个人信息，情节严重的，处三年以下有期徒刑或者拘役，并处或者单处罚金；情节特别严重的，处三年以上七年以下有期徒刑，并处罚金。

3. 破坏计算机信息系统罪

如果爬虫行为严重影响目标系统正常运行，可能构成破坏计算机信息系统罪。

二、网络爬虫的合规边界

1. "三原则"判断标准

司法实践中，判断爬虫行为是否合法，通常考虑以下原则：

非侵入性原则：是否突破访问控制措施
非破坏性原则：是否影响系统正常运行
数据使用合法性原则：数据获取和使用是否合法

2. 合法与非法的边界

情形	合法性分析
爬取公开网页数据	通常合法，但需注意robots协议
爬取需要登录才能访问的数据	可能违法，取决于是否突破访问控制
使用技术手段规避反爬措施	风险较高，可能被认定为侵入
爬取公民个人信息后出售	构成侵犯公民个人信息罪

三、辩护要点

1. 数据来源的公开性

辩护观点：所获取的数据是公开可访问的，无需特殊权限
证据收集：证明目标网站未设置访问限制，普通用户可正常访问
技术分析：爬虫行为模拟正常浏览器访问，未采取特殊侵入手段

2. robots协议的遵守情况

Robots协议效力：虽然 robots.txt 不具有法律效力，但可作为判断善意的重要依据
合规主张：证明爬虫程序遵守了 robots 协议的规定
行业标准：引用行业惯例，证明类似操作普遍存在

3. 技术手段的正当性

频率控制：证明设置了合理的访问频率，未对服务器造成压力
User-Agent标识：使用了真实可追溯的 User-Agent
无规避行为：未使用IP代理池、验证码破解等技术

4. 数据用途的合法性

商业分析用途：数据仅用于自身业务分析，未提供给第三方
科研用途：用于学术研究或公共利益目的
数据去标识化：对个人信息进行了匿名化处理

四、典型案例分析

案例一：微博数据抓取案

被告人开发爬虫程序，抓取微博公开数据进行分析，后被起诉。

辩护要点：

所抓取数据为微博公开发布的内容
未使用破解技术，正常API访问
访问频率控制合理，未造成系统负担
数据仅供内部研究使用
最终检察机关作出不起诉决定

案例二：招聘网站数据爬取案

被告人爬取某招聘网站的简历信息，用于销售牟利。