大数据时代,个人信息到底会被怎么用?对绝大多数人来说,这个问题的答案可能会有点神秘。8月8日《南方都市报》刊发一则调查报道,一位所谓“大数据”采集信息服务的卖家声称,通过“专业爬虫”爬取各大网站的数据信息,“只有你想要的,没有我们做不到的”。记者调查发现,所谓大数据采集定制业务“火爆”的背后,隐藏着一条非法爬取用户数据信息的黑色产业链——“专业老手”编写爬虫软件、提供软件定制服务、黑产团伙购买软件批量生成“大数据”信息再转手出售。
从技术本身看,“爬虫”等信息爬取技术已然非常成熟,是当下互联网信息技术培训的热门课,其蕴藏的发展潜力和应用价值的确令人惊讶。可使用这一技术应遵循的社会规则,包括谁能用、怎么用、应用的边界在哪里等一系列问题,相比技术而言,应用的就没有那么成熟。
比如,要用爬取技术不可避免地需要他人信息,在以盈利为目的的操作里,有多少信息的获取和使用得到了个人许可(据网络安全法第22条)?又有多少个人信息被用在了“明确的目的”(据《电信和互联网用户个人信息保护规定》第9条)上,并被“严格保密”(据网络安全法第40条)?又有多少个人信息的收集和使用坚守住了合法、正当、必要的原则(据网络安全法第41条)?不加约束的技术应用,必然会让个人对自己的信息失去控制权,让与之直接相关的个人隐私、人身和财产安全面临着巨大风险。所以,无论是比照现行法律法规,还是认识已经暴露出的问题,目前的“爬虫”都是带着原罪的“爬虫”。
而如果站在政策的角度上,爬取技术就摇身一变成为全面实施国家大数据战略的核心手段和工具。因此,针对这一技术和技术滥用出现的乱象,有关部门应当考虑尽快启动调整、细化等相关规则研究工作,不让“爬虫”等信息爬取技术长期处于黑灰地带,利用规则控制好技术应用的副作用,激发技术正能量,发挥出信息优势,以稳健地推进大数据时代的到来。
在规则研究工作中,有必要考虑大数据产品不同的目的和用途,来确定不同的技术使用规则,比如为了公共利益,由法律明确或者授权相关部门进行收集和使用个人信息的情况下,需要个人在必要限度内让渡一定的信息控制权;而为了个人目的或者商业盈利等目的收集、使用个人信息的,则需要更严格的个人授权规则;不同的个人信息使用范围和用途,对应着不同的信息搜集途径和处理手段;对违法搜集使用个人信息的行为,采取有力度的惩戒措施。综合起来,为个人信息安全提供更加完善的法治保障,才能更好地为国家大数据战略的顺利实施创造良好的法治环境。