说到保护隐私,我们首先来看看其他在线搜索引擎是如何获取用户隐私信息的。 由于目前中国大陆地区(以及国外)提供搜索服务的搜索引擎都采用类似的方式来获取用户隐私,因此下文中我们统一使用XX搜索来替代所有其他跟踪用户的搜索引擎。
日常用户使用某搜索引擎的过程可以分解为以下几个步骤来理解:
使用浏览器打开某个搜索网站的URL,输入查询关键词。 某搜索网站在返回搜索结果数据的同时,还利用各种黑科技来追踪用户,包括、、、等,尽可能准确地追踪用户在互联网上的各种行为。 未来,当这个用户查询不同的关键词时,某个搜索网站就会利用跟踪技术,不断收集和存储他的搜索甚至浏览行为的信息。 持续丰富地勾勒出用户的兴趣爱好、健康状况、甚至家庭成员等个人隐私信息。
这些搜索引擎收集了大量的用户资料信息后,最重要的商业变现方式就是定向广告。 下图为某搜索引擎广告平台宣传其精准人群定位能力。 每天数百亿的在线行为数据很可能包括你的搜索和点击行为。
当用户使用秘密搜索时:
用浏览器打开,输入查询关键字。 发起的网络请求被传递到秘密搜索服务器。 不过,秘密搜索的服务器并不记录用户的任何信息(不仅不记录用户输入的搜索词,还不会记录用户浏览器带来的IP地址、HTTP等信息)。 最后,秘密搜索将结果数据返回到用户的浏览器。
秘搜不存储任何用户信息,也不使用任何黑科技(、、标签)追踪用户。 它甚至不使用浏览器,自然不会泄#用户的隐私信息。
说完其他搜索和秘密搜索的区别,我们来看看很多网友共同的一个疑惑:很多浏览器都有隐身模式或者隐身模式。 如果在隐身模式下使用XX搜索,用户的隐私信息仍然会丢失。 被泄#了吗? 其实这个答案是在隐身(隐身)模式的提示下写的,见下图。 浏览器的隐身模式只是不会在您的计算机上留下浏览痕迹和历史记录,但并不能阻止您访问的网站收集您的个人信息。
从上面的对比分析中,我们可以清楚地看到,对于用户隐私的保护,探秘并没有使用太神奇的黑科技,而是严格遵循一个隐私原则:不存储、记录任何可以与用户身份相关联的东西。 信息。 下面我们重点介绍为严格落实上述隐私原则,在秘密搜索技术实现上所做的实践和尝试。
没有搜索引擎
说到这里,熟悉技术的朋友可能会很熟悉。 简单来说,它就是:网站为了记录用户的状态信息而保存在用户浏览器中的数据文件。 该发明最初是用来优化互联网服务体验的,但现在越来越多的网站使用它来跟踪用户身份。 对于秘密搜索服务,如上所述,我们不会在用户的浏览器中植入任何内容。 只要打开浏览器的开发者工具就可以看到这一点,如下图所示。
提供聚合和过滤功能
如果你刚刚尝试过秘密搜索,你会发现,现阶段秘密搜索的结果聚合了各个搜索引擎的搜索结果。 但我们不只是提供汇总结果。 秘密搜索帮助用户在后台过滤掉所有的跟踪脚本和可过滤的广告信息,最终为用户提供干净的结果信息。 我们做了一个实验分析,直接使用桌面浏览器访问主流搜索引擎,以及使用秘密搜索访问某搜索引擎。 在返回相同结果的前提下,秘密搜索的返回结果可以节省近10倍的网络流量。 这些节省的流量大部分用于广告和跟踪脚本。 因此,虽然我们的大部分搜索结果来自常用的搜索引擎,但这些搜索引擎不会跟踪您,也不会记录您的IP地址、浏览器等信息。
提供匿名访问
除了提供搜索服务外,还提供对检索结果的匿名访问,如下图所示。
匿名访问功能本质上是一种代理服务。 例如,您想访问米集搜索结果页面上的某个网站,如果您通过匿名访问方式浏览,我们会使用代理服务(这个代理服务是米集搜索自己的独立服务。仍然不会记录请求日志)来获取网站上的有用信息,然后将有用信息转发给用户。 该代理服务将完全保护用户免受各种跟踪和搜索。 但现阶段我们匿名访问的兼容性仍然需要提高。 有些网站有时会出现乱码、服务请求超时等问题。 我们的程序员正在不断优化这些服务。 如果您在使用过程中遇到这些问题,请原谅我们或反馈给我们。
如果不收集用户数据,我们如何统计搜索访问量?
每个网站都会统计用户访问量。 为了准确统计每天的用户请求数,同时又不收集任何用户信息,我们在.conf配置文件中添加了如下命令语句: /var/log/nginx/.log if=$arg_q (的请求参数 是q,所以使用变量$arg_q),翻译白话就是只有当用户真正使用秘密搜索发起搜索请求时,我们才会使用这种日志格式来记录日志。 格式:'$$$site="$"(在Nginx.conf文件中配置),每个用户请求的真实日志如下。
200 2018年10月23日:21:36:58 +0800
可见,米技搜索并没有记录任何与用户个人信息相关的字段。 我们通过上述方法,不记录任何用户请求信息,同时可以准确统计米技搜索的日访问量。 未来我们也希望将搜索服务的日志实时公开,甚至将整个运维操作实时公开。 这些后续目标已在我们的待办事项列表中,敬请关注。
终于
互联网和大数据技术在带来便捷生活体验的同时,也带来了种种混乱:精准的用户画像让大数据成熟,互联网上的定向广告比网上贴的小广告更恶心。单元楼。 之后,网民的个人信息在黑市上交易、出售,并掌握在各类互联网广告公司手中。 面对这样的现实,我们希望能为保护网民的隐私信息尽自己的一点绵薄之力。 如果您也有这样的想法,请联系我们。