昨天各个自媒体不嫌事大的说沉浸式翻译泄露隐私,给我感觉就是之前有多少人推荐说好话,昨天就有多少人在传播说坏话。
这事根源是什么呢?
沉浸式翻译提供了一个分享网页翻译结果给朋友的功能,用户 A 可以把正在看的网页翻译为别的语言,之后生成一份翻译结果快照网页,得到网址后分享给用户 B,用户 B 打开网址就能够看到翻译好的内容,而不需要 B 自己再翻译一遍。
这些翻译结果快照网页,沉浸式翻译没有设置禁止搜索引擎抓取,于是就被搜索引擎收录了,可以通过 site 语法看到一部分网页。
你说,这事有多严重吗?
其实也没多严重,因为分享是用户 A 的主动行为,内容是否敏感是否涉密,其实完全是靠用户 A 控制的。就像一个卖菜刀的,虽然大部分用户买回去是用来切菜的,但他没办法阻止有人拿菜刀去行凶。
如果有竞争对手知道沉浸式翻译的产品机制,他甚至可以去利用这个分享机制,故意去翻译一些涉及隐私的网页,得到网址后,使用一些方法,让搜索引擎收录这些翻译结果页面,就可以炮制出“沉浸式翻译会泄露用户隐私”这样的新闻了。
你看,这里就用到了几个 SEO 知识:
1.把生成的翻译结果放在一个特定目录下,在 robots.txt 文件里设置禁止抓取这个目录;
2.在翻译结果网页里设置 noindex 标签,再次强调禁止抓取;
3.翻译结果网页不要用后端渲染这种利于爬虫抓取的方式,而是用前端渲染,确保最大限度让爬虫抓不走;
4.有人通过把涉及隐私的翻译结果网页地址放到搜索引擎爬虫经常爬的网页里,加速涉及隐私结果网页被搜索引擎抓取;
5.有人传播 SEOer 才会使用的 site 搜索语法,让广大非 SEOer 快速验证“沉浸式翻译会泄露隐私”这件事。
所以,各位朋友,懂点 SEO 还是很有必要的。