你有没有过类似的经历?
刚和朋友聊完想去海南,结果隔天就在app上看到一大堆关于海南旅游的推送?
刚准备买个东西,结果首页上全是关于它的推荐广告......
现在的算法模型都能已经能实现如此精准的推送了吗?还是....APP真的在窃听我们的生活?
关于APP带来的不安全感,越来越多的人表示感觉压力很大。
根据国家网络安全宣传周去年9月发布的《App安全意识公众调查问卷报告》显示,32万名受访者中,近三分之一的人表示很反感App的精准推送广告行为,感觉遭到了窥探或偷听。
过去,人们常说“你永远不知道网线的另一端是人是狗”,现在,虽然依然不知道对方是人是狗,但对方知道你最近究竟需要粮食还是狗粮。英剧《黑镜》里,一个女孩因为过度思念去世的男友,凭借着男友在社交网络上留下的全部痕迹,拼凑出了与他几乎一模一样的AI模型。目前来看,这仿佛就是现实生活的写照----互联网比我更懂我自己。
所以,回到最初的问题,普遍被用户感知到的App偷拍偷录现象,真的存在吗?如果不存在,App又是通过什么方式实现了如此高准确度的智能推送呢?
事实上,早在两年前,坊间就已经开始有App偷拍偷录的传言。
首当其冲的便是QQ浏览器和百度输入法。当时,vivo Nex手机的前置摄像头藏于手机内部,只有调用时才会升起,而用户使用QQ浏览器时会明显看到,小小的摄像头模块被开启了。同时,在百度输入法界面没有进行任何操作时,手机也会提示正在录音。
随后,QQ浏览器和百度输入法分别解释称,没有偷偷调取用户的录音和拍照功能,而是由于某些网站读取摄像头参数、输入法进行语音麦克风预热优化导致。
虽然QQ和百度官方都对此做了正面回应,但有关APP偷录偷拍的传言并没有因此散去,人们对于产品依旧怀有许多猜疑。
那么,偷拍偷录在技术上到底是不是可实现的呢?
相关从事网络安全等领域的专家表示,偷拍偷录在技术上是有可能实现的,但是,这种方式从经济效益方面来讲,并不划算。因为这不仅成本高昂、效率低下,还有很大的法律风险。
首先,这需要硬件设备支持语音唤醒,并要求在嘈杂的现实环境下分辨方言、提高识别准确度。
其次,上传超大的录音文件需要耗费大量流量,很难躲过用户注意。
更现实的因素是,通过监听来捕捉用户喜好的成本极其高昂,从投入产出比来看公司没有必要为此买单。
“通常来说,此类技术都有特定的应用场景,例如,经济侦察,窃听等,只会定向应用在重要人物上,这种高精尖的技术是不会大范围地应用在普通商用领域的”-------周亚金
那么,如果平台侧真的不曾采用“偷拍偷录”等手段,如此精准的推送又是如何实现的呢?
如果把以上偷拍偷录所获取的信息用作推荐参考,那么这种方式获取的信息可以被当作直接数据,但其实,除去这一种方式之外,其他直接或间接获取用户数据,完善用户画像的方式还有很多。
个人资料等
在众多数据当中,最常见的用户数据来源就是个人资料、浏览数据、搜索记录等等,而这多个维度的数据足够为用户建立起一套完整的用户画像了,例如“男性、本科毕业、30岁、已婚......”
这套标签体系的形成很可能极为复杂。周亚金举例说,多个用户每晚同一时段连接的Wi-Fi是同一个,那么系统判断大概率他们是一家人,推送的内容很可能会交叉共享。另外,即便用户没有给予一个App定位权限,通过Wi-Fi同样可以判断出他的大致所在地,从而匹配当地的广告。
嵌入在APP当中的SDK(软件开发工具包)
SDK 的全称是Software Development Kit ,翻译过来就是软件开发工具包。这是一个覆盖面相当广泛的名词,可以这么说:辅助开发某一类软件的相关文档、范例和工具的集合都可以叫做SDK。它是App内提供特定功能或服务的插件,比如广告、支付、地图等。SDK的意义在于,当开发者需要调用某项功能时,不需要从头自行开发,只需要接入SDK即可。
所以,当App A和App B都采取了同一家广告SDK时,那么A和B内收集的数据都可能上传至这一家SDK上,A与B之间天然形成了数据共享。你在A上的搜索记录和使用习惯有可能就会被反映在B上。因此,就会出现这样的场景,你明明从来没有在这个平台搜索过任何关于劳力士手表的关键词,但它却反复出现在这个平台的首页,而这背后的原因很可能就是你在另一个与这个平台共享广告SDK的平台上曾经搜索过。
手机输入法
许多第三方输入法会统计用户词频数据,而这些数据理论上都可以卖给其他公司。如此一来,很有可能你前脚刚和朋友说完想买某件商品,后脚购物App上就把这件商品推至前排。即便是原本不属于个人信息的数据,在不断汇聚之后,也可能会被发掘出事物间不为人知的联系,从而分析出用户的私密信息。
所以,与其说是App偷拍偷听,不如说是App‘猜你喜欢’猜得格外精准。很可能算法你自己更懂你到底想要什么。
近年来,用户对于个人信息安全愈加重视,这其实是个好现象,一方面越来越多人开始有意识地去保护个人信息,另一方面也能够倒逼相关法律法规的完善。但另一方面,很多人陷入了一个误区,似乎一谈到收集个人信息就是完全错误的,但事实上App收集个人信息在很多情况下也是为用户服务。互联网跨平台的广告推送所基于的信息其实是针对设备的用户画像,而不是个人具体可识别的信息,例如手机号、身份证等。俗话说,燕过留痕,凡是只用过的产品,必然会留下个人的痕迹,如果这些痕迹能够被正当使用,又何尝不是件好事儿?那些真正让我们的个人信息处于危险之中的其实并不是算法,而是数据监管不力的商家、倒卖信息的黑产和从中牟利的中间商。
“我们不是要完全禁止个性化广告,如果不存在个性化广告,那就只能回到传统媒体的广告时代了。”
来源:网络安全知多少