大数据的威力之百度迁徙


大数据时代远不远?不远,它已经慢慢出现在我们眼前。

“百度地图春节人口迁徙大数据”(简称“百度迁徙”)是百度公司在2014年春运期间推出的一项技术品牌项目,于2014年1月26日0:00正式上线。

在讨论百度迁徙之前,我们先为大家解释一下这些常常见到的名词都代表什么意思。

LBS

Location Based Service的缩写,基于位置服务。意思就是这项服务内容是基于位置定位的。现在我们智能手机中LBS服务不少,比如打车服务、周边团购信息查询等,都是先确定了用户的位置再提供相应的服务。

GPS

Global Positioning System,美国军方开发的卫星定位系统,由卫星不断发布精准的时间信息,通过终端产品计算确定用户位置。其特点是覆盖面广、精度高(民用3-10米)、民用免费等特点。

粗略定位

粗定位有很多方式,我们比较常见的就是手机通过基站的粗定位,其原理与卫星定位差别不大,但是精度有限。比如在通讯基站较为密集的城市精度较好,在落后城市中基站较少就会出现很大的偏差。

API

Application Programming Interface缩写,意为应用程序编程接口。我们使用的应用程序并非每一项服务都是有开发商一家完成的,有些服务需要调用其他公司的服务。说到百度迁徙则就意味着百度的LBS服务的API。对于中国严格限制地图服务商的政策下,更多的应用开发商都需要选择不同的位置服务商来调用数据。

手机定位

手机定位主要可以通过上面介绍的两种方式,若要进行连贯导航,必须透过GPS连续定位获取。而手机定位之后会在各种软件、服务中留下“痕迹”,百度迁徙则是透过各种方式获取了用户的位置信息,通过大量的数据演算得来。

那么通过上面的一些名词解释,可能大家不难理解百度迁徙是从何而来。当然伴随着手机定位的数据统计,也会让用户怀疑隐私是否安全等问题,那么下面我们就来看看百度迁徙的内容以及伴随生活的定位服务会给我们带来什么样的优势与隐患。

迁徙数据从何而来?

首先百度迁徙的数据其实并非完全精准的,只是一个粗略定位数据的统计,“直线模式”就可以证明并非实时定位的数据,那么百度只需要调用春运路程的起点与终点数据既可以收集一个用户的信息。原理有了,我们还需要大量的数据作为基础。

看似非常复杂的迁徙图,其实原理并不复杂,需要大量的数据做支撑。

那么百度的数据是从何而来呢?去年3月份统计,国内移动通讯用户达到了11.46亿,而基于百度API的应用程序位置信息请求数量达到每日35亿次(2013年8月数据),也就是说平均到每一个用户,我们每天都会请求差不多3次位置数据,这样庞大的数据量为百度迁徙提供了基础。

在日常生活中,我们打开微信、微博甚至玩游戏都有可能请求位置数据,如果我们卸载了百度相关的应用之后其实也不能避免位置信息被收集,百度的LBS服务API已被数十万应用采用,真的是“防不胜防”。

透过了如此大量的数据积累之后,百度迁徙中每一天都可以积累相当的位置信息。但是也有网友对于百度迁徙中8小时为单位的查询表示疑问,8小时为一个循环的数据周期可能不够准确。其实这并不重要,百度迁徙本身是大数据时代下的一个新面貌,而且在样本数量足够多的情况下,就足够了。

百度迁徙是大数据时代的一个具象表现,其实我们日常生活中还有各种各样的数据被收集起来为各种公共事业服务,让商家进行决策,但个人数据的采集一方面会给我们带来很多便利,同时也存在一些隐患。

百度迁徙:http://qianxi.baidu.com/


文章作者: 盒子
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 盒子 !
评论
 上一篇
孔子学琴的启示 孔子学琴的启示
从前,孔子跟从师襄子学琴。师襄子教了一首曲子后,孔子每日弹奏,丝毫没有厌倦。过了十天,师襄子说:“这首曲子你弹得很不错,可以学新曲子了。”孔子说:“我虽学会了曲谱,可还没有掌握一些高难度的技巧。” 又过了许多天,师襄子说:“你已掌握了弹奏
2020-01-27
下一篇 
把 把"新桃换旧符",也别忘"倒空自己"
爆竹声中一岁除,春风送暖入屠苏。千门万户曈曈日,总把新桃换旧符。   旧年即将过去,新年即将到来,对于每一个人来说,这是又一次“清空”,也是又一次“开始”。   过去的一年,乃至过去的数年,也许我们活得太不容易甚至俨然就是苦苦煎熬。但幸运的
2020-01-27
  目录