| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 404 人关注过本帖
标题:【慶中秋】大数据之父:数据过度解读就是滥用
只看楼主 加入收藏
TonyDeng
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
等 级:贵宾
威 望:304
帖 子:25859
专家分:48889
注 册:2011-6-22
结帖率:100%
收藏
已结贴  问题点数:100 回复次数:8 
【慶中秋】大数据之父:数据过度解读就是滥用
大数据之父:数据过度解读就是滥用

2015-9-27 11:52:24
来源:南方日报
作者:刘竞宇


26日,全球第一本关于大数据的著作《大数据时代》的作者、被誉为“大数据时代的预言家”、“大数据之父”的牛津大学教授维克托·迈尔·舍恩伯格受邀做客中山大学“黄埔大讲堂”,开讲“大数据能做什么”。他表示,在解释数据的过程中要非常小心,如果解释得过度了,实际上就是滥用数据。

舍恩伯格现任牛津大学网络学院互联网治理与监管专业教授。他说,美国航空业在营销、旅客体验等领域,仍然有大量的需求没有得到满足,这其中也就蕴含了大数据技术应用的大量机会。近年,谷歌公司购买了美国航空业的大量数据,试图通过将数据与移动整合到一起,了解客户的需求,为航空公司构建一个有用的差旅助手。其中美国政府规定,谷歌公司即使购买了数据也不能对其进行垄断,其他方也有权使用这些数据。政府应当在数据垄断的问题中担当起重要角色,以此来实现更加公平、合理地使用大数据技术。

他警惕地分析说,在解释数据的过程中要非常小心,如果解释得过度了,实际上就是滥用数据。比如在美国做汽车分析,显示橙色车维修的成本是最低的。“大家可能在想,为什么橙色的车维修率低?是因为橙色的车夜晚看得更清楚?还是开车的人更小心?”在数据分析的过程中,“要找的是相关关系,而不是因果关系。”

舍恩伯格总结说,人类要通过数据去进行学习,进行创新,但是也要想有时候可能数据本身跟现实是有一定距离的。所以,人类可能对于现实了解不多,还有很多要学习,要坚信大数据是最重要的。
搜索更多相关主题的帖子: 中山大学 牛津大学 互联网治理 网络学院 南方日报 
2015-09-27 12:16
TonyDeng
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
等 级:贵宾
威 望:304
帖 子:25859
专家分:48889
注 册:2011-6-22
收藏
得分:0 
以下是引用边小白在2015-9-27 12:30:08的发言:

感觉所谓大数据就是在一堆乱麻中理出符合需求的头绪。


不是的。大數據是給自己的猜想提供統計依據,從大數據本身無法理出頭緒。頭緒是要人腦思考得出的,死數據不能思考。具體地說,就是你對某個問題進行研究,先有一個理論框架,提出猜想,然後通過大數據查證自己的猜想是否能夠自圓其說,亦即你假設的理論能夠解釋大數據所顯示的所有事實,就說明你的猜想是接近真理的。

大數據,本質上不過是一大堆實踐案例。事實如此,如何解釋,卻是主觀的。最典型的例子,是托勒密和哥白尼的天文學說,前者的參照系是地球,後者的參照系是太陽,實際上大家都在描述同一事實,但理論體系截然不同,這就是數據事實不能體現頭緒的道理。托勒密和哥白尼,都是根據同樣的觀察數據提出各自的天文模型和演繹理論,本無所謂對錯,區別僅是簡繁之別,前者用了幾百個輪子,後者僅用了幾十個(但事實上用後者計算出的天文預測偏差比前者還要大,那是因為哥白尼的軌道仍然是圓形的,修正偏差是在開普勒橢圓軌道理論出現之後的事)。說哥白尼比托勒密“正確”,無非是哥白尼的模型較為簡單而已。

大數據之作用,猶如第谷的天文觀測數據之於開普勒。第谷長年累月觀測天文現象,積累了大量的數據,但他本身從這些數據中理不出頭緒,死後把數據交給自己的學生開普勒,偏偏開普勒的眼睛有毛病,不能觀測天文,祗能依賴老師留下的數據進行研究,開普勒的數學非常好,他反覆地設想模型,再用第谷的數據去檢驗,結果花了十九年才最終湊出橢圓軌道結論,而這最後一條結論正是由他堅信老師的觀測數據無誤的信念而來(那小小的偏差若放在今天的中國人來看,就當是誤差忽略了)。當今,有專門機構積累數據,猶如第谷,把數據公開給大家用而已,但並非所有人都是開普勒,能夠從中得到什麼,是未知的,得到什麼,也不保證正確。大數據再大,也不確保覆蓋一切細節,就如第谷若漏掉了一些數據,結論也可能不同,所以大數據也不是全部,不必過度依賴,更不必過度解讀。

[ 本帖最后由 TonyDeng 于 2015-9-27 13:16 编辑 ]

授人以渔,不授人以鱼。
2015-09-27 12:50
暴风晕
Rank: 12Rank: 12Rank: 12
来 自:冥界
等 级:火箭侠
威 望:6
帖 子:402
专家分:3107
注 册:2015-8-8
收藏
得分:15 
学习
2015-09-27 13:25
hjx1120
Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15
来 自:李掌柜
等 级:贵宾
威 望:41
帖 子:1314
专家分:6927
注 册:2008-1-3
收藏
得分:15 
大数据
2015-09-27 14:10
诸葛欧阳
Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19
来 自:流年
等 级:贵宾
威 望:82
帖 子:2790
专家分:14619
注 册:2014-10-16
收藏
得分:15 
大数据

一片落叶掉进了回忆的流年。
2015-09-27 16:14
武伟
Rank: 11Rank: 11Rank: 11Rank: 11
等 级:小飞侠
威 望:5
帖 子:506
专家分:2638
注 册:2015-7-23
收藏
得分:15 
大一小白感觉在云里雾里 腾云驾雾
2015-09-27 18:39
hu9jj
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
来 自:红土地
等 级:贵宾
威 望:400
帖 子:11857
专家分:43421
注 册:2006-5-13
收藏
得分:15 
大数据是由许多小数据组成的

活到老,学到老!http://www.(该域名已经被ISP盗卖了)E-mail:hu-jj@
2015-09-27 20:12
诸葛欧阳
Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19
来 自:流年
等 级:贵宾
威 望:82
帖 子:2790
专家分:14619
注 册:2014-10-16
收藏
得分:0 
因果关系难道不重要吗

一片落叶掉进了回忆的流年。
2015-09-27 23:26
tlliqi
Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19
等 级:贵宾
威 望:204
帖 子:15453
专家分:65956
注 册:2006-4-27
收藏
得分:15 
中秋快乐
2015-09-27 23:26
快速回复:【慶中秋】大数据之父:数据过度解读就是滥用
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.020507 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved