當前位置: 華文星空 > 知識

說說 Big data 的出現對於現存的 survey data 帶來的含義?

2016-06-01知識

謝謝邀請。想象你面前有一群大學生,你需要了解他們的資訊,那麽對於資訊的要求,不外乎三大類:

1,全面,能夠反映這群人的整體情況

2,深入,讓你知道一些更多維度且準確的資訊

3,及時,你肯定希望這樣的資訊能盡快到手邊來

這三項要求,滿足其中一項,還是比較容易的。

你可以成為他們的輔導員,從大家的註冊資訊、歷次考試成績中,逐漸了解這個群體的大致情況,滿足全面性;

你可以成為他們的一員,交幾個好朋友,花上幾天時間了解部份資訊——比如其中某一個貧困生其實並不貧困,滿足準確性;

或者你是一個第二天就要送出轉系申請的同學,你坐在電腦前一下午,搜尋了這個群體中一些人的知乎和微博,大致了解了今後朝夕相處的同學是什麽樣的人。

但這樣的要求提高到兩項時,就不是那麽容易了,由此衍生出了各種方法。比如,要同時滿足全面性和準確性,你可能必須開展一次小規模人口普查,讓每位同學都做一份問卷,但花去你半個月時間調查,再花一星期時間做數據整理和分析;要同時滿足及時性和準確性,你必須從這個群體中設計一項抽樣準則,抽取幾個有代表性