摘要:最近網上出現一個雷人的消息。在長江學者和千人計畫專家,西南財經大學經濟學院院長的領導下,總共花了1千萬人民幣,動員了無數學生和自願者對全國25個省,市,自治區,2500多個縣市,進行抽樣調查,樣本8000多戶。報告人發現了兩個非常吸引眼球的結果:在城市的樣本中,10%的最富人群,佔所有財富的90%;同時,城市戶均資產高達247萬元人民幣,全國城市的資產超過美國總資產的21%。按照這個演算法,中國已經是世界最富的國家。實在令人歡欣鼓舞。不過網民的反應,除了參與該項目的老師和學生強力狡辯之外,多是罵聲一片,大家都認為被247萬富翁了。本博文利用該報告的精裝版所提供的數據,證明報告人出現了不可原諒的嚴重錯誤。根據樣本的數據,以及我的精確計算,中國城市戶均資產只有76萬元,而不是247萬元。
背景
中國為了加快速度,成為世界超級強國,一方面大量引進人才,一方面大量花錢,讓這些人才能夠給國家做貢獻。理工科人才是吸引的重點對象,因為文科人才對祖國的社會主義建設還不算重要。加上長年以來,經濟學家的名聲不大好,社會學家也是一樣,而且喜歡對政府提出各種各樣的批評意見。因此,只有極少數社科人才被引進和重用。同時,每年國家撥出大量的科研經費,希望科研人員能夠為國家出謀獻策。在這種背景下,凡是被國家看中的,就可以不惜一切代價,進行大量的投資。
上面講的科研課題,就是這樣的一個國家千萬級的重大社會科學課題。政府的官員不懂,其實,國家統計局這樣的數據不僅有,而且,統計局得到的數據還是相對比較可靠的。當然,除了國家統計局,讓一個獨立的學術團隊進行這樣的研究,也無可厚非。關鍵的問題有兩個:其一,調查的結果對國家的貢獻非常有限;其二,得出城市戶口戶均資產247萬的結論,說明這個研究項目出現重大的缺陷。有的人認為是用科學的名譽,進行科學的造假。更多的人認為,研究團隊脫離了中國的具體國情,得出來的結果和絕大多數人的感覺完全不符合。
我昨天看到這個報導,發了一個微薄。到了今天,已經有1000多人轉發,500人評論。除了少數跟作者有關,跟團隊有關的學生之外,其他人都是清一色的提出各種不滿和反對意見。該團隊的人,不是虛心的聽取大家的批評意見,而是找各種各樣的藉口,為該報告辯護,甚至採取人身攻擊的辦法。
他們不懂,西南財大,以及這個課題的團隊,如果不出這個如此離譜的報告,大家為什麼無緣無故的跟你作對?
你可以說,有錢的人太有錢了,所以一平均,平均數就很高。那我也可以告訴你,就算你把90%的城市家庭甩掉,只剩下10%的所謂高收入者。這10%的城市人口就有7100萬人,他們的平均財富能夠247萬也已經不得了了。要讓他們把其他90%的人也拉大到247萬,10%的這些人戶均財富就必須是2000萬以上。這可能嗎?
如果說北上廣的有錢人可能有數百萬,甚至上千萬,大家還是可以相信的。如果說,一個小縣城平均每個家庭有哪怕是1百萬的資產,那都是天方夜譚啊。
這麼基本的社會基本瞭解都不懂,還在強烈的用什麼中位數隻有40萬來掩蓋平均數247萬的無比荒唐的實事。這個團隊的學生,也不懂平均數乘與總家庭數,就是整個樣本的總資產。再把這個荒唐的總資產,換算成為全國的總資產。這下不得了了,中國的資產超過美國的21%。天啊,大躍進可以,也不是這樣搞吧?
那麼,他們錯誤在哪裡?
首先,樣本太小,8000多戶,絕對不可以用來推斷全國2.5億戶的城市人口。
其次,抽樣不科學。樣本分布太過分散,不利於得到任何精確的數據。
其三,搞調查的人太多,而且不專業。連主持這個重大課題的主持人都沒有經驗,如何讓所有的人都知道如何取樣?
其四,用錢買來的調查員往往不負責任,非常難以保證數據的可靠性。當調查員被拒查後,隨意就近換一戶調查本身就是統計精確性和可代表性的最大敵人。
其五,統計數據收集上來以後,沒有‘過濾’,沒有認真處理可能出現的‘極端值’。要知道,幾個極端值,就可以徹底的搞亂所有的計算結果。
其六,該報告精簡版,表8顯示:樣本的人均住房面積,城市為39平米,農村為49平米。這個結果,城市比國家統計局的數字多出10平米,農村多出14平米。樣本的平均數,大大地高於國家的平均數。
該報告連自己的數據都沒有算對,出現不可饒恕的錯誤
該報告更不靠譜的是自己的數據都沒有算對,而且誤差是如此的難以置信。
例如,該報告精簡版,表9和表7給出下面的數據:
表9,城市每套房子的平均價格
價格(萬rmb/套) 第1套,第2套,第3套
購買成本價 19 39 62
市場價 84 96 122
表7,城市家庭擁有房子的概率:1套(69.02%),2套(15.44%),3套和以上(3.63%)。
我如果用表9和表7所提供的數據,非常容易算出城市平均每戶家庭的房地產的價值(用Y表示)如下:
Y=84(0.6902)+(84+96)(0.1544)+(84+96+122)(0.0363)=96.7萬元/戶。
對懂數學的人,我不用解釋,大家就知道我為什麼用這個公式計算戶均房地產的價值。不懂的,請你們找個數學老師解釋一下就可以了。
這個計算,用了表9的房地產市場價格,而不是成本價格,這本身就大大地高估了房地產的價值了。我上面的計算方法,唯一沒有考慮的就是,擁有3套房子的人,可能有3套以上。所以,有點偏低估算。但是,因為擁有3套房的家庭比例只有3.63%,就算我把這一組的平均房子數提高到4,算出來的結果也只有110萬。
那麼,我們姑且,用每戶110萬的房地產來推算平均每個家庭的總資產吧。根據該課題組的另一個重要的結果是,房地產佔總資產的70%,而且每個城市家庭的負債率為28萬人民幣。
那麼,NY=Y/0.7–28=110/0.7–28=129萬人民幣/戶。NY代表每個城市家庭的總淨資產。計算的結果是129萬人民幣,比報告人自己的計算少了98萬元。我還必須強調,每戶129萬元還是被嚴重高估的。一是樣本嚴重偏向較高收入人群,這可以從人均住房面積的偏高得到驗證。二是,我們用的是房地產流行價格,而不是成本價格。流行價格是非常不靠譜的,真實的價格應該介於成本價和市場價之間。如果是這樣算,城市的戶均資產就是76萬元。
結論
我利用西南財大的報告數據推算,中國城市戶均總資產只有76萬元,最高限也只有129萬元。財大的這個報告為了提高知名度,硬是把這個數字說成是247萬元。
這種嚴重的造假和不科學的態度,在學術上是絕對不可容忍的。花了那麼多的錢,還利用媒體傳播沒有任何科學依據,甚至故意把自己採集的數據,還大肆的加以歪曲。
我剛開始還以為247萬可能因為是樣本誤差而已,這最多也是個研究方法問題。所以我在微薄上用了非常有分寸的口吻。沒有想到,這個團隊的成員,不僅不科學,而且素質低下,採取非常無聊的方式,為這個報告辯護。有一位隊員,還叫我看看該報告的精裝本,想通過這個來證明他們是如何的了不起。沒有想到,我還就認真地讀了這個報告,憑我平素對數據的愛好,我對每個數據都認真地分析了一下。
結果,發現問題比我想像的大得多了。他們提供的3個表,也就是上面的表7,8,9,讓我用了他們的數據,推翻他們的結論,這才是真正的不可思議,讓人回味無窮。