大數(shù)據(jù)出現(xiàn)的炙熱:奉勸你不要盲目相信數(shù)據(jù)
離開具體背景,數(shù)據(jù)往往具有誤導(dǎo)性。對于從數(shù)據(jù)中可以合理得出哪些推論,我們必須非常謹(jǐn)慎
1902年河內(nèi)大規(guī)模捕殺老鼠事件是一個經(jīng)典的提醒,警告我們需要對我們所衡量的數(shù)據(jù)和所提供的獎勵保持警惕。
當(dāng)時的法國殖民統(tǒng)治者對該市下水道中老鼠的泛濫感到震驚,懸賞每殺死一只老鼠,就給當(dāng)?shù)夭妒笳甙l(fā)一筆獎金。每上交作為滅鼠證據(jù)的一條鼠尾,市政府會支付一分錢。
最初,數(shù)據(jù)看起來很有希望,但遺憾的是,該計劃出了差錯。狡猾的越南企業(yè)家們干脆砍掉活老鼠的尾巴,并建立了養(yǎng)鼠場來增加收入。幾年后,河內(nèi)爆發(fā)了鼠疫。
今天,我們所有人在智能手機上生成的數(shù)據(jù),似乎與殖民時期河內(nèi)鼠患的統(tǒng)計數(shù)據(jù)相去甚遠。但是,對我們產(chǎn)生的數(shù)據(jù)做出錯誤解讀的危險并無二致。相關(guān)性有時具有欺騙性。激勵措施總會遭到戲弄。剝離了背景,數(shù)據(jù)可能、而且往往具有誤導(dǎo)性。
今天,中國科技巨頭阿里巴巴(Alibaba)在試驗其芝麻信用(Sesame Credit)評分系統(tǒng)時,似乎正在重新學(xué)到其中一些教訓(xùn)。通過收集數(shù)億用戶的大量數(shù)據(jù),阿里巴巴曾希望建立一個可靠的消費者可信度衡量標(biāo)準(zhǔn)。芝麻分基于從網(wǎng)購記錄到地鐵費用的所有信息得出,然后可以用它來發(fā)放——或拒發(fā)——消費貸款。
但正如英國《金融時報》所報道的那樣,大數(shù)據(jù)與強數(shù)據(jù)之間存在顯著差異——阿里巴巴也尚未利用其芝麻信用評分發(fā)放貸款。正如中國海洋大學(xué)(Ocean University of China)法學(xué)教授戴昕告訴英國《金融時報》的那樣,很難打造出在不同情境下都具有可靠預(yù)測能力的模型。“抄襲的學(xué)生也會欺詐嗎?沒有償還債務(wù)的公司也會在建筑合同上出爾反爾嗎?”他問道。
我最近與之交談過的一位美國科技公司高管解釋稱,算法的設(shè)計顯然是為了區(qū)別對待,把人分成不同的類別。但這意味著我們必須非常謹(jǐn)慎地理解,在任何給定模型中到底納入和剔除哪些數(shù)據(jù),以及可以合理地得出哪些推論。否則,用他的話說,算法歧視可能會成為“大數(shù)據(jù)的一氧化碳”——無色、無味但可能致命。只有當(dāng)數(shù)據(jù)被背景適當(dāng)?shù)亍把趸睍r,它們才變得安全。
斯特芬?毛(Steffen Mau)在他即將出版的新書《計量化社會》(The Metric Society)中,勾勒出了在如此多的方面對我們的生活進行量化的更大風(fēng)險,給了我們不祥的警示。我們對衡量一切事物——從學(xué)業(yè)成績、個人長相、行為習(xí)慣到受歡迎程度——的癡迷,正在創(chuàng)造一種新的社會價值秩序,一種“循規(guī)蹈矩”的文化,一個“可信虛構(gòu)”的世界。統(tǒng)計數(shù)據(jù)不僅反映了現(xiàn)有世界,而且正在構(gòu)建另一種新的現(xiàn)實。數(shù)據(jù)不僅被用來給社會提供信息,而且還被用來塑造社會。
這位柏林洪堡大學(xué)(Humboldt University)的宏觀社會學(xué)教授認(rèn)為,這種對定量評估的執(zhí)迷可能導(dǎo)致物質(zhì)不平等被數(shù)字不平等取代。階層之間的沖突將被個人之間的競爭所取代——想想優(yōu)步(Uber)司機為爭取更高的評分而展開的爭奪吧。“數(shù)字描述、創(chuàng)造和再造了地位,”他寫道,“數(shù)字造就了人。”
因此,由誰來決定收集哪些數(shù)字,由誰來判定這些數(shù)字的重要性,變成了一種行使權(quán)力的方式。但是,各個組織(無論是國際機構(gòu)、政府部門,還是全球性科技公司)用來做出此類決定的方法并未受到太多審查(如果有的話)。當(dāng)算法越來越多地決定學(xué)生在學(xué)校取得什么樣的成績、申請人能得到什么樣的工作、囚犯是否獲得假釋時,這一點就變得重要了。
一種應(yīng)對方法是努力顛覆跟蹤技術(shù)的概念,鼓勵個人創(chuàng)建自己的數(shù)據(jù)故事,以監(jiān)控和挑戰(zhàn)當(dāng)權(quán)者的權(quán)力。這可能會產(chǎn)生一種反監(jiān)控(而不是監(jiān)控)、忽視(而不是監(jiān)視)的文化。數(shù)據(jù)驅(qū)動的全球環(huán)境運動是如何改變了關(guān)于氣候變化的辯論的,是一個令人鼓舞的例子。
或者,一些機構(gòu)也許會停止玩定量游戲,就像根特大學(xué)(Ghent University)似乎下定決心要做的那樣。12月,這所比利時大學(xué)宣布,它將淡化用于做出撥款決定的競爭性的、以官僚主義方式確定的發(fā)表和引用指標(biāo)。相反,校長里克?范德瓦勒(Rik Van de Walle)宣稱,該校將促進一種學(xué)者們培養(yǎng)出的在研究團隊和教職員工之間加強合作的文化。
厲害厲害