草根影響力新視野 文/田卡 圖片來源:新華網

互聯網已經成為現代人生活的重要一部分,我們對鍵盤或滑鼠的每一次敲擊所產生的信息都會與ID定義的個體發生精確的關聯。不同於人,互聯網沒有遺忘機制,依靠計算機,它擁有強大的存儲和記錄能力。於是,用戶的個體特性、地理位置、好友網路、個人資料、瀏覽習慣、消費偏好、購物情況、信用記錄等都會變成信息流為各個互聯網公司所挖掘和分析。

單就用戶的“好友網路”來說,大陸第一即時通訊工具QQ會把服務器裏的二度好友關系、群成員關系、朋友網班級校友關系、微博聽眾關系等等各種關系鏈資源整合到一起,就把用戶的社交圈完整地勾勒出來。於是,你精準地被“圈”了。

圈子魔力的背後,是隱身在各大互聯網公司的工程師們,他們的精準算法一步步把用戶的每次點擊還原成有好友、有愛好、有消費偏好的活生生的人!這必然帶來令人苦惱的隱私問題。

個人隱私被互聯網洩露的後果在2012年3月美國一家法院的判案中得以極端體現。一位名為克萊曼提的美國年輕人被室友拉維通過網路搜索確認為同性戀,克萊曼提因忍受不了性傾向歧視和網路欺淩,最終選擇了跳橋自殺,拉維也因此被判入獄10年。克萊曼提登錄同性戀論壇的頻率、網站留言“為什麽異性喜歡我,我對她們卻沒感覺?不過媽媽喜歡我啊,我也喜歡媽媽啊……”等等在網路上記錄的痕跡被拉維搜到,成為釀成悲劇的導火線。

這是個體有目的地通過互聯網挖掘他人隱私數據(俗稱“人肉”)帶來的嚴重後果,那麽互聯網公司的數據挖掘行為呢?

移動社交應用Path為了幫用戶獲得最優的150個好友,未經用戶批准掃描手機通訊錄。Path的創始人出面道歉,並解釋說上傳用戶電話簿的行為是有嚴格限制的,僅僅用於提高“好友建議”的質量。所有用戶在Path上分享的消息都經過了加密,這些電話簿的資料同樣也是。

“虛擬社交關系”入侵“現實電話簿”的不止Path.大名鼎鼎的Twitter也招供下載存儲用戶通訊錄長達18個月,還有KIK、WhatApp、米聊、速聊等一大堆社交應用程序這樣或明或暗地從用戶手機中吸取數據。這種數據挖掘行為已經形成了不少的擔憂甚至反對的聲音:用戶的個人數據和關系屬於用戶本人,用戶擁有自己數字化數據的知情權、擁有權和絕對控制權,其他公司對這些個人數據的追蹤、分析和轉讓都是不可容忍的。

這些爭論無非源自於對數據源中可能含有的用戶身份、健康狀況、家庭情況、個人收入等關鍵信息洩露的擔憂。另外,互聯網公司可以通過將所分析的用戶同其所掌握的用戶個人數據結合,進而變身“老大哥”對用戶的網路活動進行監控。數據挖掘還有可能把原本分散在多個網路系統中的用戶數據集成、提煉,從而掌握用戶在各個領域的行為,這些行為的匯集可能是用戶不希望外洩的。

就像保護個人隱私並不阻礙我們願意在公共場合說話,數據挖掘也不總是站在隱私的對立面。仔細回想一下,我們經常會在公開場合,例如餐館、車站,進行私人性質的談話。我們明白對話內容會被服務員或者路人聽到,但心理學家歐文·高夫曼所說的“禮貌性疏忽(civilinattention)”會幫到我們,人們一般會選擇過濾掉我們的談話內容,即使聽到了也不會加入我們的討論。當然我們自己也會通過壓低聲音來限制傳播範圍,談話末了還會加上一句,“千萬不要告訴別人”。

在網路這個虛擬公共場合裏,用戶也可以對一些信息內容采取加設密碼、“穿上馬甲”等方式來進行“竊竊私語”,效果就像在餐館談話時壓低聲音一樣明顯。不過用戶的大多數數據還是會被記錄,然後被使用於商業目的。現在流行的精準營銷、社會化營銷、移動廣告、O2O等無不是在數據挖掘的支持下產生的。

而包括Google在內的一些互聯網公司認為,這些適度的隱私出讓可以讓用戶受益,並帶來社會效率的提升。如果沒有得到用戶足夠多的數據並進行分析,Google的搜索結果可能會像謝耳朵的超嚴密邏輯分析一樣無厘頭。某種程度上來說,正是這些用戶數據的有心搜集,才讓互聯網提供的各種服務多了些溫情,少了些死板,“你要讓它為你更好地服務就不可能不讓它更了解你是誰”。

其實,數據挖掘本身不存在倫理問題。數據挖掘技術是中立的,大多數用戶行為的數據也不會產生倫理問題,從廣義上講,從乘用車的碰撞測試數據到一組股票的表現均可被視為數據挖掘的範圍,這些類型的數據雖占據可以被數據挖掘方法所分析的很大比例,卻很少讓人產生道德方面的憂慮。

但對個人隱私的威脅的產生主要來自於當數據一旦被編譯,導致數據挖掘方或者任何可以接近數據集的人,能夠辨別特定的個體,便存在利益侵犯的可能性。例如公司可以透過訪問醫療記錄來篩選出那些有糖尿病或者嚴重心臟病的人,從而意圖削減保險支出。

更多評論:草根影響力新視野