靠近北京西北四環的一棟寫字樓里,韓景維掏出手機撥出一個號碼。很快,他的號碼顯示在對方的來電提醒里。這樣一個司空見慣的場景,其實在短短數秒鐘內,就已經經過一系列復雜的查詢、識別和過濾。如果打來的是一個騷擾或詐騙電話,智能手機上便會出現相應的標記,看似簡單的小事,背后卻需要一個龐大的數據庫和一套完善的模型來支撐。
打算購房的人剛看完一個樓盤,便收到密集的房屋推銷電話;簽完購房合同沒幾天,各類詢問貸款需求的電話頻頻打擾;接到大學錄取通知書后,一個個假冒提供助學措施的詐騙電話緊隨而至……生活在騷擾和詐騙電話不斷來襲的當下,我們靠什么來守住一片寧靜的空間?
大數據與科技運算已經提供了解決方案。多年來,騰訊手機管家安全專家韓景維和團隊成員一直致力于此。如今,這個團隊建立的數據庫,已經儲存了1300多萬個被標識為騷擾或詐騙等有問題的電話號碼。
“每呼叫一次,便在數據庫里經過一次查詢,每天的查詢量在15億次,其中能查到的騷擾或詐騙電話在4000萬次左右。”韓景維介紹說。
據介紹,完成上述任務的核心是一個儲存有龐大問題號碼的數據庫。一部分數據來源于手機用戶的主動標記行為,頻繁被標記的問題號碼就會上報到數據庫里。
另一個重要的數據來源,則是通過騰訊手機管家團隊建立的模型運算出的結果。騰訊手機管家首先把一套安全系統部署到手機運營商,然后對運營商提供的海量撥號信息數據進行格式化、標準化,通過模型的運算精準識別出哪些是有問題的號碼。
韓景維舉了這樣一個例子,公安部門在破獲一起電信詐騙案后,把查出的一批詐騙電話號碼提供出來,比如有50個詐騙號碼,騰訊的安全系統會對這50個號碼進行多維度的數據運算,機器學習模型會對GPS坐標、通話記錄、通話頻次等號碼信息展開歸納學習,摸索出這些詐騙號碼的規律后,再挖掘出尚未被查獲的其他詐騙號碼。
無論是用戶主動上報的問題號碼,還是經過系統運算識別出的詐騙號碼,都會被儲存在一個數據庫里,在人們接到陌生號碼的那一刻,立即做出相應的標記提醒。
在為人們守護寧靜的同時,用戶通話信息的隱私如何得到有效的保護?據介紹,互聯網公司把手機安全系統部署到手機運營商,是為了識別、收集騷擾或詐騙等問題號碼,因此取回的數據不涉及正常的用戶號碼,在模型運算中也不會涉及用戶的通話內容等隱私信息。
另外,為了防止一些正常的號碼被惡意標記,上述數據庫里還建立一個白名單,政府、企事業單位等部門的號碼會被納入到白名單內。用戶的正常號碼,一旦遭惡意標記或被誤操作標記,在用戶申訴后,騰訊手機管家團隊會通過數據庫進行審核,把相應的標記取消。(完顏文豪、顏之宏)(新華每日電訊)