2017年6月7日星期三

實時大數據分析 Cloudera助打擊兒童拐賣

隨著大數據和人工智能發展,通過人工智能和數據技術,甚至可用於打擊罪案,尋找失蹤兒童。兒童失蹤問題困擾不少社會。美國藉助高科技,茫茫人海中找回失蹤兒童,並打擊兒童色情,取得顯著成效。

美國每年有不少兒童被拐帶或離家出走,甚至遭受性侵犯。據美國全國失蹤及受虐兒童中心(National Center for Missing & Exploited Children)引述聯邦調查局數據;2016年美國失蹤兒童數目,已超過四十六萬。過去三十二年,美國全國失蹤及受虐兒童中心接獲的求助電話,超過了四百三十萬次。

網上色情網站泛濫和販賣人口,騙徒於社交平台上誘騙兒童,網上刊登廣告販賣兒童;網上色情和販賣人口猖獗,近年失蹤兒童愈趨嚴重。著名影星狄美摩亞(Demi Moore)和其前夫艾希頓庫奇(Ashton Kutcher),共同創辦了Thorn基金會,以高科技打擊兒童販賣問題,迄今已有二十多家矽谷高科技公司參與。

Thorn利用多種技術,追蹤和尋找網上失蹤人口。據開發大數據Hadoop平台的Cloudera市務高級董事伍長輝說,Cloudera為參與Thorn的其中一家科技公司。Thorn和Digital Reasoning合作,以Cloudera的Hadoop企業方案開發了Spotlight大數據工具,打擊網上兒童販賣及性侵犯案。雖然不少網站都用假名和年齡,Spotlight以機器學習和分析,仍可加快找出受害者、打擊網上誘騙兒童的網站,幫助執法人員提出檢控。

大減兒童色情罪案

現時全美四千多執法人員,已利用Spotlight工具,尋回超過二千名遭販賣和性侵犯的兒童,救出四千六百多名成年受害者,成效顯著。Spotlight還可分析罪案發生區域,向當地父母發出枴帶兒童警告,提供檢控證據,直接將匪徒繩之於法。

每日,Spotlight自動分析網上約十五萬則網上廣告。自2004年至今,分析達四億張照片的內容,如果以人手檢視,根本不可能處理上述數據量。美國警方甚至表示,Spotlight減省六成人口販賣調查時間。Thorn亦則利用AWS公有雲平台,執行Spotlight分析工作。

Thorn成員還包括了Google、Facebook、Salesforce、Microsoft、Mozilla、Digital Reasoning、Palantir、Sabre和Amazon Web Services (AWS)等。

Cloudera利用建立於HDFS檔案系統上的分散運算,處理網上大量的自然語言,並且以分析工具,找出誘騙者和兒童色情內容。稍後Spotlight亦會擴展至加拿大,協助當地執法機構打擊兒童色情。

伍長輝說,Cloudera以Hadoop平台開發不少快速分析大量數據和預測工具,不少精準營銷,或者客戶行為預測,都可透過大數據分析,獲得業務洞察力。以星展銀行(DBS)為例,以Cloudera預測離職可能性,及早作出挽留;亦利用Cloudera管理風險,預測有機會違約的貸款。

最近,Cloudera宣佈推出「平台即服務」(PaaS)Cloudera Altus,簡化公共雲上進行大規模的數據處理應用程式。Altus主要協助數據工程師使用按需的基礎設施,加快創建和運行具彈性的數據通道(Data pipeline),常見商業智能分析進行之前,必須從數據庫作預先處理(ETL;Extract, Transform and Load)或批次評分 (Batch scoring),通常屬於繁複及以批次為主的程序,花一段時間處理,從業務數據要花一段時間才能產生報表。Altus以抽象化管理和操作,簡化原本極花時間的ETL過程,並簡化利用S3等公共雲,提供儲存和數據服務,
以公共雲減低分析數據成本。

Microsoft則以工智能的人臉識別技術,為Thorn開發出PhotoDNA,尋找失蹤兒童之餘,快速辨認出涉及兒童的色情照,馬上通告執法機構調查,通知網站防範照片上傳,打擊網上的兒童色情。最近英特爾亦宣佈與美國全國失蹤及受虐兒童中心合作,利用人工智能尋找失蹤兒童。

沒有留言:

發佈留言