安全路透社
当前位置:安全路透社 > 网络转载 > 正文

应用深度学习与大数据分析识别诈骗(骚扰)电话

CM Logo.png

深度学习背景介绍

Google 在 2012 年透过 Google Brain 展现了前所未有的机器学习能力,2016年 Google 再次藉由 DeepMind 的 AlphaGo 于围棋上的胜利展现了深度学习的能力 [6];深度学习 (英语:Deep Learning) 并不是凭空创造出来的运算技术,是归属于机器学习的分支,模仿神经网路的运算模式透过复杂多节点、分层的运算结构对资料进行高层抽象的演算法;而神经网路更是远在1980便有研究者们开始进行相关研究,且随着近年来软硬体与计算效能的提升有大幅度进步;2009年多伦多大学 GeoffreyHinton 教授及其研究团队就以深度学习技术,开发出高准确度的语音辨认技术,能够正确地将口语转换成文字 [2],2012年,Geoffrey Hinton 教授的团队于电脑视觉辨识比赛 ILSVRC (ImageNet Large Scale VisualRecognition Challenge) 透过其所开发的深度学习系统获得了比过去高出约10%的正确率;並于2014年与Google合作以 GoogLeNet 再次取得該照片内容辨识的冠军。

猎豹移动总裁傅盛说:深度学习是基于多层神经网路,并以海量数据做为输入的自主学习方法 [1];其本质就是透过很多小的数学元件组合成一个复杂模型再用来解复杂的问题。

诈骗(骚扰)电话现况

美国联邦贸易委员会 (Federal Trade Commission,FTC) 曾指出:电话诈骗是美国境内最普遍发生的诈骗案。联邦贸易委员会收到超过1500万有关诈骗的投诉,而在2014年这些案件牵涉总金额超过17亿;所有受害人中,46%在投诉时指出诈骗方式,而其中54%受害者指称遭受电话诈骗 [3]。同时,FTC亦倡议打击语音电话行销 (Robocall),得到如AT&T、谷歌、Alphabet、苹果、Verizon和Comcast 等30多家主要高科技公司的响应 [4]。另外,中国近来传出考上大学的学生被诈骗电话骗学费,导致呼吸心脏骤停最终去世。陆媒报导,在中国从事网路诈骗产业的人数至少有160万人,「年产值」逾人民币1100亿元;据日本警察厅统计,2014年,日本电信诈骗的涉嫌金额超过500亿日元 (32亿人民币)。国务院总理李克强在国务院常务会议通过《中华人民共和国无线电管理条例(修订草案),并表示:现在有些电信诈骗,不仅能够在群众手机上显示电信、银行、公安等部门机构的正式号码,还能准确了解群众与这些部门联系的信息。这恐怕不是简单的技术问题 [5] 。

数据分析及系统架构设计

图1. 非联络人陌生电话号码拨打行为分析

企业软体公司或服务公司目前碰到的最大问题便是“没有数据,怎么人工智慧化?”;拥有再高深的软体及再强大的硬体,没有所谓的商业逻辑与数据积累,任何商业的人工智慧是没有意义的空盒子[11]。而「该使用何种机器学习演算法?」的答案永远都是「视情况。」 这可视资料的大小、品质或是取决于演算法的数学运算如何针对您正在使用的电脑转译成指令。2016年03月,Google DeepMind 团队研发Alpha Go [6] 并且挑战南韩知名职业围棋棋士成功取得四胜一败,刹那间,深度学习、机器学习以及人工智慧获得大量的观注;另一方面,截至2016年06月30日,猎豹移动核心产品在全球范围内已下载安装到30.99亿台移动设备上,月度活跃用户规模达6.23亿。其中,79.4%的移动月度活跃用户来自欧、美为主的海外市场 [12] 。因此,基于深度学习其对于图像辨识的强大效果[7, 8],猎豹移动威胁情报中心 (http://tic.cmcm.com) 藉由猎豹移动的核心产品于2016年05月开始至今已成功使用深度学习的Inception-v3 等模型 [9] 来对抗会因时区、语系等不同而造成远比过去钓鱼网站生命周期短的欺诈广告威胁,并获得了近90%的侦测率[10]。同时,猎豹移动威胁情报中心亦与后台数据运营研发团队 针对2016年07月01日至2016年07月31日已成功辨识为骚扰、市场推销、诈骗、保险;快递及服务中心与已经过认证的非联络人陌生电话号码​​进行数据分析,如图1所示可以发现在上班时间(08-19)内,会有大量的拨打次数,进一步统计,发现平常上班工作日与周末休假日亦有类似的关联行为,两者间呈固定增减;再透过机器学习中LogisticRegression (逻辑回归)、Decision Tree (决策树)、Random Forest (随机森林)、SVM以及深度学习的Deep Neural Network (深层类神经网路, DNN) 等演算法进一步针对其来电响铃、接听时长、及使用者是否接听等各种行为进行关联分析。以下将简要说明系统的安装等相关指令:

表1. 自建测试软硬体环境

cuDNN v4
Keras 1.0.6
Python 2.7.6
TensorFlow 0.8
Cuda Tookit 7.5
Scikit-learn 0.17.1
Ubuntu x64 14.04
Intel Core i7 4770
GIGABYTE Z87-HD3
Intel S320/S520 SSD
ADATA DDR3 8GB * 4
GIGABYTE GTX 960 4G * 2

表2. Tensorflow 相关安装指令 (1. 安装 JAVA)

# add-apt-repository ppa:webupd8team/java 

# apt-get install oracle-java8-installer 

# apt-get update

表3. Tensorflow 相关安装指令 (2. 安装 bezel)

# echo "deb [arch=amd64] http://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list 

# curl https://storage.googleapis.com/bazel-apt/doc/apt-key.pub.gpg | sudo apt-key add - 

# apt-get update # apt-get install bazel 

# apt-get upgrade bazel 

# apt-get update

表4. Tensorflow 相关安装指令 (3. 安装 nvidia 驱动程式)

# add-apt-repository ppa:xorg-edgers/ppa -y 

# apt-get install nvidia-346 

# apt-get update

表5. Tensorflow 相关安装指令 (4. 安装 cuda Toolkit 7.5 及 cudnn v4)

cuda 下載網址: https://developer.nvidia.com/cuda-downloads 

cudnn 下載網址 https://developer.nvidia.com/cudnn (需注册) 

# export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64" 

# export CUDA_HOME=/usr/local/cuda # ./cuda_7.5.18_linux.run -extract=/tensorflow/cuda 

# ./cuda-linux64-rel-7.5.18-19867135.run 

# ./cuda-samples-linux-7.5.18-19867135.run 

# cp include/cudnn.h /usr/local/cuda-7.5/include/ 

# cp lib64/libcudnn* /usr/local/cuda-7.5/lib64/

表6. Tensorflow 相关安装指令 (5. 安装Tensorflow并开启 GPU 支持)

# git clone --recurse-submodules https://github.com/tensorflow/tensorflow 

# pip install https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-0.8.0-cp27-none-linux_x86_64.whl

# bazel build -c opt --config=cuda //tensorflow/cc:tutorials_example_trainer 

# bazel-bin/tensorflow/cc/tutorials_example_trainer --use_gpu

赞 (0)
分享到:更多 ()

评论 0

评论前必须登录!

登陆 注册