CS224N
自然语言处理
自然语言处理的目标是让计算机处理或说“理解”自然语言,以完成有意义的任务,比如订机票购物或QA等。完全理解和表达语言是极其困难的,完美的语言理解等效于实现人工智能。
作为输入一共有两个来源,语音与文本。所以第一级是语音识别和OCR或分词。形态分析(Morphological)是分析该词的构造形式(主要针对英语而言,例如,uninterested = un(前缀)+ interest(词干) + ed(后缀))。句法分析是确定句子的语法结构句子中词汇之间的依存关系。本课程着重讲解句法分析和语义表示。
自然语言处理的应用
- 拼写检查、关键词检索……
- 文本挖掘(产品价格、日期、时间、地点、人名、公司名)
- 文本分类
- 机器翻译
- 客服系统
- 复杂对话系统
在工业界从搜索到广告投放、自动\辅助翻译、情感舆情分析、语音识别、聊天机器人等。
人类语言的特殊之处
与信号处理、数据挖掘不同,自然语言的随机性小而目的性强;语言是用来传输有意义的信息的,这种传输连小孩子都能很快学会。人类语言是离散的、明确的符号系统。但又允许出现各种变种,比如颜文字,随意的错误拼写“I loooove it”。这种自由性可能是因为语言的可靠性(赘余性)。所以说语言文字绝对不是形式逻辑或传统AI的产物。
语言符号有多种形式(声音、手势、书写),在这些不同的形式中,其意义保持不变。
虽然人类语言是明确的符号系统,但符号传输到大脑的过程是通过连续的声学光学信号,大脑编码似乎是连续的激活值上的模式。另外巨大的词表也导致数据稀疏,不利于机器学习。这构成一种动机,是不是应该用连续的信号而不是离散的符号去处理语言。
因为NVDIA官网即使是科学上网也经常崩,所以把百度网盘连接分享到文件里,需要的可以自取,密码ia9l
安装过程
只要要三步:
(1)下载并安装cuda9.1
(2)下载并安装cudnn7.1
(3) 下载并安装annaconda3-5.1.0
注意:1.查看cuda能否安装成功:在cmd(win+r)中输入:nvcc -V
2.安装cudnn7.0详细方法:
将cudnn压缩包中所有文件放入1
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0
目录下对应目录中,同时将1
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\CUPTI\libx64\cupti64_91.dll
拷贝到1
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin
CUDA环境测试
CMD中输入1
nvcc -V
如果成功出现下图,则说明CUDA和Cudnn已经配置成功
安装tensorflow
打开Anaconda Prompt,创建tensorflow虚拟环境1
conda create -n tensorflow python=3.5
然后启用虚拟环境1
activate tensorflow
最后安装tensorflow1
pip install tensorflow-gpu
如果安装速度较慢,可以使用清华大学开源软件镜像站的TensorFlow 镜像。
测试tensorflow安装情况
在刚才的Anaconda Prompt中输入1
Python
在Python的交互界面中输入1
2
3
4
5import tensorflow as tf
hello=tf.constant('Hello tensorflow!')
sess=tf.Session()
sess.run(hello)
sess.close()
然后激动人心的时刻,我们可以使用TF了。
可能出现的问题
- 找不到cudart64_90.dll:
- ImportError: DLL loaded failed: 找不到指定模块
出现上述问题是显卡驱动没有更新,手动到NVDIA对应网站下载对应显卡最新驱动安装,即可。
额外内容
为了方便之后的开发,我们可以安装Spyder这款十分强大的科学计算IDE。
首先添加清华大学镜像源1
2conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
然后1
conda install spyder
记得输入Yes,这样进行深度学习的环境就配置好了。