NLP1

CS224N

自然语言处理

自然语言处理的目标是让计算机处理或说“理解”自然语言,以完成有意义的任务,比如订机票购物或QA等。完全理解和表达语言是极其困难的,完美的语言理解等效于实现人工智能。
层次


作为输入一共有两个来源,语音与文本。所以第一级是语音识别和OCR或分词。形态分析(Morphological)是分析该词的构造形式(主要针对英语而言,例如,uninterested = un(前缀)+ interest(词干) + ed(后缀))。句法分析是确定句子的语法结构句子中词汇之间的依存关系。本课程着重讲解句法分析和语义表示。

自然语言处理的应用

  1. 拼写检查、关键词检索……
  2. 文本挖掘(产品价格、日期、时间、地点、人名、公司名)
  3. 文本分类
  4. 机器翻译
  5. 客服系统
  6. 复杂对话系统

在工业界从搜索到广告投放、自动\辅助翻译、情感舆情分析、语音识别、聊天机器人等。

人类语言的特殊之处

与信号处理、数据挖掘不同,自然语言的随机性小而目的性强;语言是用来传输有意义的信息的,这种传输连小孩子都能很快学会。人类语言是离散的、明确的符号系统。但又允许出现各种变种,比如颜文字,随意的错误拼写“I loooove it”。这种自由性可能是因为语言的可靠性(赘余性)。所以说语言文字绝对不是形式逻辑或传统AI的产物。
语言符号有多种形式(声音、手势、书写),在这些不同的形式中,其意义保持不变。
虽然人类语言是明确的符号系统,但符号传输到大脑的过程是通过连续的声学光学信号,大脑编码似乎是连续的激活值上的模式。另外巨大的词表也导致数据稀疏,不利于机器学习。这构成一种动机,是不是应该用连续的信号而不是离散的符号去处理语言。

因为NVDIA官网即使是科学上网也经常崩,所以把百度网盘连接分享到文件里,需要的可以自取,密码ia9l

安装过程

只要要三步:

(1)下载并安装cuda9.1

(2)下载并安装cudnn7.1

(3) 下载并安装annaconda3-5.1.0

注意:1.查看cuda能否安装成功:在cmd(win+r)中输入:nvcc -V

2.安装cudnn7.0详细方法:

将cudnn压缩包中所有文件放入

1
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0

目录下对应目录中,同时将

1
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\CUPTI\libx64\cupti64_91.dll

拷贝到

1
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin

CUDA环境测试

CMD中输入

1
nvcc -V

如果成功出现下图,则说明CUDA和Cudnn已经配置成功
Alt Cuda

安装tensorflow

打开Anaconda Prompt,创建tensorflow虚拟环境

1
conda create -n tensorflow python=3.5

然后启用虚拟环境

1
activate tensorflow

最后安装tensorflow

1
pip install tensorflow-gpu

如果安装速度较慢,可以使用清华大学开源软件镜像站的TensorFlow 镜像

测试tensorflow安装情况

在刚才的Anaconda Prompt中输入

1
Python

在Python的交互界面中输入

1
2
3
4
5
import tensorflow as tf
hello=tf.constant('Hello tensorflow!')
sess=tf.Session()
sess.run(hello)
sess.close()

然后激动人心的时刻,我们可以使用TF了。
Alt tf

可能出现的问题

  1. 找不到cudart64_90.dll:
  2. ImportError: DLL loaded failed: 找不到指定模块
    出现上述问题是显卡驱动没有更新,手动到NVDIA对应网站下载对应显卡最新驱动安装,即可。

额外内容

为了方便之后的开发,我们可以安装Spyder这款十分强大的科学计算IDE。
首先添加清华大学镜像源

1
2
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/  
conda config --set show_channel_urls yes

然后

1
conda install spyder

记得输入Yes,这样进行深度学习的环境就配置好了。

To be continue。。。

0%