Python中具有深度学习的自然语言处理 | Natural Language Processing with Deep Learning in Python
使用递归网络推导和实现word2vec、GloVe、单词嵌入和情感分析的完整指南
讲师:Lazy Programmer Inc.
双语资源中英文字幕学习课程,独家翻译制作,提供全部配套课程资料。全网最低价享受高品质课程资源,无限分享下载。
你将会学到什么?
- 理解并实施word2vec
- 理解word2vec中的CBOW方法
- 理解word2vec中的skip gram方法
- 了解word2vec中的负采样优化
- 使用梯度下降和交替最小二乘法理解和实现GloVe
- 使用递归神经网络进行词性标注
- 使用递归神经网络进行命名实体识别
- 理解并实现用于情绪分析的递归神经网络
- 理解并实现用于情绪分析的递归神经张量网络
- 使用Gensim获得预训练的单词向量,并计算相似性和类比
- 了解OpenAI ChatGPT、GPT-4、DALL-E、Midtravel和稳定扩散的重要基础
课程要求
- 安装Numpy、Matplotlib、Sci Kit Learn和Theano或TensorFlow(现在应该非常容易)
- 了解反向传播和梯度下降,能够自己推导和编码方程
- 根据Theano(或Tensorflow)中的基本基元,特别是扫描函数,对递归神经网络进行编码
- 在Theano(或Tensorflow)中编码前馈神经网络
- 有助于掌握树算法的经验
课程说明
有没有想过像OpenAIChatGPT、GPT-4、DALL-E、中端和稳定扩散*这样的人工智能技术是如何真正工作的?在本课程中,您将学习这些突破性应用程序的基础知识。
在本课程中,我们将研究NLP(自然语言处理)与深度学习。
之前,您了解了一些基础知识,比如有多少NLP问题只是常规的机器学习和数据科学问题,以及简单实用的方法,比如单词包和术语文档矩阵。
这些让我们可以做一些很酷的事情,比如检测垃圾邮件、写诗、发表文章,以及将类似的单词组合在一起。
在本课程中,我将向您展示如何做更棒的事情。在本课程中,我们不仅将学习1种新架构,还将学习4种新架构。
首先是word2vec。
在本课程中,我将向您展示word2vec是如何工作的,从理论到实现,您将看到它只是您已经知道的技能的应用。
Word2vec很有趣,因为它神奇地将单词映射到一个向量空间,在那里你可以找到类比,比如:
- 国王-男人=王后-女人
- 法国-巴黎=英国-伦敦
- 12月至11月=7月至6月
对于那些觉得算法很难并且只想使用库的初学者,我们将演示使用Gensim库来获得预先训练的单词向量,计算相似性和类比,并将这些单词向量应用于构建文本分类器。
我们还将研究GloVe方法,该方法也可以找到单词向量,但使用了一种称为矩阵分解的技术,这是推荐系统的一种流行算法。
令人惊讶的是,GLoVe产生的单词向量和word2vec产生的一样好,而且训练起来更容易。
我们还将研究一些经典的NLP问题,如词性标记和命名实体识别,并使用递归神经网络来解决它们。你会发现,几乎任何问题都可以使用神经网络来解决,但你也会学到过于复杂的危险。
最后,您将了解递归神经网络,它最终帮助我们解决情绪分析中的否定问题。递归神经网络利用了句子有树结构的事实,我们终于可以摆脱天真地使用单词袋的习惯。
本课程所需的所有材料都可以免费下载和安装。我们将在Numpy、Matplotlib和Theano*中完成大部分工作。我随时可以回答您的问题,并帮助您完成数据科学之旅。
本课程的重点是“如何构建和理解”,而不仅仅是“如何使用”。阅读一些文档后,任何人都可以在15分钟内学会使用API。这不是关于“记住事实”,而是关于通过实验“亲眼目睹”。它将教您如何在内部可视化模型中发生的事情。如果你想要更多而不仅仅是对机器学习模型的肤浅了解,这门课程就是为你准备的。
上课见!
“如果你不能实施它,你就不理解它”
- 或者正如伟大的物理学家理查德·费曼所说:“我不能创造的,我不理解”。
- 我的课程是您将学习如何从头开始实现机器学习算法的唯一课程
- 其他课程会教你如何将数据插入库,但你真的需要3行代码的帮助吗?
- 在对10个数据集做了同样的事情后,你会意识到你没有学到10件事。你学到了一件事,只重复了同样的3行代码10次。。。
建议的先决条件:
- 微积分(取导数)
- 矩阵加法、乘法
- 概率(条件分布和联合分布)
- Python编码:if/else、循环、列表、dicts、集合
- Numpy编码:矩阵和矢量运算,加载CSV文件
- 神经网络和反向传播,能够自己推导和编码梯度下降算法
- 可以在Theano或TensorFlow中编写前馈神经网络
- 可以从基本基元,特别是扫描函数,在Theano或TensorFlow中编写递归神经网络/LSTM/GRU
- 有助于掌握树算法的经验
我应该按什么顺序选修你的课程?:
- 查看讲座“机器学习和人工智能先决条件路线图”(可在我的任何课程的常见问题解答中找到,包括免费的Numpy课程)
独特的功能
- 详细解释了每一行代码-如果您不同意,请随时给我发电子邮件
- 不像其他课程那样浪费时间在键盘上“打字”——老实说,没有人能真正在20分钟内从头开始编写值得学习的代码
- 不怕大学级别的数学-了解其他课程遗漏的算法的重要细节
此课程面向哪些人?
- 想要为各种NLP任务创建词向量表示的学生和专业人员
- 对递归神经网络等最先进的神经网络架构感兴趣的学生和专业人士
- 不应该:任何对先决条件不满意的人。