Python中具有深度学习的自然语言处理 | Natural Language Processing with Deep Learning in Python

使用递归网络推导和实现word2vec、GloVe、单词嵌入和情感分析的完整指南
讲师:Lazy Programmer Inc.

双语资源中英文字幕学习课程,独家翻译制作,提供全部配套课程资料。全网最低价享受高品质课程资源,无限分享下载。

你将会学到什么?

  • 理解并实施word2vec
  • 理解word2vec中的CBOW方法
  • 理解word2vec中的skip gram方法
  • 了解word2vec中的负采样优化
  • 使用梯度下降和交替最小二乘法理解和实现GloVe
  • 使用递归神经网络进行词性标注
  • 使用递归神经网络进行命名实体识别
  • 理解并实现用于情绪分析的递归神经网络
  • 理解并实现用于情绪分析的递归神经张量网络
  • 使用Gensim获得预训练的单词向量,并计算相似性和类比
  • 了解OpenAI ChatGPT、GPT-4、DALL-E、Midtravel和稳定扩散的重要基础

课程要求

  • 安装Numpy、Matplotlib、Sci Kit Learn和Theano或TensorFlow(现在应该非常容易)
  • 了解反向传播和梯度下降,能够自己推导和编码方程
  • 根据Theano(或Tensorflow)中的基本基元,特别是扫描函数,对递归神经网络进行编码
  • 在Theano(或Tensorflow)中编码前馈神经网络
  • 有助于掌握树算法的经验

课程说明

有没有想过像OpenAIChatGPTGPT-4DALL-E中端稳定扩散*这样的人工智能技术是如何真正工作的?在本课程中,您将学习这些突破性应用程序的基础知识。

在本课程中,我们将研究NLP(自然语言处理)深度学习

之前,您了解了一些基础知识,比如有多少NLP问题只是常规的机器学习数据科学问题,以及简单实用的方法,比如单词包和术语文档矩阵。

这些让我们可以做一些很酷的事情,比如检测垃圾邮件写诗发表文章,以及将类似的单词组合在一起。

在本课程中,我将向您展示如何做更棒的事情。在本课程中,我们不仅将学习1种新架构,还将学习4种新架构。

首先是word2vec

在本课程中,我将向您展示word2vec是如何工作的,从理论到实现,您将看到它只是您已经知道的技能的应用。

Word2vec很有趣,因为它神奇地将单词映射到一个向量空间,在那里你可以找到类比,比如:

  • 国王-男人=王后-女人
  • 法国-巴黎=英国-伦敦
  • 12月至11月=7月至6月

对于那些觉得算法很难并且只想使用库的初学者,我们将演示使用Gensim库来获得预先训练的单词向量,计算相似性和类比,并将这些单词向量应用于构建文本分类器。

我们还将研究GloVe方法,该方法也可以找到单词向量,但使用了一种称为矩阵分解的技术,这是推荐系统的一种流行算法。

令人惊讶的是,GLoVe产生的单词向量和word2vec产生的一样好,而且训练起来更容易。

我们还将研究一些经典的NLP问题,如词性标记命名实体识别,并使用递归神经网络来解决它们。你会发现,几乎任何问题都可以使用神经网络来解决,但你也会学到过于复杂的危险。

最后,您将了解递归神经网络,它最终帮助我们解决情绪分析中的否定问题。递归神经网络利用了句子有树结构的事实,我们终于可以摆脱天真地使用单词袋的习惯。

本课程所需的所有材料都可以免费下载和安装。我们将在Numpy、MatplotlibTheano*中完成大部分工作。我随时可以回答您的问题,并帮助您完成数据科学之旅。

本课程的重点是“如何构建和理解”,而不仅仅是“如何使用”。阅读一些文档后,任何人都可以在15分钟内学会使用API。这不是关于“记住事实”,而是关于通过实验“亲眼目睹”。它将教您如何在内部可视化模型中发生的事情。如果你想要更多而不仅仅是对机器学习模型的肤浅了解,这门课程就是为你准备的。

上课见!

“如果你不能实施它,你就不理解它”

  • 或者正如伟大的物理学家理查德·费曼所说:“我不能创造的,我不理解”。
  • 我的课程是您将学习如何从头开始实现机器学习算法的唯一课程
  • 其他课程会教你如何将数据插入库,但你真的需要3行代码的帮助吗?
  • 在对10个数据集做了同样的事情后,你会意识到你没有学到10件事。你学到了一件事,只重复了同样的3行代码10次。。。

建议的先决条件:

  • 微积分(取导数)
  • 矩阵加法、乘法
  • 概率(条件分布和联合分布)
  • Python编码:if/else、循环、列表、dicts、集合
  • Numpy编码:矩阵和矢量运算,加载CSV文件
  • 神经网络和反向传播,能够自己推导和编码梯度下降算法
  • 可以在Theano或TensorFlow中编写前馈神经网络
  • 可以从基本基元,特别是扫描函数,在Theano或TensorFlow中编写递归神经网络/LSTM/GRU
  • 有助于掌握树算法的经验

我应该按什么顺序选修你的课程?:

  • 查看讲座“机器学习和人工智能先决条件路线图”(可在我的任何课程的常见问题解答中找到,包括免费的Numpy课程)

独特的功能

  • 详细解释了每一行代码-如果您不同意,请随时给我发电子邮件
  • 不像其他课程那样浪费时间在键盘上“打字”——老实说,没有人能真正在20分钟内从头开始编写值得学习的代码
  • 不怕大学级别的数学-了解其他课程遗漏的算法的重要细节

此课程面向哪些人?

  • 想要为各种NLP任务创建词向量表示的学生和专业人员
  • 对递归神经网络等最先进的神经网络架构感兴趣的学生和专业人士
  • 不应该:任何对先决条件不满意的人。
声明:双语资源网(shuangyuziyuan.com)提供的所有课程、素材资源全部来源于互联网,用户赞助仅用于对双语资源服务器带宽及网站运营等费用支出做支持,如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。