机器学习的特征选择 | Feature Selection for Machine Learning
学习过滤器、包装器和嵌入方法、递归特征消除、穷举搜索、特征洗牌等。
讲师:Soledad Galli
双语资源中英文字幕学习课程,独家翻译制作,提供全部配套课程资料。全网最低价享受高品质课程资源,无限分享下载。
你将会学到什么?
- 了解用于功能选择的过滤器、嵌入和包装方法
- 了解用于特征选择的hybdrid方法
- 使用套索和决策树选择功能
- 用Python实现不同的特征选择方法
- 了解为什么少(功能)就是多
- 减少数据集中的特征空间
- 构建更简单、更快、更可靠的机器学习模型
- 分析并理解所选功能
- 探索数据科学竞赛中使用的特征选择技术
课程要求
- Python安装
- Jupyter笔记本电脑安装
- Python编码技能
- Numpy和Pandas的一些经验
- 熟悉机器学习算法
- 熟悉scikit学习
课程说明
欢迎学习机器学习的特征选择,这是在线提供的关于特征选择的最全面的课程。
在本课程中,您将学习如何选择数据集中的变量,并构建更简单、更快、更可靠、更可解释的机器学习模型。
这门课是给谁的
你已经迈出了进入数据科学的第一步,你知道最常用的机器学习模型,你可能建立了一些基于线性回归或决策树的模型。您熟悉数据预处理技术,如删除丢失的数据、转换变量、编码分类变量。在这个阶段,你可能已经意识到,许多数据集包含了大量的特征,其中一些是相同的或非常相似的,其中一些根本无法预测,而对于其他一些数据集,这就更难说了。
你想知道如何找到最具预测性的功能。哪些可以保留,哪些可以不用?您还想知道如何以专业的方式对方法进行编码。也许你在网上搜索了一下,发现关于功能选择的内容并不多。所以你开始怀疑:科技公司的事情到底是怎么做的?
本课程将对您有所帮助!这是变量选择中最全面的在线课程。您将学习世界各地不同组织和数据科学竞赛中使用的各种特征选择程序,以选择最具预测性的特征。
你将学到什么
我根据科学文章、数据科学竞赛,当然还有我自己作为数据科学家的经验,收集了一系列精彩的特征选择技术。
具体而言,您将学习:
- 如何删除差异较小的功能
- 如何识别冗余功能
- 如何根据统计测试选择功能
- 如何根据模型性能的变化选择特征
- 如何根据模型的重要性找到预测特征
- 如何以专业的方式优雅地编写程序代码
- 如何利用现有Python库的强大功能进行功能选择
在整个课程中,您将学习上述每个任务的多种技术,并将学习使用Python、Scikit-learn、panda和mlxtend以优雅、高效和专业的方式实现这些技术。
在课程结束时,您将有各种工具来选择和比较不同的特征子集,并确定返回最简单但最具预测性的机器学习模型的特征子集。这将使您能够最大限度地减少将预测模型投入生产的时间。
这门全面的功能选择课程包括大约70个讲座,跨度约为8小时的视频,所有主题都包括动手操作的Python代码示例,您可以使用这些示例进行参考和练习,并在自己的项目中重复使用。
此外,我定期更新课程,以跟上Python库的新版本,并在它们出现时包括新技术。
那你还在等什么?立即注册,接受功能选择的力量,构建更简单、更快、更可靠的机器学习模型
此课程面向哪些人?
- 想要了解如何为机器学习选择变量的初级数据科学家
- 希望提升机器学习特征选择经验的中级数据科学家
- 希望发现特征选择替代方法的高级数据科学家
- 软件工程师和学者转行从事数据科学
- 软件工程师和学者步入数据科学
- 希望提高数据科学技能的数据分析师