吴恩达机器学习第一天

张开发
2026/4/6 2:51:44 15 分钟阅读

分享文章

吴恩达机器学习第一天
#P2 机器学习的定义定义为赋予计算机在没有明确编程的情况下学习能力的研究领域。给学习算法更多的学习机会他的表现就会更好。主要类型监督学习supervised learning)无监督学习unsupervised learning)推荐系统recommender systems)强化学习reinforcement learning)#P3 监督学习定义学习x--y或者输入到输出映射的算法。关键特征是给学习算法提供包含正确答案的示例使算法学会在无输出标签的情况下仅凭输入就能够给出预测。用已经标注好正确答案的数据来训练模型让模型学会从输入预测输出。1.数据必须包含输入特征和输出标签2.目标是学习一个映射函数x--y3.训练过程是不断减小预测结果与真实标签的误差##举例根据房屋的大小来预测房价学习算法可以拟合一条直线或曲线其他函数通过预测房子的可能价格 。房价预测是监督学习的一种类型——回归即从无限多个可能的数字中预测一个数字 。##第二种监督学习类型为分类以乳腺癌检测为例医生通过机器学习系统可以shoo用诊断工具来检测乳腺癌使用患者的医疗记录系统试图判断一个肿瘤是良性或恶性 。数据集中有各种大小的肿瘤一部分被标记为良性0一部分为恶性1用图表绘制与回归不同的是我们预测的只是少数几个可能的输出或类别而回归试图预测无数可能数字中的一个。多个数据集的情况#P4无监督学习定义数据仅包含输入x不包含输出y并不试图监督算法为每个输入提供正确答案相反要求算法自己找出数据中可能有趣或存在的模式或结构。##在无监督学习中我们得到的数据没有与任何输出标签Y相关联假设得到了关于患者及其肿瘤大小和年龄的数据但没有关于肿瘤是良性或恶性无监督算法会将其分配到两个不同的组成或簇中这种称为聚类算法。聚类算法用于谷歌新闻将相关的故事分组在一起相似文章。或者应用于聚类基因或DNA数据可以将个体分成不同类别或不同类型的人。还比如某些公司的客户类型数据库会自动将客户分成不同的市场细分。因此聚类算法处理无标签数据并尝试将他们自动分组在簇中##其他无监督类型1.异常检测用于检测异常事件在金融系统中的欺诈检测中常用 Anomaly detection)2.降维将大数据压缩为小得多的数据集同时尽可能少的丢失信息

更多文章