【人工智能 AI】机器学习快速入门教程(Google)
创始人
2024-05-28 12:09:10
0

目录

机器学习术语 

标签

特性

示例

模型

回归与分类

深入了解机器学习:线性回归 

深入了解机器学习:训练和损失 


机器学习术语 

预计用时:8 分钟

什么是(监督式)机器学习?简而言之,如下所示:

  • 机器学习系统学习如何组合输入以对从未见过的数据生成有用的预测。

我们来探索一下机器学习的基本术语。

标签

标签是指我们要预测的内容,即简单线性回归中的 y 变量。标签可以是小麦的未来价格、图片中显示的动物类型、音频剪辑的含义,也可以是其他任何信息。

特性

特征是输入变量,即简单线性回归中的 x 变量。一个简单的机器学习项目可能会使用单个功能,而更复杂的机器学习项目可以使用数百万个功能,如下所示:

在垃圾邮件检测器示例中,这些功能可能包括:

  • 电子邮件文字中的字词
  • 发件人的地址
  • 发送电子邮件的时间
  • 电子邮件中包含词组“一种奇怪的技巧”。

示例

样本是指数据的特定实例:x。(我们将 x 显示为粗体,表示它是一个矢量。)我们将示例分为两类:

  • 有标签样本
  • 无标签样本

有标签样本同时包含特征和标签。具体来说:

  labeled examples: {features, label}: (x, y)

使用有标签样本来训练模型。在我们的垃圾邮件检测器示例中,有标签样本是指用户明确标记为“垃圾邮件”或“不是垃圾邮件”的个别电子邮件。

例如,下表显示了从包含加利福尼亚州房价信息的数据集中获取的 5 个有标签样本:

homeMedianAge
(功能)
会议室总数
(设施)
卧室总数
(设施)
medianHouseValue
(标签)
155612128366900
197650190180100
1772017485700
14150133773400
20145432665500

无标签样本包含特征,但不包含标签。具体来说:

  unlabeled examples: {features, ?}: (x, ?)

以下是来自同一住房数据集的 3 个无标签样本(不包括 medianHouseValue):

homeMedianAge
(功能)
会议室总数
(设施)
卧室总数
(设施)
421686361
341226180
331077271

使用有标签样本训练模型后,我们便会使用该模型来预测无标签样本的标签。在垃圾邮件检测器中,无标签样本是用户尚未添加标签的新电子邮件。

模型

模型定义了特征和标签之间的关系。例如,垃圾内容检测模型可能会将某些功能与“垃圾内容”紧密关联。我们重点介绍模型生命周期的两个阶段:

  • 训练是指创建或学习模型。也就是说,您向模型展示有标签样本,让模型逐渐学习特征与标签之间的关系。

  • 推断表示将经过训练的模型应用于无标签样本。也就是说,使用经过训练的模型做出有用的预测 (y')。例如,在推理期间,您可以针对新的无标签样本预测 medianHouseValue

回归与分类

回归模型可预测连续值。例如,回归模型做出的预测可回答如下问题:

  • 加利福尼亚州一栋房子的价值是多少?

  • 用户点击此广告的可能性有多大?

分类模型可预测离散值。例如,分类模型做出的预测可回答如下问题:

  • 指定的电子邮件是垃圾邮件还是非垃圾邮件?

  • 这是狗、猫还是仓鼠的图片?

关键术语

  • 分类模型
  • 示例
  • 功能
  • 推断
  • 标签
  • 模型
  • 回归模型
  • 训练

 

深入了解机器学习:线性回归 

预计用时:6 分钟

长久以来,人们都知道板球(昆虫物种)在天气炎热的日子里会比在更冷的日子里鸣叫。数十年来,专业和业余科学家一直在编制每分钟的鸣叫声和温度方面的数据。Ruth 大姨妈给您送上生日祝福,送上一份生日礼物,邀请您学习一个模型来预测这种关系。 您想利用这些数据来探索这种关系。

首先,通过绘制数据的方式检查数据:

 

图 1. 每分钟的鸣叫声与温度(以摄氏度为单位)。

如您所料,该图表显示了温度随着鸣叫声次数的增加而上升。 鸣叫声与温度之间的关系是线性关系吗?可以,您可以绘制一条直线来大致说明这种关系:

图 2. 一种线性关系。

关键术语

  • 偏差
  • 推断
  • 线性回归
  • 重量

深入了解机器学习:训练和损失 

 

预计用时:6 分钟

训练模型只需从有标签样本中学习(确定)所有权重和偏差的理想值。在监督式学习中,机器学习算法通过检查许多示例并尝试找到将损失降至最低的模型来构建模型;此过程称为经验风险最小化。

损失是错误预测的惩罚。也就是说,损失是一个表示模型在单个样本上的预测质量的数字。如果模型的预测完全准确,则损失为零,否则损失会更大。训练模型的目的是从所有样本中找到一组平均损失“较小”的权重和偏差。例如,图 3 左侧显示的是高损失模型,右侧显示的是低损失模型。对于该图,请注意以下几点:

  • 箭头表示损失。
  • 蓝线表示预测。

 

图 3. 左侧模型中的损失较高;右侧模型中的损失较低。

请注意,左侧曲线图中的箭头比右侧曲线图中的箭头长得多。显然,相较于左侧曲线图中的线条,右侧曲线图中的预测模型要好得多。

您可能想知道是否可以创建数学函数(损失函数),以有意义的方式汇总各个损失。

我们在此探讨的线性回归模型使用一种称为平方损失函数(也称为 L2 损失)的损失函数。单个样本的平方损失如下:

  = the square of the difference between the label and the prediction= (observation - prediction(x))2= (y - y')2

关键术语

  • 经验风险最小化
  • 损失
  • 均方误差
  • 平方损失函数
  • 训练

 

https://developers.google.com/machine-learning/crash-course/ml-intro?hl=zh-cn 

上一篇:188888

下一篇:七、Bean的实例化方式

相关内容

热门资讯

学术年会主持词 学术年会主持词范文(精选10篇)  根据活动对象的不同,需要设置不同的主持词。现今社会在不断向前发展...
年会董事长致辞 年会董事长致辞15篇  在我们平凡的日常里,大家或多或少都用到过致辞吧,致辞讲求条理性,有思路、层次...
六一文艺汇演主持稿 六一文艺汇演主持稿六一文艺汇演主持稿1  甲:尊敬的各位领导、各位老师  乙:亲爱的同学们  合:大...
公司元旦致辞 公司元旦致辞(精选10篇)  在平日的学习、工作和生活里,大家都对致辞很是熟悉吧,致辞要注意人物的身...
欢喜姻缘--较婚礼主持词 欢喜姻缘--较实用的婚礼主持词  尊敬的各位来宾、亲爱的朋友们、女士们、先生们大家上午好!  欢迎您...
企业年终颁奖晚会主持词   主持人:又是一年芳草绿,又是一年逢春意,又是一年春风起,又是一年听春雨。先生们、女士们 、各位领...
婚礼新郎致辞 婚礼新郎致辞列位宾客:各人午时好!本日是我儿子x与xx喜结良缘的大喜日子,承蒙列位宾客远道而来介入我...
中华诵读主持词 中华诵读主持词(通用11篇)  主持词要尽量增加文化内涵、寓教于乐,不断提高观众的文化知识和素养。随...
开门红总结大会主持词 开门红总结大会主持词(通用5篇)  根据活动对象的不同,需要设置不同的主持词。在如今这个中国,主持人...
农村婚庆的司仪主持词 农村婚庆的司仪主持词  利用在中国拥有几千年文化的诗词能够有效提高主持词的感染力。在当今不断发展的世...
小品主持串词 小品主持串词范文  小品主持串词(一)  女主持人:首先我向大家介绍一下参加今天xx乡**多彩贵州宏...
我们结婚了的经典台词 关于我们结婚了的经典台词  1、最喜欢的食物,五花肉。  2、我喜欢幼稚的东西victoria(宋茜...
哈利波特中魔法石经典台词 哈利波特中魔法石经典台词  在当下社会,需要使用台词的场合越来越多,台词起着揭示人物性格,表达思想感...
企业开业主持词 企业开业主持词  主持词是主持人在节目进行过程中用于串联节目的串联词。在当下这个社会中,主持人在各种...
欢送退休职工致辞 欢送退休职工致辞(通用5篇)  在日常学习、工作和生活中,要用到致辞的情况还是蛮多的,致辞要注意人物...
演出节目串词2文 演出节目串词2文(男)尊敬的领导、老师、亲爱的同学们。 (合)大家好。 (女)当鲜红的太阳跃上地平线...
庆祝百岁老人生日的致辞 庆祝百岁老人生日的致辞范文(精选5篇)  在生活、工作和学习中,大家总免不了要接触或使用致辞吧,致辞...
《夏有乔木雅望天堂》的经典台... 《夏有乔木雅望天堂》的经典台词  《夏有乔木雅望天堂》经典台词一  1. 一个等了,却等得太早,一个...
中秋节的主持词 中秋节的主持词  主持人在台上表演的灵魂就表现在主持词中。在当下的中国社会,很多场合都需要主持人活跃...
无间道台词 无间道台词  说好了三年,三年之后又三年,三年之后又三年,都快十年了,老大!  出来跑,迟早要还的。...