主页 > 雾霾

人工智能基础(高中版)-读书笔记

时间:2019-06-17 来源:长空电竞

本书通过案例讲解,将人工智能里面一些常用的技术进行了讲解。

这里的笔记,主要以概念介绍和流程进行表达,方便理解。

1、二分类

前言:二分类是指对两类物体进行分类,对应的有多分类。这里主要从二分类入手理解。二分类分为核心的三步:特征提取,训练分类器,测试分类器;

二分类是传统的的分类模式,更高效的方式是深度神经网络。

分类:根据事物,判断类型,比如图片里面的动物是狼还是牛,音乐是什么类型的等等。解决“是不是,是什么“的问题。

分类器:(广泛定义)能够完成分类任务的人工智能系统,被称为分类器。(本质)一个由特征向量到预测类别的函数


线性分类器:线性分类器中有表示特征向量的维数n,有函数的系数-即分类器的参数。

特征:可以对事物的某些方面的特点进行刻画的数字或者属性,比如辨别鸢尾花品种的特征是花瓣大小(长度和宽度),对于图像识别有方向梯度直方图,对于声音有梅尔频率倒谱系数等等。

特征的质量极大的影响着分类器最终分类效果的好坏。

特征向量:把一个事物的特征数值都组织在一起,这是一个将事物特征的信息用数学进行表达的过程/方法。

向量:多个数字排成一行,比如(1、3、5),里面的数字个数称为向量的维数,这里的例子是一个三维向量。本质:向量是一个数学工具。

特征点:将特征向量放入坐标系中,每个特征向量的点都称为特征点,每个点都代表了一朵鸢尾花(或其他事物)的特征。

特征空间:所有的特征点构成的空间称为特征空间。

相似度:特征点到特征点之间的平面距离可以用来衡量鸢尾之间的相似程度。

训练分类器:(目的)让分类器学习得到合适的参数,(本质)通过大量的数据作为支撑,不断优化分类器参数,进行调参,寻找最佳参数

训练数据和测试数据都是分开的两类数据。这两类数据会进行人工标注(标记事物的真是类别)。

算法:一系列判断和计算的步骤组成的过程,称为算法。不同的算法会得到不同的分类器。算法的设计对分类准确率至关重要。常见的训练线性分类器的算法:感知器、支持向量机。它们提供了利用训练数据自动寻找参数的方法。

感知器:训练线性分类器的算法,核心方法:利用被误分类的训练数据调整现有分类器的参数,使得调整后的分类器判断的更加准确。


感知器学习算法:不断减少对数据误分类的过程

损失函数:在训练过程中用来度量分类器输出错误程度的数学化表示。预测错误程度越大,损失函数值越大。损失函数需要进行合适定义,站在产品角度来说,可以理解为一个指标。

感知器和支持向量机就是基于不同的损失函数建立起来的。

优化:调整分类器的参数,使损失函数最小的过程。

支持向量机:(support vector machine ,SVM)是在特征空间上分类间隔最大的分类器,是对两个类别进行分类。(定义补充)线性支持向量机是支持向量机中的一种。(本书中,若无特殊说明,支持向量机指的就是线性支持向量机。


测试阶段:通过将一批测试数据放入分类器中进行测试得到预测结果(即分类准确率)。预测正确的样本数/测试样本总数=分类准确率。通过多次测试,会出现多个效果,也就有了不同准确率的分类器,最终选择最优分类器,在实际中进行应用。

应用阶段:该阶段的数据是从实际中来的,没有标注过的,并且更为复杂多变。

延伸理解

多分类:可以把这个问题转化为多个二分类问题来处理。但是这里会有一个情况:可能有两个分类器都输出为正的情况(牡丹分类器输出该图片为牡丹,玫瑰分类器输出该图片为玫瑰)。情况解决方法:利用分类器的输出值通过一个归一化指数函数(其实就是把输出值转化为概率:即属于某一类的可能性)

归一化指数函数:(softmax)将一个向量压缩到另一个向量中,使得其中每一个元素在范围(0、1)之间,并且所有的元素和为1(感觉就有点向概率分布的感觉)。意义:不仅可以输出类别,还可以转变为概率,即预测把握是怎样的。可以给予人更多的参考价值。

二分类运行流程:


运用:二分类技术可运用在人脸识别中的人脸检测阶段。

2、图像分类

卷积运算:是一种数学运算,可以对向量,矩阵或三阶张量进行运算。在图像处理中运用广泛,比如:特征提取。意义:从图像中提取边缘特征。

方向梯度直方图(HOG):一种经典的图像特征。意义:使用边缘检测技术和一些统计学方法,可以表示出图像中物体的轮廓,从而区分图像中不同的物体。

方向梯度直方图提取过程:1、用卷积运算提取边缘特征。2、将图片划分为若干区域,对边缘特征按照方向和幅度统计,形成直方图。3、拼接所有区域内的直方图,形成特征向量。

深度神经网络(用于分类的场景下):可以自动从图像中学习有效的特征。将特征提取和分类集成在了一起。


深度神经网络结构:由多个顺序连接的层组成。本质:经过多层的变换,将原始图像变换为高层次的抽象的特征。主要包括:卷积层,ReLU非线性激活层,池化层,全连接层,softmax归一化指数层。

卷积层:可以有多个,功能:对图像进行变换以提取特征。

ReLU非线性激活层:存在于每一个卷积层之后,功能:完成非线性变换。保留每次变换的效果。特点:计算简单,计算速度快,应用效果好。常用非线性函数:逻辑函数,双曲正切函数,线性整流函数。

池化层:功能:降低特征图的分辨率。最终减小对计算量和参数数量的需求。

全连接层:功能:对特征向量进行变换。

归一化指数层:功能:完成多类线性分类器中的归一化指数函数的计算。

卷积神经网络:当一个深度神经网络以卷积层为主体时,称为卷积神经网络。

卷积运算是卷积层中的一种运算方法,卷积层是卷积神经网络中的一部分。

人工神经网络:受到了生物神经网络的启发,

人工神经元是生物神经元的一个数学模型。

训练神经网络,可用反向传播算法来进行(训练手段/方法之一)。

反向传播算法的流程:1、输入一副训练图像,2、经过逐层计算,3、得到预测属于每一类的概率,4、将预测结果与正确结果对比,5、如果预测结果不够好,从最后一层开始,逐层调整参数,最终使得预测结果更好。


深度学习的“深“,在于神经网络的层数的多,更进一步代表着参数的多。

一个模型参数越多,可学习和调整的空间就更大,表达能力就更强。

深度学习的两大助力因素:数据与计算能力

计算能力:硬件资源,大量的计算资源。核心是图像处理器GPU

过拟合:过多的“迎合“训练数据,在大量新数据上表现很差的现象。原因:记住了训练数据中的很多噪声信息。解决方法:全值衰减等正则化来解决。

欠拟合:在训练数据和新数据上的表现都不能让人满意。

参考资料:人工智能基础(高中版)-书籍。

这是19年的第一篇,作为一个开头,今年,也要好好更新啊。


相关阅读