各类激活函数
激活函数
为什么要使用激活函数?
激活函数用来怎加非线性因素的,提高模型拟合能力。如果不存在激活函数,神经网络的每一层的输入都是对前面输入的线性变化,就算把网络加到很深也无法去拟合任意函数的。
激活函数具有的特性
虽然我们常用激活函数不是很多,那是否只有这些函数能作为激活函数呢?我们从神经网络的工作过程中看,激活函数具有什么样的性质能够更好的帮助神经网络的训练。
非线性:数,激活函数必须是非线性的。
计算简单:神经元都要经过激活运算的,在随着网络结构越来越庞大、参数量越来越多,激活函数如果计算量小就节约了大量的资源。
f ( x ) ≈ x:在向前传播时,如果参数的初始化是随机量的最小值,神经网络的训练很高效。在训练的时候不会出现输出的幅度随着不断训练发生倍数的增长,是网络更加的稳定,同时也使得梯度更容易回传。
可微:因为神经网络要通过反向传播来跟新参数,如果激活函数不可微,就无法根据损失函数对权重求偏导,也就无法更新权重。传统的激活函数如sigmoid等满足处处可微。对于分段线性函数比如ReLU,只满足几乎处处可微(即仅在有限个点处不可微)。对于SGD算法来说,由于几乎不可能收敛到 ...
各类损失函数
损失函数
损失函数loss function)是用来估量模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项,通常可以表示成如下式子:
损失函数、代价函数、目标函数之间的关系
常见的损失函数
均方差(Mean Squared Error,MSE)
均方差(Mean Squared Error,MSE)损失是机器学习、深度学习回归任务中最常用的一种损失函数,也称为 L2 Loss。其基本形式如下:
可以看到这个实际上就是均方差损失的形式。也就是说在模型输出与真实值的误差服从高斯分布的假设下,最小化均方差损失函数与极大似然估计本质上是一致的,因此在这个假设能被满足的场景中(比如回归),均方差损失是一个很好的损失函数选择;当这个假设没能被满足的场景中(比如分类),均方差损失不是一个好的选择
平均绝对误差损失(Mean Absolute Error Loss,MAE)
平均绝对误差(Mean Abso ...
认识神经网络
神经网络
什么是神经网络
人工神经网络:是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。在工程与学术界也常直接简称为“神经网络”或类神经网络。(百度百科)
神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向–深度学习的基础。
单层神经网络-感知器
两层神经网络-多层感知器
多层神经网络-深度学习
神经网络结构
这是一个包含三个层次的神经网络。红色的是输入层,绿色的是输出层,紫色的是中间层(也叫隐藏层)。输入层有3个输入单元,隐藏层有4个单元,输出层有2个单元。后文中,我们统一使用这种颜色来表达神经网络的结构。
神经网络结构图
1231、设计一个神经网络时,输入层与输出层的节点数往往是固定的,中间层则可以自由指定;2、神经网络结构图中的拓扑与箭头代表着预测过程时数据的流向,跟训练时的数据流有一定的区别;3、结构图里的关键不是圆圈(代表“神经元”),而是连接线(代表“神经元”之间的连接)。每个连接线对应一个不同的权重(其值称为权值),这是需要训练得到的。
除了从左到右的形式表达的结构图,还有一种常见的表达形式是从下到上来表示一个神经网络。这时候,输入层在图的最 ...
感知机
感知机(perceptron)
感知机是什么?
感知机:感知机是神经网络(深度学习)的起源算法,学习感知机的构造是通向神经网络和深度学习的一种重要思想。
感知机接收多个输入信号,输出一个信号。
这里所说的“信号”可以想 象成电流或河流那样具备“流动性”的东西。
像电流流过导线,向前方输送 电子一样,感知机的信号也会形成流,向前方输送信息。
但是,和实际的电 流不同的是,感知机的信号只有“流/不流”(1/0)两种取值。
0 对应“不传递信号”,1对应“传递信号”。
x 1 、x 2 是输入信号,
y 是输出信号,
w 1 、w 2 是权重 (w 是 weight 的首字母)。
图中的○称为“神 经元”或者“节点”。
输入信号被送往神经元时,会被分别乘以固定的权重(w 1 x 1 、w 2 x 2 )。
神经元会计算传送过来的信号的总和,只有当这个总和超过 了某个界限值时,才会输出1。
这也称为“神经元被激活”。这里将这个界限值称为阈值,用符号θ表示。
公式一:
感知机的多个输入信号都有各自固有的权重,这些权重发挥着控制各个 信号的重要性的作用。也就是说,权重越大,对应该权重的信 ...
正则化、离散化、归一化、标准化
正则化(regularization)
正则化的目的
正则化是为了防止过拟合, 进而增强泛化能力。
"泛化"指的是一个假设模型能够应用到新样本的能力。
L1 正则化和 L2 正则化的几何含义
L1 正则化通常称为 Lasso 正则化:
J(θ)=−∑i=1m(y(i)log(hθ(x(i)))+(1−y(i))log(1−hθ(x(i))))+λm∑j=1n∣θj∣J(θ)=−∑i=1m(y(i)log(hθ(x(i)))+(1−y(i))log(1−hθ(x(i))))+λm∑j=1n|θj|
J(θ)=−∑i=1m(y(i)log(hθ(x(i)))+(1−y(i))log(1−hθ(x(i))))+λm∑j=1n∣θj∣
L2 正则化通常称为 Ridge 正则化:
J(θ)=−∑i=1m(y(i)log(hθ(x(i)))+(1−y(i))log(1−hθ(x(i))))+λ2m∑j=1nθj2J(θ)=−∑i=1m(y(i)log(hθ(x(i)))+(1−y(i))log(1−hθ(x(i))))+λ2m∑j=1nθj2
J(θ)=−∑i=1m(y(i) ...
推荐算法概述
1 推荐算法概述
推荐算法是非常古老的,在机器学习还没有兴起的时候就有需求和应用了。概括来说,可以分为以下5种:
基于内容的推荐:这一类一般依赖于自然语言处理NLP的一些知识,通过挖掘文本的TF-IDF特征向量,来得到用户的偏好,进而做推荐。这类推荐算法可以找到用户独特的小众喜好,而且还有较好的解释性。这一类由于需要NLP的基础,本文就不多讲,在后面专门讲NLP的时候再讨论。
协调过滤推荐:本文后面要专门讲的内容。协调过滤是推荐算法中目前最主流的种类,花样繁多,在工业界已经有了很多广泛的应用。它的优点是不需要太多特定领域的知识,可以通过基于统计的机器学习算法来得到较好的推荐效果。最大的优点是工程上容易实现,可以方便应用到产品中。目前绝大多数实际应用的推荐算法都是协同过滤推荐算法。
混合推荐:这个类似我们机器学习中的集成学习,博才众长,通过多个推荐算法的结合,得到一个更好的推荐算法,起到三个臭皮匠顶一个诸葛亮的作用。比如通过建立多个推荐算法的模型,最后用投票法决定最终的推荐结果。混合推荐理论上不会比单一任何一种推荐算法差,但是使用混合推荐,算法复杂度就提高了,在实际应用中有使用,但是并 ...
国赛论文制作笔记
数学建模论文基本构成
首页:
论文题目、摘要、关键词
论文正文
问题重述
问题分析
模型假设
符号说明
模型建立与求解
模型检验/模型改进与推广
模型优缺点评价
参考文献
附录
论文格式
论文题目:黑体3号,居中
摘要标题:黑体4号,居中
摘要内容:宋体,小4号
关键词:黑体小4号
正文一级标题:黑体4号,居中
正文二三级标题:黑体小4号,居左
正文:宋体,小四号
数字、字母:Times Nem Roman
页边距:上下左右2.5厘米
论文页数:正文20页以内
论文首页:题目,摘要,关键词
论文题目:
应尽量涵盖论文研究得主要对象或研究内容,所采用的主要研究方法
简短,精炼,一目了然
独自一行,居中排版
常见方法:
第一种:基于XXX模型/方法/理论的XXX问题研究(一般)
基于一维热传导方程的炉温曲线机理模型研究
基于动态规划,统计分析、静态博弈的穿越沙漠游戏策略设计
第二种:直接对问题进行简化作为题目(大神选择)
穿越沙漠游戏中的玩家行为决策问题
关键词
3-5个,尽可能涵盖
包括五部分内容
研究对象或研究内容
研究目的
主要模型
求解算法
验证方法
12例 ...
数学建模套餐
自己总结的一套数学建模套餐,可以帮助想入门数学建模的小伙伴们。
数学建模套餐
一、相关资源
网站类:
1、全国大学生数学建模竞赛 (mcm.edu.cn)
2、清风建模bilibili
3、【零基础教程】老哥:数学建模算法、编程、写作和获奖指南全流程培训!_哔哩哔哩_bilibili
4、我爱分享网 | 分享知识,收获智慧 (zhanshaoyi.com)(下载软件一个比较好的网站)
5、SPASS(数据分析网站,上面也有一些基础算法的讲解)
6、简书/CSDN/知乎/谷歌(搜索资料类,拒绝百度!!!)
7、维基百科
导航大全(收藏一个顶十个)
1、科塔学术导航 - 最专业、准确、及时和全面的科研与学术资源导航平台 (sciping.com)
2、编程导航 | 专注全网优质编程网址、优质编程学习资源分享。 (24kdh.cn)
3、数字生活指南·社区 (guidebook.top)
4、国家部门导航 (dajiadaohang.com)
5、大数据导航1 (bigdata.ren)
6、大数据工具导航(Hao.199it.com)
7、程序员的工具箱 (tool.lu)
数据收集
1、 ...
Latex数学公式学习
Latex数学公式学习
前言
官方文档(英文):
传送门:官方文档
网址:http://www.ctex.org/documents/packages/math/index.htm
中文文档:
传送门:中文教程
网址:https://www.latexlive.com/help
技巧:使用在线LaTeX公式编辑器,来生成LaTeX公式代码,然后复制到LaTeX编辑器(或Markdown编辑器)中,并在两边加上$或$$即可。
在线LaTeX公式编辑器网址:https://www.latexlive.com/
插入公式
左对齐公式(行中公式):$数学公式$
居中公式(独立公式):$$数学公式$$
注意:使用$行中公式时,数学公式与$连接处不要有空格,否则公式不会显示;使用$$居中公式时,数学公式与$$连接处可以有空格。即$ 数学公式 $ 不显示公式。
注释:%为单行注释。
注意事项
使用$,即行中公式时,数学公式与$连接处不要有空格,否则公式不会显示。即$ 数学公式 $ 不显示公式。
使用$$,即居中公式时,数学公式与$$连接处可以有空格。
使用$$时,上方要空一行。
=不要单独打一 ...
markdown语法
一、markdown简介
markdown 是一种轻量级标记语言,能将文本换成有效的XHTML(或者HTML)文档,它的目标是实现易读易写,成为一种适用于网络的书写语言。Markdown 语法简洁明了,易于掌握,所以用它来写作是件既效率又舒服的事情。
markdown 的理念是,能让文档更容易读、写和随意改。HTML 是一种发布的格式,Markdown 是一种书写的格式。就这样,Markdown 的格式语法只涵盖纯文本可以涵盖的范围。
二、markdown 标题
markdown 支持两种标题的语法,类 Setext 和 类 Atx 形式。
类 Setext 形式是用底线的形式,利用 =(最高价标题)和 -(第二阶标题),例如:
12345This is an H1============This is an H2------------
任何数量的 = 和 - 都可以有效果。效果如下:
This is an H1
This is an H2
类 Atx 形式则是在行首插入1到6个 # ,对应到标题1到6级标题,例如:
123456# 一级标题## 二级标题### 三级标题#### 四 ...