深度学习（十一）——神经网络：线形层及其他层介绍

深度,学习,十一,神经网络,线形,其他,介绍 · 浏览次数 : 203

小编点评

**正则化层** 正则化层是神经网络中的一种技术，可以用于降低模型的过拟合性。正则化的主要作用是降低模型的误差，使其更稳定。 **其他层** * **Recurrent Layers（循环层）**用于处理具有序列结构的数据，如自然语言处理中的词序。 * **Transformer Layers**用于处理所有类型的序列数据，包括自然语言处理、音频处理和图像处理。 * **Linear Layers**用于线性运算，用于模型的权重和偏置。 * **Dropout Layers**用于在训练过程中随机删除一些输入数据，以防止过拟合。 * **Sparse Layers**用于在训练过程中创建稀疏矩阵。 * **Distance Functions**用于计算两个值之间的误差。 * **Loss Function**用于计算模型的误差。

正文

一、正则化层中nn.BatchNorm2d简介

主要作用：对输入函数采用正则化。正则化的主要作用是加快神经网络的训练速度。

class torch.nn.BatchNorm2d(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True, device=None, dtype=None)
复制

输入参数：

num_features: 形状为\((N, C, H, W)\)
其他参数默认即可

举例：

# With Learnable Parameters
m = nn.BatchNorm2d(100)
# Without Learnable Parameters
m = nn.BatchNorm2d(100, affine=False)
input = torch.randn(20, 100, 35, 45)
output = m(input)
复制

该函数用得不多

二、其他层简介

1. Recurrent Layers（Recurrent层）

内含RNN、LSTM等函数，主要在nlp领域用的比较多

官方文档： Recurrent Layers

2. Transformer Layers

3. Linear Layers(线性层)

nn.Linear

class torch.nn.Linear(in_features, out_features, bias=True, device=None, dtype=None
复制

（1）参数介绍及计算方法

参数介绍：

in_features
out_features
bias(bool)

线性层具体参数解释如下图：

\(in\_features=d\)，即指的是in_features的个数
\(out\_features=L\)，即指的是out_features的个数

计算\(g\)的方法（以上图\(g_1\)为例）：

\(x_1,\dots,x_i,\dots,x_d\)每个指向\(g_1\)的箭头上，均有：

\[k_i*x_i+b_i \]

其中，\(b_i\)代表偏置，参数\(bias=True\)，则加上\(b\)；\(bias=False\)，则不加\(b\)
在每次训练神经网络的过程中，均会调整\(k_i\)、\(b_i\)的值，直到它变成一个合适的数值
由此可得：

\[g_1=\sum^{d}_{i=1}{k_ix_i+b_i} \]

（2）代码示例

以典型的VGG16 Model网络结构为例：

因此，设置in_features=4096; out_feature=1000

下面代码以一个尺寸为n×n的图像为例，先将图像展开成一行，即1×\(n^2\)的尺寸。最后将1×\(n^2\)尺寸的图像通过线性层，转化为1×10尺寸的图像。

import torch
import torchvision
from torch.utils.data import DataLoader
from torch import nn
from torch.nn import Linear

dataset=torchvision.datasets.CIFAR10("./dataset",train=False,download=True,transform=torchvision.transforms.ToTensor())
dataloder=DataLoader(dataset,batch_size=64)

# for data in dataloder:
#     imgs,targets = data
#     #print(imgs.shape)   #[Run] torch.Size([64, 3, 32, 32])
#
#     #我们的目标是把图像尺寸变成1×1×1×根据前面计算得出的数,下面进行转换
#     output=torch.reshape(imgs,(1,1,1,-1))
#     #print(output.shape)  #[Run] torch.Size([1, 1, 1, 196608])

#根据上面output得出的196608尺寸数据，构造神经网络结构
class Demo(nn.Module):
    def __init__(self):
        super(Demo,self).__init__()
        self.linear1=Linear(in_features=196608,out_features=10)

    def forward(self,input):
        output=self.linear1(input)
        return output

#调用神经网络
demo=Demo()

for data in dataloder:
    imgs,targets=data
    output=torch.reshape(imgs,(1,1,1,-1))

    output=demo.forward(output)
    print(output.shape)  #[Run] torch.Size([1, 1, 1, 10])
复制

由此，成功将1×1×1×196608尺寸的图像转化为1×1×1×10尺寸的图像

注意：

可以用torch.flatten() 函数将图像展开成一行，即替换第33行的代码output=torch.reshape(imgs,(1,1,1,-1))，为：

output=torch.flatten(imgs)
# print(output.shape)  #[Run] torch.Size([196608])
复制

torch.flatten() 和torch.reshape() 的区别：
- torch.flatten更方便，可以直接把图像变成一行
- torch.reshape功能更强大，可任意指定图像尺寸

4. Dropout Layers

主要作用：在训练的过程中随机把一些input（输入的tensor数据类型）变成0。变成0的概率由\(p\)决定

class torch.nn.Dropout(p=0.5, inplace=False)
复制

变成0的主要原因是防止过拟合

5. Sparse Layers

nn.Embedding

主要用于自然语言处理中

class torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None,
      max_norm=None, norm_type=2.0, scale_grad_by_freq=False, sparse=False,
      _weight=None, _freeze=False, device=None, dtype=None)
复制

6.Distance Functions

主要作用：计算两个值之间的误差，并指定误差的衡量标准

7. Loss Function

主要作用：计算Loss的误差大小

三、调用pytorch中的网络模型

现在我们已经学会如何自己搭建神经网络模型了，下面介绍pytorch中神经网络模型的调用方法。根据官方文档，我们可以调用自己需要的网络结构，而不需要自己写代码

1.图像方面的网络结构

官网文档：Models and pre-trained weights — Torchvision 0.15 documentation

2.语音方面的网络结构

官方文档：torchaudio.models — Torchaudio 2.0.1 documentation

深度学习（十一）——神经网络：线形层及其他层介绍

小编点评

正文

一、正则化层中nn.BatchNorm2d简介

二、其他层简介

1. Recurrent Layers（Recurrent层）

2. Transformer Layers

3. Linear Layers(线性层)

nn.Linear

（1）参数介绍及计算方法

（2）代码示例

4. Dropout Layers

5. Sparse Layers

nn.Embedding

6.Distance Functions

7. Loss Function

三、调用pytorch中的网络模型

与深度学习（十一）——神经网络：线形层及其他层介绍相似的内容：

深度学习（十一）——神经网络：线形层及其他层介绍

深度学习（十二）——神经网络：搭建小实战和Sequential的使用

深度学习（十）——神经网络：非线性激活

深度学习（十四）——优化器

深度学习（十三）——损失函数与反向传播

salesforce零基础学习（一百二十八）Durable Id获取以及相关概念浅入浅出

Python学习之十八_django的学习(二)

深度学习论文翻译解析（二十三）：Segment Angthing

深度学习论文翻译解析（二十二）：Uniformed Students Student-Teacher Anomaly Detection With Discriminative Latent Embbeddings

深度学习项目-MobileNetV2水果识别模型

# 热门排行