无码国产精品一区二区免费式影视,水蜜桃亚洲一二三四在线

1.訓(xùn)練集&驗(yàn)證集&測試集

訓(xùn)練集：訓(xùn)練數(shù)據(jù)

驗(yàn)證集：驗(yàn)證不同算法（比如利用網(wǎng)格搜索對超參數(shù)進(jìn)行調(diào)整等），檢驗(yàn)?zāi)姆N更有效

測試集：正確評估分類器的性能

正常流程：驗(yàn)證集會記錄每個(gè)時(shí)間戳的參數(shù)，在加載test數(shù)據(jù)前會加載那個(gè)最好的參數(shù)，再來評估。比方說訓(xùn)練完6000個(gè)epoch后，發(fā)現(xiàn)在第3520個(gè)epoch的validation表現(xiàn)最好，測試時(shí)會加載第3520個(gè)epoch的參數(shù)。

import  torch
import  torch.nn as nn
import  torch.nn.functional as F
import  torch.optim as optim
from torchvision import datasets, transforms
#超參數(shù)
batch_size=200
learning_rate=0.01
epochs=10
#獲取訓(xùn)練數(shù)據(jù)
train_db = datasets.MNIST('../data', train=True, download=True,#train=True則得到的是訓(xùn)練集
 transform=transforms.Compose([  #transform進(jìn)行數(shù)據(jù)預(yù)處理
  transforms.ToTensor(),#轉(zhuǎn)成Tensor類型的數(shù)據(jù)
  transforms.Normalize((0.1307,), (0.3081,)) #進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化(減去均值除以方差)
 ]))
#DataLoader把訓(xùn)練數(shù)據(jù)分成多個(gè)小組，此函數(shù)每次拋出一組數(shù)據(jù)。直至把所有的數(shù)據(jù)都拋出。就是做一個(gè)數(shù)據(jù)的初始化
train_loader = torch.utils.data.DataLoader(train_db, batch_size=batch_size, shuffle=True)
#獲取測試數(shù)據(jù)
test_db = datasets.MNIST('../data', train=False,
 transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307,), (0.3081,))
 ]))
test_loader = torch.utils.data.DataLoader(test_db, batch_size=batch_size, shuffle=True)
#將訓(xùn)練集拆分成訓(xùn)練集和驗(yàn)證集
print('train:', len(train_db), 'test:', len(test_db))  #train: 60000 test: 10000
train_db, val_db = torch.utils.data.random_split(train_db, [50000, 10000])
print('db1:', len(train_db), 'db2:', len(val_db))#db1: 50000 db2: 10000
train_loader = torch.utils.data.DataLoader(train_db, batch_size=batch_size, shuffle=True)
val_loader = torch.utils.data.DataLoader(val_db, batch_size=batch_size, shuffle=True)
class MLP(nn.Module):
 def __init__(self):
  super(MLP, self).__init__()
  self.model = nn.Sequential(#定義網(wǎng)絡(luò)的每一層,
nn.Linear(784, 200),
nn.ReLU(inplace=True),
nn.Linear(200, 200),
nn.ReLU(inplace=True),
nn.Linear(200, 10),
nn.ReLU(inplace=True),
  )
 def forward(self, x):
  x = self.model(x)
  return x
net = MLP()
#定義sgd優(yōu)化器,指明優(yōu)化參數(shù)、學(xué)習(xí)率，net.parameters()得到這個(gè)類所定義的網(wǎng)絡(luò)的參數(shù)[[w1,b1,w2,b2,...]
optimizer = optim.SGD(net.parameters(), lr=learning_rate)
criteon = nn.CrossEntropyLoss()
for epoch in range(epochs):
 for batch_idx, (data, target) in enumerate(train_loader):
  data = data.view(-1, 28*28) #將二維的圖片數(shù)據(jù)攤平[樣本數(shù),784]
  logits = net(data) #前向傳播
  loss = criteon(logits, target) #nn.CrossEntropyLoss()自帶Softmax
  optimizer.zero_grad() #梯度信息清空
  loss.backward() #反向傳播獲取梯度
  optimizer.step()#優(yōu)化器更新
  if batch_idx % 100 == 0: #每100個(gè)batch輸出一次信息
print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
 epoch, batch_idx * len(data), len(train_loader.dataset),
  100. * batch_idx / len(train_loader), loss.item()))
 #驗(yàn)證集用來檢測訓(xùn)練是否過擬合
 val_loss = 0
 correct = 0
 for data, target in val_loader:
  data = data.view(-1, 28 * 28)
  logits = net(data)
  val_loss += criteon(logits, target).item()
  pred = logits.data.max(dim=1)[1]
  correct += pred.eq(target.data).sum()
 val_loss /= len(val_loader.dataset)
 print('\nVAL set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
  val_loss, correct, len(val_loader.dataset),
  100. * correct / len(val_loader.dataset)))
#測試集用來評估
test_loss = 0
correct = 0 #correct記錄正確分類的樣本數(shù)
for data, target in test_loader:
 data = data.view(-1, 28 * 28)
 logits = net(data)
 test_loss += criteon(logits, target).item()  #其實(shí)就是criteon(logits, target)的值，標(biāo)量
 pred = logits.data.max(dim=1)[1] #也可以寫成pred=logits.argmax(dim=1)
 correct += pred.eq(target.data).sum()
test_loss /= len(test_loader.dataset)
print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
 test_loss, correct, len(test_loader.dataset),
 100. * correct / len(test_loader.dataset)))

2.正則化

正則化可以解決過擬合問題。

2.1L2范數(shù)（更常用）

在定義優(yōu)化器的時(shí)候設(shè)定weigth_decay，即L2范數(shù)前面的λ參數(shù)。

optimizer = torch.optim.SGD(net.parameters(), lr=learning_rate, weight_decay=0.01)

2.2L1范數(shù)

Pytorch沒有直接可以調(diào)用的方法，實(shí)現(xiàn)如下：

3.動(dòng)量（Momentum）

Adam優(yōu)化器內(nèi)置了momentum，SGD需要手動(dòng)設(shè)置。

optimizer = torch.optim.SGD(model.parameters(), args=lr, momentum=args.momentum, weight_decay=args.weight_decay)

4.學(xué)習(xí)率衰減

torch.optim.lr_scheduler 中提供了基于多種epoch數(shù)目調(diào)整學(xué)習(xí)率的方法。

4.1torch.optim.lr_scheduler.ReduceLROnPlateau：基于測量指標(biāo)對學(xué)習(xí)率進(jìn)行動(dòng)態(tài)的下降

torch.optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.1, patience=10, verbose=False, threshold=0.0001, threshold_mode='rel', cooldown=0, min_lr=0, eps=1e-08)

訓(xùn)練過程中，optimizer會把learning rate 交給scheduler管理，當(dāng)指標(biāo)（比如loss）連續(xù)patience次數(shù)還沒有改進(jìn)時(shí)，需要降低學(xué)習(xí)率，factor為每次下降的比例。

scheduler.step(loss_val)每調(diào)用一次就會監(jiān)聽一次loss_val。

4.2torch.optim.lr_scheduler.StepLR：基于epoch

torch.optim.lr_scheduler.StepLR(optimizer, step_size, gamma=0.1, last_epoch=-1)

當(dāng)epoch每過stop_size時(shí)，學(xué)習(xí)率都變?yōu)槌跏紝W(xué)習(xí)率的gamma倍。

5.提前停止（防止overfitting）

基于經(jīng)驗(yàn)值。

6.Dropout隨機(jī)失活

遍歷每一層，設(shè)置消除神經(jīng)網(wǎng)絡(luò)中的節(jié)點(diǎn)概率，得到精簡后的一個(gè)樣本。

torch.nn.Dropout(p=dropout_prob)

p表示的示的是刪除節(jié)點(diǎn)數(shù)的比例（Tip：tensorflow中keep_prob表示保留節(jié)點(diǎn)數(shù)的比例，不要混淆）

測試階段無需使用dropout，所以在train之前執(zhí)行net_dropped.train()相當(dāng)于啟用dropout，測試之前執(zhí)行net_dropped.eval()相當(dāng)于不啟用dropout。

以上為個(gè)人經(jīng)驗(yàn)，希望能給大家一個(gè)參考，也希望大家多多支持本站。

美國服務(wù)器租用

版權(quán)聲明：本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有，歡迎引用、轉(zhuǎn)載，請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站，禁止在非maisonbaluchon.cn所屬的服務(wù)器上建立鏡像，否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來，僅供學(xué)習(xí)參考，不代表本站立場，如有內(nèi)容涉嫌侵權(quán)，請聯(lián)系alex-e#qq.com處理。

排名優(yōu)化：網(wǎng)站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內(nèi)容優(yōu)化：關(guān)鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網(wǎng)站轉(zhuǎn)化率究竟是什么，有什么提升的技巧

一下吧：外貿(mào)站優(yōu)化有哪些基本的做法和注意事項(xiàng)

概要：競價(jià)推廣費(fèi)用大概要多少呢，競價(jià)推廣好不好

一下吧：SEO中site是什么意思，作用和應(yīng)用是怎樣的

郵箱：付費(fèi)郵箱有哪些優(yōu)勢，付費(fèi)郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢呢