pytorch機(jī)器學(xué)習(xí)softmax回歸的簡潔實(shí)現(xiàn)
通過深度學(xué)習(xí)框架的高級API也能更方便地實(shí)現(xiàn)分類模型。讓我們繼續(xù)使用Fashion-MNIST數(shù)據(jù)集,并保持批量大小為256。
import torch from torch import nn from d2l import torch as d2l
batch_size = 256 train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
初始化模型參數(shù)
由于sofrmax回歸的輸出層是一個(gè)全連接層,因此,為了實(shí)現(xiàn)我們的模型,我們只需在Sequential中添加一個(gè)帶有10個(gè)輸出的全連接層。同樣,在這里,Sequential并不是必要的,但我們可能會形成這種習(xí)慣。因?yàn)樵趯?shí)現(xiàn)深度模型時(shí),Sequential將無處不在。我們?nèi)匀灰跃?和標(biāo)準(zhǔn)差0.01隨機(jī)初始化權(quán)重。
# PyTorch不會隱式地調(diào)整輸入的形狀。因此,我們在線性層前定義了展平層(flatten),來調(diào)整網(wǎng)絡(luò)輸入的形狀 net = nn.Sequential(nn.Flatten(), nn.Linear(784, 10)) def init_weights(m): if type(m) == nn.Linear: nn.init.normal_(m.weight, std=0.01) net.apply(init_weights)
重新審視softmax的實(shí)現(xiàn)
在前面的例子中,我們計(jì)算了模型的輸出,然后將此輸出送入交叉熵?fù)p失。從數(shù)學(xué)上講,這是一件完全合理的事情。然而,從計(jì)算角度來看,指數(shù)可能會造成數(shù)值穩(wěn)定性的問題,包括上溢和下溢。
我們也希望保留傳統(tǒng)的softmax函數(shù),以備我們需要評估通過模型輸出的概率。但是,我們沒有將softmax概率傳遞到損失函數(shù)中,而是在交叉熵?fù)p失函數(shù)中傳遞未歸一化的預(yù)測,并同時(shí)計(jì)算softmax及其對數(shù)。
loss = nn.CrossEntropyLoss()
優(yōu)化算法
在這里,我們使用學(xué)習(xí)率為0.1的小批量隨機(jī)梯度下降作為優(yōu)化算法。這與我們在線性回歸例子中的相同,這說明了優(yōu)化器的普適性。
trainer = torch.optim.SGD(net.parameters(), lr=0.1)

以上就是pytorch機(jī)器學(xué)習(xí)softmax回歸的簡潔實(shí)現(xiàn)的詳細(xì)內(nèi)容,更多關(guān)于pytorch機(jī)器學(xué)習(xí)softmax回歸的資料請關(guān)注本站其它相關(guān)文章!
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非maisonbaluchon.cn所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。
關(guān)注官方微信