Pytania otagowane jako pytorch

PyTorch to platforma do głębokiego uczenia, która implementuje dynamiczny wykres obliczeniowy, który umożliwia zmianę sposobu, w jaki zachowuje się sieć neuronowa w locie i umożliwia wykonywanie wstecznego automatycznego różnicowania.

8
Jak działa metoda „przeglądania” w PyTorch?
Nie jestem pewien co do tej metody view()w poniższym fragmencie kodu. class Net(nn.Module): def __init__(self): super(Net, self).__init__() self.conv1 = nn.Conv2d(3, 6, 5) self.pool = nn.MaxPool2d(2,2) self.conv2 = nn.Conv2d(6, 16, 5) self.fc1 = nn.Linear(16*5*5, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) def forward(self, x): x = self.pool(F.relu(self.conv1(x))) x = …
205 python  memory  pytorch  torch  tensor 

5
Najlepszy sposób na zapisanie wytrenowanego modelu w PyTorch?
Szukałem alternatywnych sposobów zapisania wytrenowanego modelu w PyTorch. Jak dotąd znalazłem dwie alternatywy. torch.save (), aby zapisać model i torch.load (), aby załadować model. model.state_dict (), aby zapisać wytrenowany model i model.load_state_dict (), aby załadować zapisany model. Natknąłem się na tę dyskusję, w której podejście 2 jest zalecane zamiast podejścia …


11
Podsumowanie modelu w pytorchu
Czy jest jakiś sposób, żebym mógł wydrukować podsumowanie modelu w PyTorch, podobnie jak model.summary()metoda w Kerasie w następujący sposób? Model Summary: ____________________________________________________________________________________________________ Layer (type) Output Shape Param # Connected to ==================================================================================================== input_1 (InputLayer) (None, 1, 15, 27) 0 ____________________________________________________________________________________________________ convolution2d_1 (Convolution2D) (None, 8, 15, 27) 872 input_1[0][0] ____________________________________________________________________________________________________ maxpooling2d_1 (MaxPooling2D) …
126 python  pytorch 



4
Pytorch, jakie są argumenty gradientowe
Czytam dokumentację PyTorch i znalazłem przykład, na którym piszą gradients = torch.FloatTensor([0.1, 1.0, 0.0001]) y.backward(gradients) print(x.grad) gdzie x było początkową zmienną, z której skonstruowano y (3-wektor). Pytanie brzmi, jakie są argumenty 0,1, 1,0 i 0,0001 tensora gradientu? Dokumentacja nie jest w tym zbyt jasna.

5
dlaczego „pakujemy” sekwencje w pytorch?
Próbowałem powtórzyć Jak używać pakowania dla danych wejściowych sekwencji o zmiennej długości dla rnn, ale myślę, że najpierw muszę zrozumieć, dlaczego musimy „spakować” sekwencję. Rozumiem, dlaczego musimy je „wypełniać”, ale dlaczego konieczne jest „pakowanie” (przez pack_padded_sequence)? Wszelkie wyjaśnienia na wysokim poziomie będą mile widziane!

3
Jaka jest różnica między zmianą kształtu a widokiem w pytorchu?
W numpy używamy ndarray.reshape()do przekształcania tablicy. Zauważyłem, że w pytorchu ludzie używają torch.view(...)do tego samego celu, ale jednocześnie jest też taki torch.reshape(...)istniejący. Zastanawiam się więc, jakie są między nimi różnice i kiedy powinienem użyć któregokolwiek z nich?
93 pytorch 

6
PyTorch - ciągły ()
Przeglądałem ten przykład modelu języka LSTM na github (link) . Ogólnie rzecz biorąc, jest dla mnie całkiem jasne. Ale wciąż staram się zrozumieć, co contiguous()robi wywołanie , co występuje kilka razy w kodzie. Na przykład w linii 74/75 kodu wejściowego i sekwencji docelowej LSTM są tworzone. Dane (przechowywane w ids) …

2
W jaki sposób parametry w modelu pytorch nie są listkami i znajdują się na wykresie obliczeniowym?
Próbuję zaktualizować / zmienić parametry modelu sieci neuronowej, a następnie przekazać do przodu zaktualizowaną sieć neuronową na wykresie obliczeniowym (bez względu na to, ile zmian / aktualizacji dokonamy). Wypróbowałem ten pomysł, ale za każdym razem, gdy to robię, pytorch ustawia moje zaktualizowane tensory (wewnątrz modelu) na liście, co zabija przepływ …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.