Po prostu dodając to wyjaśnienie, aby każdy, kto przewinie tak dużo w dół, może przynajmniej dobrze to zrobić, ponieważ jest tak wiele błędnych odpowiedzi w głosowaniu.
Diansheng's odpowiedź i JakeJ za odpowiedź zrobić to dobrze.
Nowa odpowiedź opublikowana przez Shital Shah jest jeszcze lepszą i bardziej kompletną odpowiedzią.
Tak, logit
jako matematyka funkcja w statystyce, ale logit
stosowana w kontekście sieci neuronowych jest inna. Statystyka logit
nie ma tu nawet żadnego sensu.
Nigdzie nie mogłem znaleźć formalnej definicji, ale w logit
zasadzie oznacza:
Surowe prognozy, które wychodzą z ostatniej warstwy sieci neuronowej.
1. Jest to tensor, na który nakładaszargmax
funkcję, aby uzyskać przewidywaną klasę.
2. Jest to tensor, który wprowadzasz do softmax
funkcji, aby uzyskać prawdopodobieństwa dla przewidywanych klas.
Ponadto z samouczka na oficjalnej stronie tensorflow:
Warstwa logów
Ostatnią warstwą w naszej sieci neuronowej jest warstwa logów, która zwróci surowe wartości dla naszych prognoz. Tworzymy gęstą warstwę z 10 neuronami (po jednym dla każdej klasy docelowej 0–9), z aktywacją liniową (domyślnie):
logits = tf.layers.dense(inputs=dropout, units=10)
Jeśli nadal jesteś zdezorientowany, sytuacja wygląda następująco:
raw_predictions = neural_net(input_layer)
predicted_class_index_by_raw = argmax(raw_predictions)
probabilities = softmax(raw_predictions)
predicted_class_index_by_prob = argmax(probabilities)
gdzie predicted_class_index_by_raw
i predicted_class_index_by_prob
będą równe.
Inną nazwą raw_predictions
w powyższym kodzie jestlogit
.
Co do dlaczego logit
... nie mam pojęcia. Przepraszam.
[Edycja: patrz tę odpowiedź, aby poznać historyczne motywy tego terminu.]
Drobnostki
Chociaż, jeśli chcesz, możesz zastosować statystyki logit
doprobabilities
które wyjdzie z softmax
funkcji.
Jeśli prawdopodobieństwo pewnej klasy jest p
,
to log-odds dla tej klasy jest L = logit(p)
.
Prawdopodobieństwo tej klasy można również odzyskać za p = sigmoid(L)
pomocąsigmoid
funkcji.
Jednak niezbyt przydatne do obliczania logarytmicznych szans.