W przypadku pytań dotyczących klasyfikacji obrazu: problem decyzyjny, w którym algorytm musi zdecydować, do której klasy („kot”, „krzesło”, „drzewo”) należy obraz wejściowy.
Chciałbym użyć sieci neuronowej do klasyfikacji obrazów. Zacznę od wstępnie przeszkolonego CaffeNet i wyszkolę go do mojej aplikacji. Jak przygotować obrazy wejściowe? W tym przypadku wszystkie obrazy są tego samego obiektu, ale z różnymi odmianami (pomyśl: kontrola jakości). Są w nieco różnych skalach / rozdzielczościach / odległościach / warunkach oświetleniowych …
W przetwarzaniu obrazów medycznych większość opublikowanych prac stara się zmniejszyć współczynnik fałszywie dodatnich wyników (FPR), podczas gdy w rzeczywistości fałszywe negatywy są bardziej niebezpieczne niż fałszywie pozytywne. Jakie jest uzasadnienie tego?
Papier Idąc głębiej ze zwojów opisuje GoogleNet który zawiera oryginalne moduły powstania: Zmiana na początek v2 polegała na tym, że zastąpiły one splot 5x5 dwoma kolejnymi splotami 3x3 i zastosowały pule: Jaka jest różnica między Inception v2 a Inception v3?
Jeśli spojrzę na jedno z wielu źródeł klas Imagenet w Internecie, nie mogę znaleźć żadnej klasy związanej z ludźmi (i nie, żniwiarz nie jest kimś, kto zbiera, ale to, co znałem jako długie nogi tatusia, rodzaj pająk :-). Jak to możliwe? Chciałbym mieć co najmniej spodziewali się personlekcje, a nawet …
Chcę trenować CNN w zakresie rozpoznawania obrazów. Obrazy do treningu nie mają ustalonego rozmiaru. Chcę na przykład, aby rozmiar wejściowy dla CNN wynosił 50 x 100 (wysokość x szerokość). Kiedy zmieniam rozmiar niewielkich obrazów (na przykład 32x32) do rozmiaru wejściowego, zawartość obrazu jest zbyt mocno rozciągana w poziomie, ale w …
Większość zaawansowanych modeli głębokiego uczenia, takich jak VGG, ResNet itp., Wymaga kwadratowych obrazów jako danych wejściowych, zwykle o rozmiarze piksela x .224 x 224224x224224x224 Czy istnieje powód, dla którego dane wejściowe muszą być w jednakowym kształcie, czy też mogę zbudować model konwekcyjny z powiedzmy (jeśli chcę na przykład rozpoznać twarz …
Rozpoczynam projekt, w którym zadaniem jest identyfikacja typów tenisówek na podstawie zdjęć. Obecnie czytam implementacje TensorFlow i Torch . Moje pytanie brzmi: ile zdjęć na klasę jest wymaganych, aby osiągnąć rozsądną klasyfikację?
Czy istnieją jakieś praktyczne zasady (lub rzeczywiste zasady) dotyczące minimalnej, maksymalnej i „rozsądnej” liczby komórek LSTM, których powinienem użyć? W szczególności odnoszę się do BasicLSTMCell z TensorFlow i num_unitswłasności. Załóżmy, że mam problem z klasyfikacją zdefiniowany przez: t - number of time steps n - length of input vector in …
Prototypuję aplikację i potrzebuję modelu językowego, aby obliczyć zakłopotanie w przypadku niektórych wygenerowanych zdań. Czy istnieje jakiś wyuczony model języka w Pythonie, którego można łatwo używać? Coś prostego jak model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < …
Miałem interesującą dyskusję na podstawie projektu, nad którym pracowaliśmy: po co używać systemu kontroli wizualnej CNN zamiast algorytmu dopasowywania szablonów? Tło: Pokazałem demo prostego systemu wizyjnego CNN (kamera internetowa + laptop), który wykrył, czy określony typ obiektu został „uszkodzony” / uszkodzony, czy nie - w tym przypadku płytka drukowana PCB. …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.