Nauka danych

7

Kiedy precyzja jest ważniejsza niż przywołanie?

Czy ktoś może podać mi przykłady, w których ważna jest precyzja, oraz przykłady, w których ważne jest przypomnienie?

18 machine-learning evaluation

2

Jaka jest zaleta utrzymywania wielkości partii na poziomie 2?

Dlaczego podczas szkolenia modeli uczenia maszynowego czasami korzystne jest utrzymanie wielkości partii na poziomie 2? Pomyślałem, że najlepiej będzie użyć rozmiaru, który najlepiej pasuje do twojej pamięci / RAM GPU. Ta odpowiedź twierdzi, że dla niektórych pakietów moc 2 jest lepsza jako wielkość partii. Czy ktoś może podać szczegółowe wyjaśnienie …

18 machine-learning training

1

Różnica Keras między utratą wartości a utratą podczas treningu

Jaka jest różnica pomiędzy treningiem w Keras val_lossi losspodczas niego? Na przykład Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 Na niektórych stronach czytałem, że po sprawdzeniu poprawności nie działało.

18 machine-learning deep-learning keras

4

Czy pandy są teraz szybsze niż data.table?

https://github.com/Rdatatable/data.table/wiki/Benchmarks-%3A-Grouping Testy danych data.table nie były aktualizowane od 2014 roku. Słyszałem, że gdzieś Pandasjest teraz szybciej niż data.table. Czy to prawda? Czy ktoś zrobił jakieś testy porównawcze? Nigdy wcześniej nie korzystałem z Pythona, ale rozważałbym zmianę, jeśli pandasmożna pokonać data.table?

18 python r pandas data data.table

3

Czy częstotliwość kliknięć ma znaczenie?

Czy budując pozycję, na przykład dla wyszukiwarki lub systemu rekomendacji, warto polegać na częstotliwości kliknięć, aby określić trafność wpisu?

17 recommender-system information-retrieval

1

Dlaczego ReLU jest lepszy niż inne funkcje aktywacyjne

Tutaj odpowiedź odnosi się do znikania i eksplodowania gradientów, które były sigmoidpodobne do funkcji aktywacyjnych, ale, jak sądzę, Relumają wadę i są to oczekiwana wartość. nie ma ograniczeń dla wyjścia, Reluwięc jego oczekiwana wartość nie jest równa zero. Pamiętam czas, zanim popularność Reluta tanhbyła najbardziej popularna wśród ekspertów w dziedzinie …

17 machine-learning neural-network deep-learning gradient-descent activation-function

3

Co oznacza notacja mAP @ [. 5: .95]?

W przypadku wykrywania powszechnym sposobem ustalenia, czy propozycja jednego obiektu była poprawna, jest Skrzyżowanie przez Unię (IoU, IU). Pobiera zestaw proponowanych pikseli obiektowych i zestaw rzeczywistych pikseli obiektowych B i oblicza:ZAZAAbbB jao U( A , B ) = A ∩ BA ∪ BjaoU(ZA,b)=ZA∩bZA∪bIoU(A, B) = \frac{A \cap B}{A \cup B} …

17 computer-vision

2

Doc2Vec - Jak oznaczyć akapity (gensim)

Zastanawiam się, jak oznaczyć (tagować) zdania / akapity / dokumenty za pomocą doc2vec w gensim - z praktycznego punktu widzenia. Czy musisz mieć każde zdanie / akapit / dokument z własną unikalną etykietą (np. „Wysłane_123”)? Wydaje się to przydatne, jeśli chcesz powiedzieć „jakie słowa lub zdania są najbardziej podobne do …

17 machine-learning text-mining word-embeddings word2vec

3

Bagging vs Dropout w Deep Neural Networks

Bagging to generowanie wielu predyktorów, które działają tak samo, jak jeden predyktor. Dropout jest techniką, która uczy sieci neuronowe uśredniania wszystkich możliwych podsieci. Patrząc na najważniejsze zawody Kaggle, wydaje się, że te dwie techniki są bardzo często używane razem. Nie widzę żadnej teoretycznej różnicy poza faktyczną implementacją. Kto może mi …

17 machine-learning neural-network deep-learning

4

K-oznacza: Jakie są dobre sposoby wyboru skutecznego zestawu początkowych centroidów?

Gdy stosowana jest losowa inicjalizacja centroidów, różne serie K-średnich dają różne całkowite SSE. I ma to kluczowe znaczenie dla wydajności algorytmu. Jakie są skuteczne podejścia do rozwiązania tego problemu? Najnowsze podejścia są mile widziane.

17 data-mining clustering k-means

1

Algorytmy klastrowania tekstu

Mam problem z grupowaniem ogromnej liczby zdań w grupy według ich znaczenia. Jest to podobne do problemu, gdy masz wiele zdań i chcesz je pogrupować według ich znaczenia. Jakie algorytmy są zalecane? Nie wiem z góry liczby klastrów (a ponieważ nadchodzi więcej danych, klastry również mogą się zmieniać), jakie funkcje …

17 clustering text-mining algorithms scikit-learn

4

Dodatkowa warstwa wyjściowa w sieci neuronowej (dziesiętna do binarnej)

Pracuję nad pytaniem z książki online: http://neuralnetworksanddeeplearning.com/chap1.html Rozumiem, że jeśli dodatkowa warstwa wyjściowa składa się z 5 neuronów wyjściowych, prawdopodobnie mogłabym ustawić odchylenie na 0,5 i wagę 0,5 dla każdej poprzedniej warstwy. Ale pytanie wymaga teraz nowej warstwy czterech neuronów wyjściowych - co jest więcej niż wystarczające do przedstawienia 10 …

17 neural-network

3

Najbliżsi sąsiedzi szukają danych o bardzo dużych wymiarach

Mam dużą rzadką macierz użytkowników i przedmiotów, które lubią (rzędu 1 mln użytkowników i 100 000 przedmiotów, z bardzo niskim poziomem rzadkości). Badam sposoby, w jakie mogę na nim przeprowadzić wyszukiwanie kNN. Biorąc pod uwagę rozmiar mojego zbioru danych i niektóre wstępne testy, które przeprowadziłem, zakładam, że metoda, której użyję, …

17 machine-learning distributed map-reduce dimensionality-reduction

6

Czego używasz do generowania pulpitu nawigacyjnego w języku R?

Muszę generować okresowe (dzienne, miesięczne) raporty pulpitu nawigacyjnego analityki internetowej. Będą one statyczne i nie będą wymagały interakcji, więc wyobraź sobie plik PDF jako docelowy wynik. Raporty będą mieszać tabele i wykresy (głównie wykresy przebiegu w czasie i wykresy punktowe utworzone za pomocą ggplot2). Pomyśl o pulpitach nawigacyjnych w stylu …

17 r visualization

2

Jak należy stosować etykę w informatyce?

Ostatnio pojawiła się furia, gdy Facebook przeprowadzał eksperymenty na swoich użytkownikach, aby sprawdzić, czy mogą zmienić emocje użytkownika, a teraz są w porządku . Chociaż nie jestem zawodowym naukowcem danych, czytam o etyce nauki o danych z książki Cathy O'Neill „Doing Data Science” i chciałbym wiedzieć, czy jest to coś, …

17 social-network-analysis