Nauka danych

3

Studiuję skalowanie danych, aw szczególności metodę standaryzacji. Zrozumiałem matematykę, która się za tym kryje, ale nie jest dla mnie jasne, dlaczego ważne jest, aby nadać funkcjom zerową średnią i wariancję jednostkową. Możesz mi wytłumaczyć ?

10 machine-learning feature-scaling normalization

2

Jak mogę wykryć, że zdjęcie zostało zrobione w Photoshopie?

Chciałbym sprawdzić pliki JPG, jeśli zostały zmanipulowane w celu zmiany treści. Co uważam za NIE Photoshopped: Uprawa Obracanie (Skalowanie) Rozdzielczość obrazu Automatyczne zmiany mogą wprowadzić smartfony Co uważam za photoshopping: Dodanie nowego obrazu na wierzchu części starego obrazu Zmiana tekstu części obrazu Jak można to automatycznie sprawdzić? (I: Czy są …

10 computer-vision

4

Czy PCA jest uważany za algorytm uczenia maszynowego

Zrozumiałem, że analiza głównego elementu jest techniką zmniejszania wymiarów, tzn. Biorąc pod uwagę 10 elementów wejściowych, wytworzy mniejszą liczbę niezależnych elementów, które są ortogonalną i liniową transformacją elementów oryginalnych. Jest PCAsamo w sobie uważane za pomocą algorytmu uczenia się czy jest to krok dane wstępne przetwarzanie.

10 machine-learning pca

2

Dlaczego warto stosować regularyzację L1 w stosunku do L2?

Prowadząc model regresji liniowej za pomocą funkcji straty, dlaczego powinienem używać zamiast regularyzacji ?L.1L.1L_1L.2)L.2)L_2 Czy lepiej jest zapobiegać przeuczeniu? Czy jest deterministyczny (więc zawsze jest unikalnym rozwiązaniem)? Czy jest lepszy w wyborze funkcji (ponieważ produkuje rzadkie modele)? Czy rozkłada wagi między funkcjami?

10 linear-regression regularization

3

Czy współrzędne GPS (szerokość i długość geograficzna) mogą być używane jako funkcje w modelu liniowym?

Mam zestawy danych, które zawierają, wśród wielu funkcji, współrzędne GPS (szerokość i długość geograficzna). Chciałbym użyć tych zestawów danych do zbadania problemów, takich jak: (1) obliczanie ETA w celu przejazdu między punktami początkowymi i końcowymi; oraz (2) oszacowanie liczby przestępstw dla określonego punktu. Chciałbym użyć modelu regresji liniowej. Czy mogę …

10 machine-learning feature-selection linear-regression feature-extraction geospatial

2

Czy możliwe jest użycie wielu „Softmax” w ostatniej warstwie?

Czy jest możliwe zaimplementowanie wielu softmaxów w ostatniej warstwie w Keras? Tak więc suma węzłów 1-4 = 1; 5-8 = 1; itp. Czy powinienem wybrać inny projekt sieci?

10 machine-learning keras multiclass-classification

2

Sortuj liczby, używając tylko 2 ukrytych warstw

Czytam kamień węgielny „ Sekwencja do nauki sekwencji za pomocą sieci neuronowych” Ilyi Sutskever i Quoc Le. Na pierwszej stronie krótko wspomina, że: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic size Czy ktoś może …

10 deep-learning

1

Czy najbliższy sąsiad ma jakiś sens z t-SNE?

Odpowiedzi tutaj stwierdzają, że wymiary w t-SNE są pozbawione znaczenia , a odległości między punktami nie są miarą podobieństwa . Czy możemy jednak powiedzieć coś o punkcie na podstawie jego najbliższych sąsiadów w przestrzeni t-SNE? Ta odpowiedź na pytanie, dlaczego punkty, które są dokładnie takie same nie są skupione, sugeruje, …

10 tsne

2

Jak przeprowadzić regresję logistyczną z dużą liczbą funkcji?

Mam zestaw danych z 330 próbkami i 27 funkcjami dla każdej próbki, z problemem klasy binarnej dla regresji logistycznej. Zgodnie z „regułą, jeśli dziesięć” potrzebuję co najmniej 10 zdarzeń, aby każda funkcja mogła zostać uwzględniona. Chociaż mam niezrównoważony zestaw danych, z 20% klasy dodatniej i 80% klasy ujemnej. To daje …

10 machine-learning python predictive-modeling logistic-regression data

4

Dlaczego przyspiesza opadanie gradientu, jeśli funkcja jest płynna?

Przeczytałem teraz książkę zatytułowaną „Praktyczne uczenie maszynowe za pomocą Scikit-Learn i TensorFlow”, a na rozdziale 11 znajduje się następujący opis objaśnienia ELU (wykładniczej ReLU). Po trzecie, funkcja jest płynna wszędzie, w tym wokół z = 0, co pomaga przyspieszyć opadanie gradientu, ponieważ nie odbija się tak bardzo w lewo i …

10 deep-learning gradient-descent

3

Znajdź kolejne zera w DataFrame i wykonaj zamianę warunkową

Mam taki zestaw danych: Przykładowa ramka danych import pandas as pd df = pd.DataFrame({ 'names': ['A','B','C','D','E','F','G','H','I','J','K','L'], 'col1': [0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0], 'col2': [0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0]}) Chciałbym zastąpić część 0jest w col1i col2z 1jest, …

10 python pandas dataframe

2

Jaka jest macierz funkcji w word2vec?

Jestem początkującym w sieciach neuronowych i obecnie badam model word2vec. Trudno mi jednak zrozumieć, czym dokładnie jest matryca funkcji. Rozumiem, że pierwsza matryca to jeden gorący wektor kodowania dla danego słowa, ale co oznacza druga matryca? Mówiąc dokładniej, co oznacza każda z tych wartości (tj. 17, 24, 1 itd.)?

10 machine-learning neural-network word2vec

1

Jak określić złożoność zdania w języku angielskim?

Pracuję nad aplikacją, która pomoże ludziom uczyć się angielskiego jako drugiego języka. Zweryfikowałem, że zdania pomagają w nauce języka, zapewniając dodatkowy kontekst. Zrobiłem to, przeprowadzając małe badanie w klasie 60 uczniów. Wydobrałem z Wikipedii ponad sto tysięcy zdań na różne angielskie słowa (w tym 800 słów Barronsa i 1000 najczęstszych …

10 machine-learning classification nlp text-mining

1

Unikaj przeładowywania DataFrame między różnymi jądrami Pythona

Czy istnieje sposób na zachowanie zmiennej (dużej tabeli / ramki danych) w pamięci i współdzielenie jej przez wiele notebooków ipython? Szukałbym czegoś, co jest koncepcyjnie podobne do trwałych zmiennych MATLAB. Istnieje możliwość wywołania niestandardowej funkcji / biblioteki z wielu indywidualnych edytorów (notebooków) i uzyskania przez tę funkcję pamięci podręcznej jakiegoś …

10 python bigdata matlab jupyter ipython

1

Dlaczego TensorFlow nie może pasować do prostego modelu liniowego, skoro minimalizuję średni błąd bezwzględny zamiast błędu średniego kwadratu?

We wstępie właśnie się zmieniłem loss = tf.reduce_mean(tf.square(y - y_data)) do loss = tf.reduce_mean(tf.abs(y - y_data)) i model nie jest w stanie dowiedzieć się, że strata z czasem stała się większa. Dlaczego?

10 neural-network deep-learning tensorflow