Nauka danych

Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny


2
Jak mogę wykryć, że zdjęcie zostało zrobione w Photoshopie?
Chciałbym sprawdzić pliki JPG, jeśli zostały zmanipulowane w celu zmiany treści. Co uważam za NIE Photoshopped: Uprawa Obracanie (Skalowanie) Rozdzielczość obrazu Automatyczne zmiany mogą wprowadzić smartfony Co uważam za photoshopping: Dodanie nowego obrazu na wierzchu części starego obrazu Zmiana tekstu części obrazu Jak można to automatycznie sprawdzić? (I: Czy są …

4
Czy PCA jest uważany za algorytm uczenia maszynowego
Zrozumiałem, że analiza głównego elementu jest techniką zmniejszania wymiarów, tzn. Biorąc pod uwagę 10 elementów wejściowych, wytworzy mniejszą liczbę niezależnych elementów, które są ortogonalną i liniową transformacją elementów oryginalnych. Jest PCAsamo w sobie uważane za pomocą algorytmu uczenia się czy jest to krok dane wstępne przetwarzanie.

2
Dlaczego warto stosować regularyzację L1 w stosunku do L2?
Prowadząc model regresji liniowej za pomocą funkcji straty, dlaczego powinienem używać zamiast regularyzacji ?L.1L.1L_1L.2)L.2)L_2 Czy lepiej jest zapobiegać przeuczeniu? Czy jest deterministyczny (więc zawsze jest unikalnym rozwiązaniem)? Czy jest lepszy w wyborze funkcji (ponieważ produkuje rzadkie modele)? Czy rozkłada wagi między funkcjami?

3
Czy współrzędne GPS (szerokość i długość geograficzna) mogą być używane jako funkcje w modelu liniowym?
Mam zestawy danych, które zawierają, wśród wielu funkcji, współrzędne GPS (szerokość i długość geograficzna). Chciałbym użyć tych zestawów danych do zbadania problemów, takich jak: (1) obliczanie ETA w celu przejazdu między punktami początkowymi i końcowymi; oraz (2) oszacowanie liczby przestępstw dla określonego punktu. Chciałbym użyć modelu regresji liniowej. Czy mogę …


2
Sortuj liczby, używając tylko 2 ukrytych warstw
Czytam kamień węgielny „ Sekwencja do nauki sekwencji za pomocą sieci neuronowych” Ilyi Sutskever i Quoc Le. Na pierwszej stronie krótko wspomina, że: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic size Czy ktoś może …

1
Czy najbliższy sąsiad ma jakiś sens z t-SNE?
Odpowiedzi tutaj stwierdzają, że wymiary w t-SNE są pozbawione znaczenia , a odległości między punktami nie są miarą podobieństwa . Czy możemy jednak powiedzieć coś o punkcie na podstawie jego najbliższych sąsiadów w przestrzeni t-SNE? Ta odpowiedź na pytanie, dlaczego punkty, które są dokładnie takie same nie są skupione, sugeruje, …
10 tsne 

2
Jak przeprowadzić regresję logistyczną z dużą liczbą funkcji?
Mam zestaw danych z 330 próbkami i 27 funkcjami dla każdej próbki, z problemem klasy binarnej dla regresji logistycznej. Zgodnie z „regułą, jeśli dziesięć” potrzebuję co najmniej 10 zdarzeń, aby każda funkcja mogła zostać uwzględniona. Chociaż mam niezrównoważony zestaw danych, z 20% klasy dodatniej i 80% klasy ujemnej. To daje …



2
Jaka jest macierz funkcji w word2vec?
Jestem początkującym w sieciach neuronowych i obecnie badam model word2vec. Trudno mi jednak zrozumieć, czym dokładnie jest matryca funkcji. Rozumiem, że pierwsza matryca to jeden gorący wektor kodowania dla danego słowa, ale co oznacza druga matryca? Mówiąc dokładniej, co oznacza każda z tych wartości (tj. 17, 24, 1 itd.)?

1
Jak określić złożoność zdania w języku angielskim?
Pracuję nad aplikacją, która pomoże ludziom uczyć się angielskiego jako drugiego języka. Zweryfikowałem, że zdania pomagają w nauce języka, zapewniając dodatkowy kontekst. Zrobiłem to, przeprowadzając małe badanie w klasie 60 uczniów. Wydobrałem z Wikipedii ponad sto tysięcy zdań na różne angielskie słowa (w tym 800 słów Barronsa i 1000 najczęstszych …

1
Unikaj przeładowywania DataFrame między różnymi jądrami Pythona
Czy istnieje sposób na zachowanie zmiennej (dużej tabeli / ramki danych) w pamięci i współdzielenie jej przez wiele notebooków ipython? Szukałbym czegoś, co jest koncepcyjnie podobne do trwałych zmiennych MATLAB. Istnieje możliwość wywołania niestandardowej funkcji / biblioteki z wielu indywidualnych edytorów (notebooków) i uzyskania przez tę funkcję pamięci podręcznej jakiegoś …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.