Nauka danych

4

Jakiego modelu statystycznego powinienem użyć do analizy prawdopodobieństwa, że pojedyncze zdarzenie wpłynęło na dane podłużne

Próbuję znaleźć formułę, metodę lub model do zastosowania w celu analizy prawdopodobieństwa, że określone zdarzenie wpłynęło na niektóre dane podłużne. Z trudem zastanawiam się, czego szukać w Google. Oto przykładowy scenariusz: Wyobraź sobie, że jesteś właścicielem firmy, która codziennie odwiedza średnio 100 klientów. Pewnego dnia decydujesz, że chcesz zwiększyć liczbę …

19 machine-learning data-mining statistics

2

Dlaczego ReLU jest używane jako funkcja aktywacji?

Funkcje aktywacyjne służą do wprowadzenia nieliniowości w liniowym wyjściu typu w * x + bw sieci neuronowej. Które jestem w stanie zrozumieć intuicyjnie dla funkcji aktywacyjnych takich jak sigmoid. Rozumiem zalety ReLU, które pozwala uniknąć martwych neuronów podczas propagacji wstecznej. Jednak nie jestem w stanie zrozumieć, dlaczego ReLU jest używane …

19 machine-learning neural-network deep-learning activation-function

1

Sposoby radzenia sobie z funkcją długości / szerokości geograficznej [zamknięte]

Zamknięte . To pytanie wymaga szczegółów lub jasności . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Dodaj szczegóły i wyjaśnij problem, edytując ten post . Zamknięte 3 lata temu . Pracuję nad fikcyjnym zestawem danych z 25 funkcjami. Dwie cechy to szerokość i długość geograficzna miejsca, a inne to …

19 machine-learning python feature-engineering feature-scaling normalization

1

Co to jest „powtórka z doświadczenia” i jakie są jej zalety?

Czytam gazetę Google DeepMind Atari i staram się zrozumieć pojęcie „powtórki z doświadczenia”. Powtórka z doświadczenia pojawia się w wielu innych dokumentach do nauki o wzmocnieniu (szczególnie w AlphaGo), więc chcę zrozumieć, jak to działa. Poniżej znajdują się niektóre fragmenty. Po pierwsze, użyliśmy inspirowanego biologicznie mechanizmu zwanego odtwarzaniem doświadczeń, który …

19 reinforcement-learning q-learning

4

Co oznacza „Liczba jednostek w komórce LSTM”?

Z kodu Tensorflow : Tensorflow. RnnCell. num_units: int, The number of units in the LSTM cell. Nie mogę zrozumieć, co to oznacza. Jakie są jednostki komórki LSTM. Bramy wejściowe, wyjściowe i zapomnienia? Czy to oznacza „liczbę jednostek w rekurencyjnej warstwie projekcyjnej dla Deep LSTM”. Dlaczego więc nazywa się to „liczbą …

19 neural-network tensorflow rnn

4

Jak uzupełnić brakującą wartość na podstawie innych kolumn w ramce danych Pandas?

Załóżmy, że mam ramkę danych 5 * 3, w której trzecia kolumna zawiera brakującą wartość 1 2 3 4 5 NaN 7 8 9 3 2 NaN 5 6 NaN Mam nadzieję wygenerować wartość dla reguły opartej na brakujących wartościach dla pierwszej kolumny w drugim produkcie 1 2 3 4 …

19 pandas

3

Zestaw danych do rozpoznawania nazwanych jednostek w tekście nieformalnym

Obecnie szukam zestawów danych z etykietami, aby trenować model wyodrębniania nazwanych elementów z nieformalnego tekstu (coś podobnego do tweetów). Ponieważ w dokumentach w moim zestawie danych często brakuje wielkich liter i gramatyki, szukam danych poza domeną, które są nieco bardziej „nieformalne” niż artykuły prasowe i wpisy do dziennika, że wiele …

18 dataset nlp

3

Jak zwiększyć rozwój algorytmu?

Pracując nad eksploracyjną analizą danych i opracowując algorytmy, stwierdzam, że większość mojego czasu spędzam na cyklu wizualizacji, pisania kodu, uruchamiania na małym zbiorze danych, powtarzania. Dane, które posiadam, są zwykle typu wizji komputerowej / fuzji czujników, a algorytmy są ciężkie dla wzroku (na przykład wykrywanie i śledzenie obiektów itp.), A …

18 algorithms

4

Jak dodawać adnotacje do dokumentów tekstowych za pomocą metadanych?

Mając wiele dokumentów tekstowych (w języku naturalnym, nieuporządkowanym), jakie są możliwe sposoby przypisywania im niektórych semantycznych metadanych? Rozważmy na przykład krótki dokument: I saw the company's manager last day. Aby móc z niej wyodrębnić informacje, muszą być opatrzone adnotacjami dodatkowymi danymi, aby były mniej niejednoznaczne. Proces wyszukiwania takich metadanych nie …

18 nlp metadata data-cleaning text-mining

1

Jakie są zalety i wady Keras i TFLearn?

Jakie są zalety i wady Keras i TFlearn ? Kiedy jedna biblioteka jest preferowana od drugiej?

18 machine-learning keras tflearn

1

Word2Vec vs. Sentence2Vec vs. Doc2Vec

Niedawno natknąłem się na terminy Word2Vec , Sentence2Vec i Doc2Vec i trochę zdezorientowany, ponieważ jestem nowy w semantyce wektorowej. Czy ktoś może wyjaśnić różnice w tych metodach prostymi słowami. Jakie są najbardziej odpowiednie zadania dla każdej metody?

18 machine-learning data-mining clustering nlp unsupervised-learning

1

Jak radzić sobie z etykietami ciągów w klasyfikacji wielu klas za pomocą keras?

Jestem początkującym w uczeniu maszynowym i keras, a teraz pracuję nad problemem klasyfikacji klas obrazów za pomocą keras. Wejście jest oznaczone obrazem. Po wstępnym przetworzeniu dane szkoleniowe są reprezentowane na liście Python jako: [["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]] „pies”, „kot” i „ptak” to oznaczenia klasy. Wydaje mi się, że w …

18 machine-learning scikit-learn tensorflow keras encoding

4

Kiedy zastosować odległość Manhattanu jako przeciwieństwo odległości euklidesowej?

Próbuję poszukać dobrego argumentu na temat tego, dlaczego warto wykorzystać odległość Manhattanu nad odległością euklidesową w uczeniu maszynowym. Najbliższa mi jak dotąd dobra argumentacja dotyczy wykładu MIT . W 36:15 na slajdach można zobaczyć następujące oświadczenie: „Zazwyczaj stosuj dane euklidesowe; Manhattan może być odpowiedni, jeśli różne wymiary nie są porównywalne …

18 machine-learning classification distance

4

Jaka jest różnica między Inception v2 a Inception v3?

Papier Idąc głębiej ze zwojów opisuje GoogleNet który zawiera oryginalne moduły powstania: Zmiana na początek v2 polegała na tym, że zastąpiły one splot 5x5 dwoma kolejnymi splotami 3x3 i zastosowały pule: Jaka jest różnica między Inception v2 a Inception v3?

18 image-classification convnet computer-vision inception

3

Implementacja funkcji kosztu w regresji logistycznej w Pythonie: dlaczego mnożenie kropek w jednym wyrażeniu, a mnożenie elementarne w innym

Mam bardzo podstawowe pytanie, które dotyczy Pythona, liczby i mnożenia macierzy w ustawieniach regresji logistycznej. Po pierwsze, przepraszam, że nie używam notacji matematycznej. Jestem zdezorientowany co do zastosowania mnożenia kropek macierzy w porównaniu do mnożenia elementów. Funkcja kosztu jest dana przez: A w pythonie napisałem to jako cost = -1/m …

18 python logistic-regression cost-function