Próbka to podzbiór populacji. Statystyka ogólnie dotyczy wykorzystywania próbek do wnioskowania o parametrach rządzących większą (prawdopodobnie nieskończoną) populacją.
Mam duży zestaw danych (20 000 punktów danych), z których chcę pobrać powtarzane próbki 10 punktów danych. Jednak po wybraniu tych 10 punktów danych chcę, aby nie były ponownie wybierane. Próbowałem użyć tej samplefunkcji, ale wydaje się, że nie ma opcji próbkowania bez zamiany przez wiele wywołań funkcji. Czy istnieje …
Wiem, że używamy do oszacowania wariancji populacji. Pamiętam wideo z Khan Academy, w którym podana intuicja była taka, że nasza szacunkowa średnia jest prawdopodobnie nieco mniejsza od rzeczywistej, więc odległości byłyby faktycznie większe, więc dzielimy przez mniej ( zamiast ) aby uzyskać większą wartość, co skutkuje lepszym oszacowaniem. Pamiętam gdzieś …
Mam zestaw danych zawierający liczbę działań wykonanych przez osoby w ciągu 7 dni. Konkretne działanie nie powinno być istotne dla tego pytania. Oto kilka statystyk opisowych dla zestawu danych: RangeMeanVarianceNumber of observations0−77218.22791696Range0−772Mean18.2Variance2791Number of observations696 \begin{array}{|c|c|} \hline \text{Range} & 0 - 772 \\ \hline \text{Mean} & 18.2 \\ \hline \text{Variance} & …
SurveyMonkey ma kroki i tabelę, aby dowiedzieć się, jaki rozmiar próby jest potrzebny dla danego marginesu błędu lub przedziału ufności, na podstawie wielkości populacji. Wielkość próby SurveyMonkey Czy ta tabela po prostu ignoruje fakt, że nie otrzymasz losowej próbki, ponieważ tylko osoby, które zawracają sobie głowę odpowiedzią na ankietę? Zostaję …
W ustawieniu dwumianowym zmienna losowa X, która podaje liczbę sukcesów, jest rozkładana dwumianowo. Proporcję próbki można następnie obliczyć jako gdzie jest rozmiarem próbki. Mój podręcznik to stwierdzaXnXn\frac{X}{n}nnn Ta proporcja nie ma rozkładu dwumianowego jednak skoro jest po prostu skalowaną wersją losowo zmiennej losowej rozkładzie dwumianowym , czy nie powinien mieć …
Pracuję nad algorytmem, który musi obliczyć rozmiar zestawu wygenerowanego przez przecięcie co najmniej 2 zestawów. Dokładniej: z=|A0∩…∩An|z=|A0∩…∩An| z = \left |A_0 \cap \ldots \cap A_n \right | Przecinane zestawy są generowane przez zapytania SQL i starając się utrzymać szybkość, otrzymuję z wyprzedzeniem liczbę każdego zapytania, a następnie biorę zestaw o …
To tylko przykład, na który natknąłem się kilka razy, więc nie mam żadnych przykładowych danych. Uruchamianie modelu regresji liniowej w R: a.lm = lm(Y ~ x1 + x2) x1jest zmienną ciągłą. x2jest kategoryczny i ma trzy wartości, np. „Niska”, „Średnia” i „Wysoka”. Jednak dane wyjściowe podane przez R byłyby mniej …
Jeśli podam trzy liczby, które są niezależnie i identycznie wyprowadzone ze standardowego rozkładu normalnego, to czy dałem ci trzy próbki lub jedną próbkę? Jeśli odpowiedź to jedna próbka, czy istnieje krótka nazwa tego, co dałem wam trzy?
Mam więc 16 prób, w których próbuję uwierzytelnić osobę z cechy biometrycznej za pomocą Hamminga. Mój próg jest ustawiony na 3,5. Moje dane są poniżej i tylko próba 1 jest prawdziwie pozytywna: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 …
Podano wielkość próby „N”, której planuję użyć do prognozowania danych. Jakie są niektóre sposoby podziału danych, aby wykorzystać niektóre z nich do ustanowienia modelu, a pozostałe dane do zweryfikowania modelu? Wiem, że nie ma czarno-białej odpowiedzi na to pytanie, ale byłoby interesujące znać pewne „ogólne zasady” lub zwykle używane proporcje. …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.