Trochę się mylę co do wyboru funkcji i uczenia maszynowego i zastanawiałem się, czy możesz mi pomóc. Mam zestaw danych mikromacierzy, który jest podzielony na dwie grupy i ma tysiące funkcji. Moim celem jest uzyskanie niewielkiej liczby genów (moich cech) (10–20) w sygnaturze, którą teoretycznie będę mógł zastosować do innych …
Innymi słowy, w oparciu o następujące, czym jest p? Aby uczynić to problemem matematycznym niż antropologicznym lub nauk społecznych i uprościć problem, załóżmy, że partnerzy są wybierani z jednakowym prawdopodobieństwem w całej populacji, z tym wyjątkiem, że rodzeństwo i pierwsi kuzyni nigdy nie łączą się w pary, a partnerzy są …
Mam wartości p z wielu testów i chciałbym wiedzieć, czy rzeczywiście jest coś znaczącego po poprawieniu wielu testów. Komplikacja: moje testy nie są niezależne. Metoda, o której myślę (wariant metody produktu Fishera, Zaykin i wsp., Genet Epidemiol , 2002) wymaga korelacji między wartościami p. Aby oszacować tę korelację, obecnie myślę …
Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam test statystyczny, w którym muszę …
W badaniach asocjacyjnych całego genomu (GWAS): Jakie są główne elementy? Dlaczego są używane? Jak są obliczane? Czy można przeprowadzić badanie asocjacyjne obejmujące cały genom bez użycia PCA?
W badaniach ekspresji genów za pomocą mikromacierzy dane dotyczące intensywności muszą zostać znormalizowane, aby można było porównać intensywności między poszczególnymi osobami, między genami. Pojęciowo i algorytmicznie, jak działa „normalizacja kwantowa” i jak wytłumaczyłbyś to statystyce?
Mam nadzieję, że ktoś na tych forach pomoże mi rozwiązać ten podstawowy problem w badaniach nad ekspresją genów. Przeprowadziłem głębokie sekwencjonowanie tkanki eksperymentalnej i kontrolnej. Następnie uzyskałem krotną wartość wzbogacenia genów w próbce eksperymentalnej nad kontrolą. Referencyjny genom ma około 15 000 genów. 3000 z 15 000 genów jest wzbogaconych …
Tło biologiczne Z czasem niektóre gatunki roślin mają tendencję do powielania całych genomów, uzyskując dodatkową kopię każdego genu. Z powodu niestabilności tej konfiguracji wiele z tych genów jest następnie usuwanych, a genom układa się ponownie i stabilizuje, gotowy do powtórzenia. Te zdarzenia duplikacji są powiązane ze specjacjami i inwazjami, a …
Jeśli postawię hipotezę, że sygnatura genu pozwoli zidentyfikować osoby o niższym ryzyku nawrotu, to znaczy obniży się o 0,5 (współczynnik ryzyka 0,5), wskaźnik zdarzeń u 20% populacji i zamierzam użyć próbek z retrospektywnego badania kohortowego wielkość próby musi być dostosowana do nierównych liczb w dwóch hipotetycznych grupach? Na przykład za …
Dlaczego ktoś stosuje wiek i kwadrat do wieku jako zmienne towarzyszące w badaniu asocjacji genetycznej? Rozumiem użycie wieku, jeśli zostało ono zidentyfikowane jako znacząca zmienna towarzysząca, ale nie mam pojęcia, jak wykorzystać wiek kwadratowy.
Staram się podsumować to, co do tej pory rozumiałem w karanej analizie wielowymiarowej z wielowymiarowymi zestawami danych, i wciąż uzyskanie właściwej definicji kary miękkiego progowania w porównaniu z penalizacją Lasso (lub ).L1L1L_1 Dokładniej, wykorzystałem rzadką regresję PLS do analizy 2-blokowej struktury danych, w tym danych genomowych ( polimorfizmy pojedynczego nukleotydu …
Mam macierz , gdzie to liczba genów, a to liczba pacjentów. Każdy, kto pracował z takimi danymi, wie, że jest zawsze większe niż . Korzystając z wyboru funkcji, zredukowałem do bardziej rozsądnej liczby, jednak jest nadal większe niż .n × pn×pn\times ppppnnnpppnnnppppppnnn Chciałbym obliczyć podobieństwo pacjentów na podstawie ich profili …
Mam dwa zestawy danych z badań asocjacyjnych całego genomu. Jedyne dostępne informacje to iloraz szans i wartość p dla pierwszego zestawu danych. Dla drugiego zestawu danych mam iloraz szans, wartość p i częstotliwości alleli (AFD = choroba, AFC = kontrola) (np. 0,321). Próbuję wykonać metaanalizę tych danych, ale nie mam …
Weź 20 losowych punktów w przestrzeni 10 000 wymiarów z każdą współrzędną id matematyczną . Podziel je na 10 par („pary”) i dodaj średnią każdej pary („dziecka”) do zestawu danych. Następnie wykonaj PCA na uzyskanych 30 punktach i wykreśl PC1 vs PC2.N(0,1)N(0,1)\mathcal N(0,1) Dzieje się coś niezwykłego: każda „rodzina” tworzy …
Mam dwa zestawy danych z badań asocjacyjnych całego genomu. Jedynymi dostępnymi informacjami są współczynniki nieparzyste i przedziały ufności (95%) dla każdego genotypowanego SNP. Chcę wygenerować działkę leśną porównującą te dwa współczynniki szans, ale nie mogę znaleźć sposobu na obliczenie łączonych przedziałów ufności w celu wizualizacji efektów podsumowania. Użyłem programu PLINK …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.