Mam taką ramkę danych (df1).
f1 f2 f3 f4 f5
d1 1 0 1 1 1
d2 1 0 0 1 0
d3 0 0 0 1 1
d4 0 1 0 0 1
Kolumna d1 ... d4 to nazwa kolumny, a wiersz f1 ... f5 to nazwa kolumny.
Aby zrobić próbkę (df1), otrzymuję nową ramkę danych z liczbą 1 taką samą jak df1. Tak więc liczba 1 jest zachowywana dla całej ramki danych, ale nie dla każdego wiersza lub każdej kolumny.
Czy można przeprowadzić randomizację według wierszy lub kolumn?
Chcę randomizować kolumny df1 dla każdej kolumny, tj. Liczba 1 w każdej kolumnie pozostaje taka sama. i każda kolumna musi zostać zmieniona co najmniej raz. Na przykład mogę mieć losowe df2 w ten sposób: (Zauważyłem, że liczba 1 w każdej kolumnie pozostaje taka sama, ale liczba 1 w każdym wierszu jest inna.
f1 f2 f3 f4 f5
d1 1 0 0 0 1
d2 0 1 0 1 1
d3 1 0 0 1 1
d4 0 0 1 1 0
Podobnie, chcę również losować wiersze df1 dla każdego wiersza, tj. Nie. 1 w każdym wierszu pozostaje taka sama i każdy wiersz musi zostać zmieniony (ale liczba zmienionych wpisów może być inna). Na przykład losowy plik df3 może wyglądać mniej więcej tak:
f1 f2 f3 f4 f5
d1 0 1 1 1 1 <- two entries are different
d2 0 0 1 0 1 <- four entries are different
d3 1 0 0 0 1 <- two entries are different
d4 0 0 1 0 1 <- two entries are different
PS. Wielkie dzięki za pomoc Gavina Simpsona, Jorisa Meysa i Chase'a za poprzednie odpowiedzi na moje poprzednie pytanie dotyczące losowania dwóch kolumn.