Pracuję z ogromnym plikiem danych (około 400 000 wierszy i 8 kolumn) w pakiecie Libre Office. Muszę pozbyć się pewnych wierszy, więc wybrałem wszystkie komórki o pożądanej wartości (za pomocą Find & Replace
) i próbowałem Edit > Delete Cells > Delete entire row(s)
. Ekran zanika i nadal, po około 15 minutach nigdzie mnie nie dostanie (ekran zanika na szaro, program nie odpowiada). Wybranie „tylko” kilku tysięcy wierszy spowodowało to samo.
Czy istnieje alternatywny sposób pozbycia się tysięcy wierszy w tym samym czasie? Rozwiązania w Libre Office, Gnumeric lub R lub innym otwartym oprogramowaniu są mile widziane.
Dane są zorganizowane w ten sposób (mała próbka):
Region, czas, itd., Wartości
Cypr, JanDec 2000, gdzieś, 0
Cypr, JanDec 2001, kody, 74.2
Cypr, JanDec 2002, kody, 68,7
Cypr, JanDec 2003, kody, 59.1
Cypr, JanDec 2004, kody, 50.3
Cypr, JanDec 2005, somecodes, 71.1
Cypr, styczeń 2006, kody, 45,7
Cypr, JanDec 2007, somecodes, 45,7
Cypr, JanDec 2008, kody, 50,4
Cypr, JanDec 2009, somecodes, 80
Cypr, JanDec 2010, kody, 47.2
Cypr, JanDec 2011, somecodes, 44.1
Hiszpania, JanDec 2000, gdzieś, 5
...
Okres czasu wynosi od 2000 do 2011 roku. Muszę pozbyć się wszystkich wierszy zawierających lata 2000–2005 i 2011.
read.csv
i stamtąd filtrować. jeśli nie masz wystarczającej ilości pamięci RAM, możesz nadal korzystać sqldf
pakiet, aby zrobić to samo