Mam ArrayList<String>
i chcę usunąć z niego powtarzające się ciągi. W jaki sposób mogę to zrobić?
Mam ArrayList<String>
i chcę usunąć z niego powtarzające się ciągi. W jaki sposób mogę to zrobić?
Odpowiedzi:
Jeśli nie chcesz duplikatów w Collection
, powinieneś zastanowić się, dlaczego używasz takiej, Collection
która zezwala na duplikaty. Najprostszym sposobem na usunięcie powtarzających się elementów jest dodanie zawartości do Set
(co nie pozwoli na duplikaty), a następnie dodanie Set
tyłu do ArrayList
:
Set<String> set = new HashSet<>(yourList);
yourList.clear();
yourList.addAll(set);
Oczywiście, to niszczy uporządkowanie elementów w ArrayList
.
public Set<Object> findDuplicates(List<Object> list) { Set<Object> items = new HashSet<Object>(); Set<Object> duplicates = new HashSet<Object>(); for (Object item : list) { if (items.contains(item)) { duplicates.add(item); } else { items.add(item); } } return duplicates; }
List
i Set
(zamiast typów implementacji ArrayList
i HashSet
jak w twoim przykładzie).
new HashSet(al)
zamiast inicjować w celu opróżnienia i wywołania addAll
.
Object
ma kilka wartości, jeśli dwie z nich się powtarzają, uważam je za duplikaty (inne wartości mogą być różne) i używam Set
?
Że pomimo iż przeliczenie ArrayList
Do HashSet
skutecznie usuwa duplikaty, jeśli trzeba zachować kolejność wstawiania, wolałbym proponuję użyć tego wariantu
// list is some List of Strings
Set<String> s = new LinkedHashSet<>(list);
Następnie, jeśli musisz odzyskać List
referencję, możesz ponownie użyć konstruktora konwersji.
W Javie 8:
List<String> deduped = list.stream().distinct().collect(Collectors.toList());
Należy pamiętać, że aby elementy filtrujące działały poprawnie, należy przestrzegać umowy hashCode-equals dla członków listy.
addAll
do new TreeSet<String>(String.CASE_INSENSITIVE_ORDER)
. Pierwszy dodany element pozostanie w zestawie, więc jeśli twoja lista zawiera „Pies” i „Pies” (w tej kolejności), TreeSet
będzie zawierać „Pies”. Jeśli trzeba zachować porządek, to przed wierszem w odpowiedzi umieścić list.replaceAll(String::toUpperCase);
.
Załóżmy, że mamy listę String
takich jak:
List<String> strList = new ArrayList<>(5);
// insert up to five items to list.
Następnie możemy usunąć duplikaty elementów na wiele sposobów.
List<String> deDupStringList = new ArrayList<>(new HashSet<>(strList));
Uwaga: jeśli chcemy zachować kolejność wstawiania, musimy użyć LinkedHashSet
zamiastHashSet
List<String> deDupStringList2 = Lists.newArrayList(Sets.newHashSet(strList));
List<String> deDupStringList3 = strList.stream().distinct().collect(Collectors.toList());
Uwaga: W przypadku, gdy chcemy zebrać wynik w konkretnej implementacji listy, np. LinkedList
Możemy zmodyfikować powyższy przykład jako:
List<String> deDupStringList3 = strList.stream().distinct()
.collect(Collectors.toCollection(LinkedList::new));
Możemy użyć parallelStream
również w powyższym kodzie, ale może nie dać oczekiwanych korzyści w zakresie wydajności. Sprawdź to pytanie, aby uzyskać więcej.
parallel streams
zawsze da lepszą wydajność. Ale to mit. Później dowiedziałem się, że istnieją pewne scenariusze, w których należy stosować strumienie równoległe. W tym scenariuszu równoległe strumienie nie poprawią wydajności. i tak równoległe strumienie mogą w niektórych przypadkach nie dać pożądanych rezultatów. List<String> deDupStringList3 = stringList.stream().map(String::toLowerCase).distinct().collect(Collectors.toList());
powinno być odpowiednim rozwiązaniem w tym przypadku
Jeśli nie chcesz duplikatów, użyj zestawu zamiast List
. Aby przekonwertować List
na a Set
, możesz użyć następującego kodu:
// list is some List of Strings
Set<String> s = new HashSet<String>(list);
Jeśli to naprawdę konieczne, możesz użyć tej samej konstrukcji, aby przekształcić z Set
powrotem w plik List
.
Set
nie można go tutaj użyć.
Możesz to zrobić w ten sposób i zachować porządek:
// delete duplicates (if any) from 'myArrayList'
myArrayList = new ArrayList<String>(new LinkedHashSet<String>(myArrayList));
Strumienie Java 8 zapewniają bardzo prosty sposób usuwania zduplikowanych elementów z listy. Używając odrębnej metody. Jeśli mamy listę miast i chcemy usunąć duplikaty z tej listy, można to zrobić w jednym wierszu -
List<String> cityList = new ArrayList<>();
cityList.add("Delhi");
cityList.add("Mumbai");
cityList.add("Bangalore");
cityList.add("Chennai");
cityList.add("Kolkata");
cityList.add("Mumbai");
cityList = cityList.stream().distinct().collect(Collectors.toList());
Oto sposób, który nie wpływa na porządkowanie listy:
ArrayList l1 = new ArrayList();
ArrayList l2 = new ArrayList();
Iterator iterator = l1.iterator();
while (iterator.hasNext()) {
YourClass o = (YourClass) iterator.next();
if(!l2.contains(o)) l2.add(o);
}
l1 to oryginalna lista, a l2 to lista bez powtarzających się elementów (upewnij się, że twoja klasa ma metodę równości zgodnie z tym, co chcesz stać na równości)
ArrayList<T>
należy użyć zamiast ArrayList
) 2) Można uniknąć jawnego tworzenia iteratora za pomocą for (T current : l1) { ... }
. Nawet jeśli chcesz użyć Iterator
jawnie, iterador
jest źle napisane.
Możliwe jest usunięcie duplikatów z tablicy arraylist bez użycia HashSet lub jeszcze jednej tablicy arraylist .
Wypróbuj ten kod ..
ArrayList<String> lst = new ArrayList<String>();
lst.add("ABC");
lst.add("ABC");
lst.add("ABCD");
lst.add("ABCD");
lst.add("ABCE");
System.out.println("Duplicates List "+lst);
Object[] st = lst.toArray();
for (Object s : st) {
if (lst.indexOf(s) != lst.lastIndexOf(s)) {
lst.remove(lst.lastIndexOf(s));
}
}
System.out.println("Distinct List "+lst);
Dane wyjściowe to
Duplicates List [ABC, ABC, ABCD, ABCD, ABCE]
Distinct List [ABC, ABCD, ABCE]
ImmutableSet.copyOf(lst).toList()
.
indexOf
iteruje lst
użycie pętli for.
Istnieje również opcja ImmutableSet
z Guawy ( tutaj jest dokumentacja):
ImmutableSet.copyOf(list);
ImmutableSet.asList()
metoda zwracająca ImmutableList
, jeśli potrzebujesz go z powrotem jako List
.
może to rozwiązać problem:
private List<SomeClass> clearListFromDuplicateFirstName(List<SomeClass> list1) {
Map<String, SomeClass> cleanMap = new LinkedHashMap<String, SomeClass>();
for (int i = 0; i < list1.size(); i++) {
cleanMap.put(list1.get(i).getFirstName(), list1.get(i));
}
List<SomeClass> list = new ArrayList<SomeClass>(cleanMap.values());
return list;
}
Prawdopodobnie trochę przesada, ale podoba mi się ten rodzaj odosobnionego problemu. :)
Ten kod używa zestawu tymczasowego (do kontroli unikalności), ale usuwa elementy bezpośrednio z oryginalnej listy. Ponieważ usuwanie elementów wewnątrz tablicy ArrayList może spowodować ogromną ilość kopiowania tablicy, unika się metody remove (int).
public static <T> void removeDuplicates(ArrayList<T> list) {
int size = list.size();
int out = 0;
{
final Set<T> encountered = new HashSet<T>();
for (int in = 0; in < size; in++) {
final T t = list.get(in);
final boolean first = encountered.add(t);
if (first) {
list.set(out++, t);
}
}
}
while (out < size) {
list.remove(--size);
}
}
Skoro już o tym mowa, oto wersja LinkedList (o wiele ładniejsza!):
public static <T> void removeDuplicates(LinkedList<T> list) {
final Set<T> encountered = new HashSet<T>();
for (Iterator<T> iter = list.iterator(); iter.hasNext(); ) {
final T t = iter.next();
final boolean first = encountered.add(t);
if (!first) {
iter.remove();
}
}
}
Użyj interfejsu znaczników, aby przedstawić ujednolicone rozwiązanie dla listy:
public static <T> void removeDuplicates(List<T> list) {
if (list instanceof RandomAccess) {
// use first version here
} else {
// use other version here
}
}
EDYCJA: Wydaje mi się, że rzeczy ogólne nie dodają tutaj żadnej wartości .. No cóż. :)
public static void main(String[] args){
ArrayList<Object> al = new ArrayList<Object>();
al.add("abc");
al.add('a');
al.add('b');
al.add('a');
al.add("abc");
al.add(10.3);
al.add('c');
al.add(10);
al.add("abc");
al.add(10);
System.out.println("Before Duplicate Remove:"+al);
for(int i=0;i<al.size();i++){
for(int j=i+1;j<al.size();j++){
if(al.get(i).equals(al.get(j))){
al.remove(j);
j--;
}
}
}
System.out.println("After Removing duplicate:"+al);
}
Jeśli chcesz korzystać z biblioteki innej firmy, możesz użyć tej metody distinct()
w Eclipse Collections (wcześniej GS Collection).
ListIterable<Integer> integers = FastList.newListWith(1, 3, 1, 2, 2, 1);
Assert.assertEquals(
FastList.newListWith(1, 3, 2),
integers.distinct());
Zaletą używania distinct()
zamiast konwersji do zestawu, a następnie powrotu do listy jest to, że distinct()
zachowuje kolejność oryginalnej listy, zachowując pierwsze wystąpienie każdego elementu. Jest realizowany przy użyciu zarówno zestawu, jak i listy.
MutableSet<T> seenSoFar = UnifiedSet.newSet();
int size = list.size();
for (int i = 0; i < size; i++)
{
T item = list.get(i);
if (seenSoFar.add(item))
{
targetCollection.add(item);
}
}
return targetCollection;
Jeśli nie możesz przekonwertować oryginalnej listy na typ kolekcji Eclipse, możesz użyć ListAdapter, aby uzyskać ten sam interfejs API.
MutableList<Integer> distinct = ListAdapter.adapt(integers).distinct();
Uwaga: jestem osobą odpowiedzialną za kolekcje Eclipse.
Te trzy wiersze kodu mogą usunąć zduplikowany element z ArrayList lub dowolnej kolekcji.
List<Entity> entities = repository.findByUserId(userId);
Set<Entity> s = new LinkedHashSet<Entity>(entities);
entities.clear();
entities.addAll(s);
Podczas wypełniania ArrayList użyj warunku dla każdego elementu. Na przykład:
ArrayList< Integer > al = new ArrayList< Integer >();
// fill 1
for ( int i = 0; i <= 5; i++ )
if ( !al.contains( i ) )
al.add( i );
// fill 2
for (int i = 0; i <= 10; i++ )
if ( !al.contains( i ) )
al.add( i );
for( Integer i: al )
{
System.out.print( i + " ");
}
Otrzymamy tablicę {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
Jeśli chcesz zachować swoje zamówienie, najlepiej użyć LinkedHashSet . Ponieważ jeśli chcesz przekazać tę listę do zapytania wstawiania poprzez iterację, kolejność zostanie zachowana.
Spróbuj tego
LinkedHashSet link=new LinkedHashSet();
List listOfValues=new ArrayList();
listOfValues.add(link);
Ta konwersja będzie bardzo pomocna, jeśli chcesz zwrócić listę, ale nie zestaw.
Kod:
List<String> duplicatList = new ArrayList<String>();
duplicatList = Arrays.asList("AA","BB","CC","DD","DD","EE","AA","FF");
//above AA and DD are duplicate
Set<String> uniqueList = new HashSet<String>(duplicatList);
duplicatList = new ArrayList<String>(uniqueList); //let GC will doing free memory
System.out.println("Removed Duplicate : "+duplicatList);
Uwaga: Zdecydowanie będzie narzut pamięci.
ArrayList<String> city=new ArrayList<String>();
city.add("rajkot");
city.add("gondal");
city.add("rajkot");
city.add("gova");
city.add("baroda");
city.add("morbi");
city.add("gova");
HashSet<String> hashSet = new HashSet<String>();
hashSet.addAll(city);
city.clear();
city.addAll(hashSet);
Toast.makeText(getActivity(),"" + city.toString(),Toast.LENGTH_SHORT).show();
LinkedHashSet załatwi sprawę.
String[] arr2 = {"5","1","2","3","3","4","1","2"};
Set<String> set = new LinkedHashSet<String>(Arrays.asList(arr2));
for(String s1 : set)
System.out.println(s1);
System.out.println( "------------------------" );
String[] arr3 = set.toArray(new String[0]);
for(int i = 0; i < arr3.length; i++)
System.out.println(arr3[i].toString());
// wynik: 5,1,2,3,4
List<String> result = new ArrayList<String>();
Set<String> set = new LinkedHashSet<String>();
String s = "ravi is a good!boy. But ravi is very nasty fellow.";
StringTokenizer st = new StringTokenizer(s, " ,. ,!");
while (st.hasMoreTokens()) {
result.add(st.nextToken());
}
System.out.println(result);
set.addAll(result);
result.clear();
result.addAll(set);
System.out.println(result);
output:
[ravi, is, a, good, boy, But, ravi, is, very, nasty, fellow]
[ravi, is, a, good, boy, But, very, nasty, fellow]
Służy to do listy obiektów niestandardowych
public List<Contact> removeDuplicates(List<Contact> list) {
// Set set1 = new LinkedHashSet(list);
Set set = new TreeSet(new Comparator() {
@Override
public int compare(Object o1, Object o2) {
if (((Contact) o1).getId().equalsIgnoreCase(((Contact) o2).getId()) /*&&
((Contact)o1).getName().equalsIgnoreCase(((Contact)o2).getName())*/) {
return 0;
}
return 1;
}
});
set.addAll(list);
final List newList = new ArrayList(set);
return newList;
}
możesz użyć zagnieżdżonej pętli w następujący sposób:
ArrayList<Class1> l1 = new ArrayList<Class1>();
ArrayList<Class1> l2 = new ArrayList<Class1>();
Iterator iterator1 = l1.iterator();
boolean repeated = false;
while (iterator1.hasNext())
{
Class1 c1 = (Class1) iterator1.next();
for (Class1 _c: l2) {
if(_c.getId() == c1.getId())
repeated = true;
}
if(!repeated)
l2.add(c1);
}
Oto mój kod bez użycia jakiejkolwiek innej struktury danych, takiej jak set lub hashmap
for (int i = 0; i < Models.size(); i++){
for (int j = i + 1; j < Models.size(); j++) {
if (Models.get(i).getName().equals(Models.get(j).getName())) {
Models.remove(j);
j--;
}
}
}
ArrayList<String> list = new ArrayList<String>();
HashSet<String> unique = new LinkedHashSet<String>();
HashSet<String> dup = new LinkedHashSet<String>();
boolean b = false;
list.add("Hello");
list.add("Hello");
list.add("how");
list.add("are");
list.add("u");
list.add("u");
for(Iterator iterator= list.iterator();iterator.hasNext();)
{
String value = (String)iterator.next();
System.out.println(value);
if(b==unique.add(value))
dup.add(value);
else
unique.add(value);
}
System.out.println(unique);
System.out.println(dup);
Jeśli chcesz usunąć duplikaty z ArrayList oznacza znaleźć poniższą logikę,
public static Object[] removeDuplicate(Object[] inputArray)
{
long startTime = System.nanoTime();
int totalSize = inputArray.length;
Object[] resultArray = new Object[totalSize];
int newSize = 0;
for(int i=0; i<totalSize; i++)
{
Object value = inputArray[i];
if(value == null)
{
continue;
}
for(int j=i+1; j<totalSize; j++)
{
if(value.equals(inputArray[j]))
{
inputArray[j] = null;
}
}
resultArray[newSize++] = value;
}
long endTime = System.nanoTime()-startTime;
System.out.println("Total Time-B:"+endTime);
return resultArray;
}