Kiedy myślisz „sprawdź, czy a in b”, pomyśl o hashach (w tym przypadku ustawia). Najszybszym sposobem jest haszowanie listy, którą chcesz sprawdzić, a następnie sprawdzenie każdej pozycji na liście.
Dlatego odpowiedź Joe Koberga jest szybka: sprawdzanie przecięcia zestawu jest bardzo szybkie.
Kiedy nie masz dużo danych, tworzenie zestawów może być stratą czasu. Możesz więc utworzyć zestaw listy i po prostu sprawdzić każdy element:
tocheck = [1,2] # items to check
a = [2,3,4] # the list
a = set(a) # convert to set (O(len(a)))
print [i for i in tocheck if i in a] # check items (O(len(tocheck)))
Gdy liczba elementów, które chcesz sprawdzić, jest niewielka, różnica może być nieznaczna. Ale sprawdź wiele liczb na dużej liście ...
testy:
from timeit import timeit
methods = ['''tocheck = [1,2] # items to check
a = [2,3,4] # the list
a = set(a) # convert to set (O(n))
[i for i in tocheck if i in a] # check items (O(m))''',
'''L1 = [2,3,4]
L2 = [1,2]
[i for i in L1 if i in L2]''',
'''S1 = set([2,3,4])
S2 = set([1,2])
S1.intersection(S2)''',
'''a = [1,2]
b = [2,3,4]
any(x in a for x in b)''']
for method in methods:
print timeit(method, number=10000)
print
methods = ['''tocheck = range(200,300) # items to check
a = range(2, 10000) # the list
a = set(a) # convert to set (O(n))
[i for i in tocheck if i in a] # check items (O(m))''',
'''L1 = range(2, 10000)
L2 = range(200,300)
[i for i in L1 if i in L2]''',
'''S1 = set(range(2, 10000))
S2 = set(range(200,300))
S1.intersection(S2)''',
'''a = range(200,300)
b = range(2, 10000)
any(x in a for x in b)''']
for method in methods:
print timeit(method, number=1000)
prędkości:
M1: 0.0170331001282 # make one set
M2: 0.0164539813995 # list comprehension
M3: 0.0286040306091 # set intersection
M4: 0.0305438041687 # any
M1: 0.49850320816 # make one set
M2: 25.2735087872 # list comprehension
M3: 0.466138124466 # set intersection
M4: 0.668627977371 # any
Metodą, która jest konsekwentnie szybka, jest utworzenie jednego zestawu (z listy), ale przecięcie działa najlepiej na dużych zestawach danych!
a = [1, 2] b = [3, 5, 2, 6, 8, 9] c = [3, 5, 6, 8, 1, 9] print( (1 and 2) in b ,(2 and 1) in b ,(1 and 2) in c ,(2 and 1) in c, sep='\n')jest prawdą Fałsz Fałsz prawda