Odpowiedzi:
len(yourdict.keys())
Lub tylko
len(yourdict)
Jeśli chcesz policzyć unikalne słowa w pliku, możesz po prostu użyć set
i zrobić jak
len(set(open(yourdictfile).read().split()))
len(yourdict.keys())
i len(yourdict)
O (1). Ten ostatni jest nieco szybszy. Zobacz moje testy poniżej.
len(yourdict.values())
Wywoływanie len()
bezpośrednio ze słownika działa i jest szybsze niż budowanie iteratora d.keys()
i wywoływanie len()
go, ale szybkość jednego z nich będzie nieznaczna w porównaniu z tym, co robi Twój program.
d = {x: x**2 for x in range(1000)}
len(d)
# 1000
len(d.keys())
# 1000
%timeit len(d)
# 41.9 ns ± 0.244 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
%timeit len(d.keys())
# 83.3 ns ± 0.41 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
Jeśli pytanie dotyczy zliczenia liczby słów kluczowych, poleciłbym coś takiego
def countoccurrences(store, value):
try:
store[value] = store[value] + 1
except KeyError as e:
store[value] = 1
return
w głównej funkcji mają coś, co zapętla dane i przekazuje wartości do funkcji countoccrenrences
if __name__ == "__main__":
store = {}
list = ('a', 'a', 'b', 'c', 'c')
for data in list:
countoccurrences(store, data)
for k, v in store.iteritems():
print "Key " + k + " has occurred " + str(v) + " times"
Kod wyjściowy
Key a has occurred 2 times
Key c has occurred 2 times
Key b has occurred 1 times
countoccurrences()
aby tak było count_occurrences()
. Ponadto, jeśli import collections.Counter
, jest znacznie lepszym sposobem, aby to zrobić: from collections import Counter; store = Counter(); for data in list: store[list] += 1
.
Wprowadzono pewne modyfikacje w opublikowanej odpowiedzi UnderWaterKremlin, aby uczynić ją python3 proof. Zaskakujący wynik poniżej jako odpowiedź.
Specyfikacja systemu:
import timeit
d = {x: x**2 for x in range(1000)}
#print (d)
print (len(d))
# 1000
print (len(d.keys()))
# 1000
print (timeit.timeit('len({x: x**2 for x in range(1000)})', number=100000)) # 1
print (timeit.timeit('len({x: x**2 for x in range(1000)}.keys())', number=100000)) # 2
Wynik:
1) = 37,0100378
2) = 37,002148899999995
Wygląda więc na to, że len(d.keys())
obecnie jest szybszy niż zwykłe używanie len()
.