Czy wyodrębnić podzbiór par klucz-wartość z obiektu słownika Python?


313

Mam duży obiekt słownika, który ma kilka par kluczowych wartości (około 16), ale interesują mnie tylko 3 z nich. Jaki jest najlepszy sposób (najkrótszy / wydajny / najbardziej elegancki), aby to osiągnąć?

Najlepsze, co wiem to:

bigdict = {'a':1,'b':2,....,'z':26} 
subdict = {'l':bigdict['l'], 'm':bigdict['m'], 'n':bigdict['n']}

Jestem pewien, że istnieje bardziej elegancki sposób niż ten. Pomysły?

Odpowiedzi:


430

Możesz spróbować:

dict((k, bigdict[k]) for k in ('l', 'm', 'n'))

... lub w Python 3Python w wersji 2.7 lub nowszej (dzięki Fábio Diniz za wskazanie, że działa również w wersji 2.7) :

{k: bigdict[k] for k in ('l', 'm', 'n')}

Aktualizacja: Jak zauważa Håvard S , zakładam, że wiesz, że klucze będą w słowniku - zobacz jego odpowiedź, jeśli nie jesteś w stanie przyjąć takiego założenia. Alternatywnie, jak wskazuje timbo w komentarzach, jeśli chcesz klucza, którego brakuje w bigdictmapowaniu None, możesz:

{k: bigdict.get(k, None) for k in ('l', 'm', 'n')}

Jeśli używasz języka Python 3 i chcesz tylko kluczy w nowym dykcie, które faktycznie istnieją w oryginalnym, możesz użyć tego faktu, aby wyświetlić obiekty zaimplementowane pewne ustawione operacje:

{k: bigdict[k] for k in bigdict.keys() & {'l', 'm', 'n'}}

5
Nie powiedzie się, jeśli bigdictnie zawierak
Håvard S

7
Trochę surowo jest głosować za tym - wydawało mi się dość jasne z kontekstu, że wiadomo, że te klucze są w słowniku ...
Mark Longair

9
{k: bigdict.get(k,None) for k in ('l', 'm', 'n')}poradzi sobie z sytuacją, w której brakuje określonego klucza w słowniku źródłowym, ustawiając klucz w nowym dykcie na Brak
timbo

9
@MarkLongair W zależności od przypadku użycia {k: bigdict [k] dla k w ('l', 'm', 'n'), jeśli k w bigdict} może być lepszy, ponieważ przechowuje tylko te klucze, które faktycznie mają wartości.
Briford Wylie

6
bigdict.keys() & {'l', 'm', 'n'} ==> bigdict.viewkeys() & {'l', 'm', 'n'} dla Python2.7
kxr

119

Trochę krótszy, przynajmniej:

wanted_keys = ['l', 'm', 'n'] # The keys you want
dict((k, bigdict[k]) for k in wanted_keys if k in bigdict)

8
+1 za alternatywne zachowanie wykluczenia klucza, jeśli nie jest on w bigdict, w przeciwieństwie do ustawienia go na Brak.
dhj

1
Alternatywnie: dict((k,bigdict.get(k,defaultVal) for k in wanted_keys)jeśli musisz mieć wszystkie klucze.
Thomas Andrews,

2
Ta odpowiedź jest zapisywana przez „t”.
sakurashinken

24
interesting_keys = ('l', 'm', 'n')
subdict = {x: bigdict[x] for x in interesting_keys if x in bigdict}

16

Trochę porównania prędkości dla wszystkich wymienionych metod:

Python 2.7.11 |Anaconda 2.4.1 (64-bit)| (default, Jan 29 2016, 14:26:21) [MSC v.1500 64 bit (AMD64)] on win32
In[2]: import numpy.random as nprnd
keys = nprnd.randint(1000, size=10000)
bigdict = dict([(_, nprnd.rand()) for _ in range(1000)])

%timeit {key:bigdict[key] for key in keys}
%timeit dict((key, bigdict[key]) for key in keys)
%timeit dict(map(lambda k: (k, bigdict[k]), keys))
%timeit dict(filter(lambda i:i[0] in keys, bigdict.items()))
%timeit {key:value for key, value in bigdict.items() if key in keys}
100 loops, best of 3: 3.09 ms per loop
100 loops, best of 3: 3.72 ms per loop
100 loops, best of 3: 6.63 ms per loop
10 loops, best of 3: 20.3 ms per loop
100 loops, best of 3: 20.6 ms per loop

Tak jak się spodziewano: najlepszym rozwiązaniem są tłumaczenia słownikowe.


12

Ta odpowiedź korzysta ze słownika podobnego do wybranej odpowiedzi, ale nie dotyczy wyłącznie brakującego elementu.

wersja python 2:

{k:v for k, v in bigDict.iteritems() if k in ('l', 'm', 'n')}

wersja Python 3:

{k:v for k, v in bigDict.items() if k in ('l', 'm', 'n')}

2
... ale jeśli wielki dyktus jest OGROMNY, nadal będzie iterowany całkowicie (jest to operacja O (n)), podczas gdy odwrotność po prostu złapie 3 przedmioty (każda operacja O (1)).
wouter bolsterlee

1
Pytanie dotyczy słownika składającego się tylko z 16 kluczy
Meow

6

Może:

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n']])

Python 3 obsługuje nawet następujące:

subdict={a:bigdict[a] for a in ['l','m','n']}

Pamiętaj, że możesz sprawdzić istnienie w słowniku w następujący sposób:

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n'] if x in bigdict])

odpowiednio dla python 3

subdict={a:bigdict[a] for a in ['l','m','n'] if a in bigdict}

aNie działa, jeśli go nie mabigdict
Håvard S

3

Okej, to mnie niepokoiło kilka razy, więc dziękuję Jayeshowi za to pytanie.

Powyższe odpowiedzi wydają się równie dobrym rozwiązaniem jak każde inne, ale jeśli używasz tego w całym kodzie, sensowne jest zawinięcie funkcjonalności IMHO. Istnieją również dwa możliwe przypadki użycia: jeden, w którym zależy Ci na tym, czy wszystkie słowa kluczowe znajdują się w oryginalnym słowniku. i taki, w którym nie. Byłoby miło traktować oba jednakowo.

Tak więc, dla mojej wartości dwóch groszy, proponuję napisanie podklasy słownika, np

class my_dict(dict):
    def subdict(self, keywords, fragile=False):
        d = {}
        for k in keywords:
            try:
                d[k] = self[k]
            except KeyError:
                if fragile:
                    raise
        return d

Teraz możesz wyciągnąć pod-słownik za pomocą

orig_dict.subdict(keywords)

Przykłady użycia:

#
## our keywords are letters of the alphabet
keywords = 'abcdefghijklmnopqrstuvwxyz'
#
## our dictionary maps letters to their index
d = my_dict([(k,i) for i,k in enumerate(keywords)])
print('Original dictionary:\n%r\n\n' % (d,))
#
## constructing a sub-dictionary with good keywords
oddkeywords = keywords[::2]
subd = d.subdict(oddkeywords)
print('Dictionary from odd numbered keys:\n%r\n\n' % (subd,))
#
## constructing a sub-dictionary with mixture of good and bad keywords
somebadkeywords = keywords[1::2] + 'A'
try:
    subd2 = d.subdict(somebadkeywords)
    print("We shouldn't see this message")
except KeyError:
    print("subd2 construction fails:")
    print("\toriginal dictionary doesn't contain some keys\n\n")
#
## Trying again with fragile set to false
try:
    subd3 = d.subdict(somebadkeywords, fragile=False)
    print('Dictionary constructed using some bad keys:\n%r\n\n' % (subd3,))
except KeyError:
    print("We shouldn't see this message")

Jeśli uruchomisz cały powyższy kod, powinieneś zobaczyć (coś w stylu) następujące dane wyjściowe (przepraszam za formatowanie):

Słownik oryginalny:
{'a': 0, 'c': 2, 'b': 1, 'e': 4, 'd': 3, 'g': 6, 'f': 5, 'i': 8, „h”: 7, „k”: 10, „j”: 9, „m”: 12, „l”: 11, „o”: 14, „n”: 13, „q”: 16, „p”: 15, „s”: 18, „r”: 17, „u”: 20, „t”: 19, „w”: 22, „v”: 21, „y”: 24, „x „: 23,„ z ”: 25}

Słownik z nieparzystych klawiszy:
{'a': 0, 'c': 2, 'e': 4, 'g': 6, 'i': 8, 'k': 10, 'm': 12, ' o ': 14,' q ': 16,' s ': 18,' u ': 20,' w ': 22,' y ': 24}

konstrukcja subd2 kończy się niepowodzeniem:
oryginalny słownik nie zawiera niektórych kluczy

Słownik zbudowany przy użyciu złych kluczy:
{'b': 1, 'd': 3, 'f': 5, 'h': 7, 'j': 9, 'l': 11, 'n': 13, „p”: 15, „r”: 17, „t”: 19, „v”: 21, „x”: 23, „z”: 25}


1
Podklasowanie wymaga przekształcenia istniejącego obiektu dict w typ podklasy, co może być kosztowne. Dlaczego nie napisać prostej funkcji subdict(orig_dict, keys, …)?
musiphil

3

Możesz także użyć map(co jest bardzo przydatną funkcją do zapoznania się):

sd = dict(map(lambda k: (k, l.get(k, None)), l))

Przykład:

large_dictionary = {'a1':123, 'a2':45, 'a3':344}
list_of_keys = ['a1', 'a3']
small_dictionary = dict(map(lambda key: (key, large_dictionary.get(key, None)), list_of_keys))

PS: Pożyczyłem .get(key, None)od poprzedniej odpowiedzi :)


1

Jeszcze jeden (wolę odpowiedź Marka Longaira)

di = {'a':1,'b':2,'c':3}
req = ['a','c','w']
dict([i for i in di.iteritems() if i[0] in di and i[0] in req])

jest wolny dla dużego dykta
kxr

0

rozwiązanie

from operator import itemgetter
from typing import List, Dict, Union


def subdict(d: Union[Dict, List], columns: List[str]) -> Union[Dict, List[Dict]]:
    """Return a dict or list of dicts with subset of 
    columns from the d argument.
    """
    getter = itemgetter(*columns)

    if isinstance(d, list):
        result = []
        for subset in map(getter, d):
            record = dict(zip(columns, subset))
            result.append(record)
        return result
    elif isinstance(d, dict):
        return dict(zip(columns, getter(d)))

    raise ValueError('Unsupported type for `d`')

przykłady użycia

# pure dict

d = dict(a=1, b=2, c=3)
print(subdict(d, ['a', 'c']))

>>> In [5]: {'a': 1, 'c': 3}
# list of dicts

d = [
    dict(a=1, b=2, c=3),
    dict(a=2, b=4, c=6),
    dict(a=4, b=8, c=12),
]

print(subdict(d, ['a', 'c']))

>>> In [5]: [{'a': 1, 'c': 3}, {'a': 2, 'c': 6}, {'a': 4, 'c': 12}]
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.