Jak wyodrębnić kolumnę z tablicy wielowymiarowej?


Odpowiedzi:


227
>>> import numpy as np
>>> A = np.array([[1,2,3,4],[5,6,7,8]])

>>> A
array([[1, 2, 3, 4],
    [5, 6, 7, 8]])

>>> A[:,2] # returns the third columm
array([3, 7])

Zobacz także: „numpy.arange” i „reshape”, aby przydzielić pamięć

Przykład: (Przydział tablicy z kształtowaniem macierzy (3x4))

nrows = 3
ncols = 4
my_array = numpy.arange(nrows*ncols, dtype='double')
my_array = my_array.reshape(nrows, ncols)

8
Zajęło mi 2 godziny, aby odkryć [:, 2] zgadnij, że tej funkcji nie ma w oficjalnej literaturze na temat krojenia?
niken

Co oznacza przecinek?
Phil

3
@Phil [row, col]. przecinek rozdziela się.
AsheKetchum,

11
Jak ta odpowiedź może mieć tak wiele pozytywnych opinii? OP nigdy nie powiedział, że to tablica
numeryczna

3
dla ekstraktu 2 kolumny: A [:, [1,3]] na przykład ekstrakt drugiej i czwartej kolumny
sadalsuud

177

Czy to możliwe, że używasz tablicy NumPy ? Python ma moduł macierzy , ale nie obsługuje tablic wielowymiarowych. Normalne listy w języku Python są również jednowymiarowe.

Jeśli jednak masz prostą dwuwymiarową listę, taką jak ta:

A = [[1,2,3,4],
     [5,6,7,8]]

następnie możesz wyodrębnić taką kolumnę:

def column(matrix, i):
    return [row[i] for row in matrix]

Wyodrębnianie drugiej kolumny (indeks 1):

>>> column(A, 1)
[2, 6]

Lub alternatywnie po prostu:

>>> [row[1] for row in A]
[2, 6]

80

Jeśli masz tablicę podobną do

a = [[1, 2], [2, 3], [3, 4]]

Następnie wyodrębnij pierwszą kolumnę w ten sposób:

[row[0] for row in a]

Wynik wygląda następująco:

[1, 2, 3]

38

Sprawdź to!

a = [[1, 2], [2, 3], [3, 4]]
a2 = zip(*a)
a2[0]

jest to to samo, co powyżej, z wyjątkiem tego, że jest ładniejszy, zip działa, ale wymaga pojedynczych tablic jako argumentów, składnia * a rozpakowuje tablicę wielowymiarową na argumenty z jedną tablicą


7
Co jest powyżej Pamiętaj, że odpowiedzi nie zawsze są sortowane w ten sam sposób.
Muhd

2
Jest to czyste, ale może nie być najbardziej wydajne, jeśli wydajność stanowi problem, ponieważ przenosi całą matrycę.
IceArdor

6
Do Twojej wiadomości, działa to w Pythonie 2, ale w Pythonie 3 otrzymasz obiekt generatora, którego oczywiście nie można zapisać do indeksu.
Rishabh Agrahari

@RishabhAgrahari W każdym razie zrobić to zip w Py3?
CtrlAltF2

2
@WarpDriveEnterprises tak, musisz przekonwertować obiekt generatora na listę, a następnie wykonać indeksowanie. przykład:a2 = zip(*a); a2 = list(a2); a2[0]
Rishabh Agrahari

14
def get_col(arr, col):
    return map(lambda x : x[col], arr)

a = [[1,2,3,4], [5,6,7,8], [9,10,11,12],[13,14,15,16]]

print get_col(a, 3)

funkcja map w Pythonie to kolejna droga.


11
>>> x = arange(20).reshape(4,5)
>>> x array([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14],
        [15, 16, 17, 18, 19]])

jeśli chcesz drugą kolumnę możesz użyć

>>> x[:, 1]
array([ 1,  6, 11, 16])

1
To używa numpy?
Forever

1
Nie mogę znaleźć żadnej dokumentacji dla arange()Python3 poza Numpy. Ktoś?
Kevin W Matthews,


9

Operator itemgetter również może pomóc, jeśli lubisz styl python w stylu zmniejszania mapy, a nie listy ze zrozumieniem, dla małej różnorodności!

# tested in 2.4
from operator import itemgetter
def column(matrix,i):
    f = itemgetter(i)
    return map(f,matrix)

M = [range(x,x+5) for x in range(10)]
assert column(M,1) == range(1,11)

1
użyj itertools.imap dla dużych danych
Paweł Polewicz

Metoda itemgetter działała około 50 razy szybciej niż metoda porównywania listy w moim przypadku użycia. Python 2.7.2, przypadek użycia zawierał wiele iteracji na matrycy z kilkoma setkami wierszy i kolumn.
joelpt

7

Możesz również użyć tego:

values = np.array([[1,2,3],[4,5,6]])
values[...,0] # first column
#[1,4]

Uwaga: Nie działa to dla wbudowanej tablicy i nie jest wyrównane (np. Tablica np. ([[1,2,3], [4,5,6,7]]))


6

Myślę, że chcesz wyodrębnić kolumnę z tablicy, takiej jak tablica poniżej

import numpy as np
A = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])

Teraz, jeśli chcesz uzyskać trzecią kolumnę w formacie

D=array[[3],
[7],
[11]]

Następnie musisz najpierw uczynić tablicę macierzą

B=np.asmatrix(A)
C=B[:,2]
D=asarray(C)

A teraz możesz wykonywać mądre obliczenia, podobnie jak w Excelu.


1
Chociaż bardzo mi to pomogło, myślę, że odpowiedź może być znacznie krótsza: 1. A = np. Tablica ([[1,2,3,4], [5,6,7,8], [9,10, 11,12]]) 2. A [:, 1] >> tablica ([2, 6, 10])
Ufos

6

powiedzmy, że mamy n X mmacierz ( nwiersze i mkolumny), powiedzmy 5 wierszy i 4 kolumny

matrix = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16],[17,18,19,20]]

Aby wyodrębnić kolumny w pythonie, możemy użyć takiego rozumienia listy

[ [row[i] for row in matrix] for in range(4) ]

Możesz zastąpić 4 dowolną liczbą kolumn w macierzy. Wynik to

[ [1,5,9,13,17],[2,10,14,18],[3,7,11,15,19],[4,8,12,16,20] ]


Czy to tworzy zupełnie nową listę?
Kevin W Matthews,

5
array = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]]

col1 = [val[1] for val in array]
col2 = [val[2] for val in array]
col3 = [val[3] for val in array]
col4 = [val[4] for val in array]
print(col1)
print(col2)
print(col3)
print(col4)

Output:
[1, 5, 9, 13]
[2, 6, 10, 14]
[3, 7, 11, 15]
[4, 8, 12, 16]

4

Jeszcze jeden sposób korzystania z macierzy

>>> from numpy import matrix
>>> a = [ [1,2,3],[4,5,6],[7,8,9] ]
>>> matrix(a).transpose()[1].getA()[0]
array([2, 5, 8])
>>> matrix(a).transpose()[0].getA()[0]
array([1, 4, 7])

3

Jeśli masz w Pythonie dwuwymiarową tablicę (nie numpy), możesz wyodrębnić wszystkie kolumny w ten sposób,

data = [
['a', 1, 2], 
['b', 3, 4], 
['c', 5, 6]
]

columns = list(zip(*data))

print("column[0] = {}".format(columns[0]))
print("column[1] = {}".format(columns[1]))
print("column[2] = {}".format(columns[2]))

Wykonanie tego kodu da,

>>> print("column[0] = {}".format(columns[0]))
column[0] = ('a', 'b', 'c')

>>> print("column[1] = {}".format(columns[1]))
column[1] = (1, 3, 5)

>>> print("column[2] = {}".format(columns[2]))
column[2] = (2, 4, 6)

Oczywiście możesz wyodrębnić pojedynczą kolumnę według indeksu (np. columns[0])


2

Pomimo zip(*iterable)transpozycji listy zagnieżdżonej możesz użyć następujących opcji, jeśli listy zagnieżdżone różnią się długością:

map(None, *[(1,2,3,), (4,5,), (6,)])

prowadzi do:

[(1, 4, 6), (2, 5, None), (3, None, None)]

Pierwsza kolumna to:

map(None, *[(1,2,3,), (4,5,), (6,)])[0]
#>(1, 4, 6)

2

„Trochę” późno…

W przypadku, gdy wydajność ma znaczenie, a dane mają kształt prostokąta, możesz również przechowywać je w jednym wymiarze i uzyskać dostęp do kolumn poprzez regularne krojenie, np.

A = [[1,2,3,4],[5,6,7,8]]     #< assume this 4x2-matrix
B = reduce( operator.add, A ) #< get it one-dimensional

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx::dimX]

def row1d( matrix, dimX, rowIdx ):
  return matrix[rowIdx:rowIdx+dimX] 

>>> column1d( B, 4, 1 )
[2, 6]
>>> row1d( B, 4, 1 )
[2, 3, 4, 5]

Fajne jest to, że jest naprawdę szybki. Jednak ujemne indeksy tutaj nie działają! Więc nie możesz uzyskać dostępu do ostatniej kolumny lub wiersza według indeksu -1.

Jeśli potrzebujesz indeksowania ujemnego, możesz nieco dostroić funkcje akcesora, np

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx % dimX::dimX]

def row1d( matrix, dimX, dimY, rowIdx ):
  rowIdx = (rowIdx % dimY) * dimX
  return matrix[rowIdx:rowIdx+dimX]

Sprawdziłem tę metodę, a koszt pobierania kolumny jest znacznie tańszy niż zagnieżdżanie dla pętli. Jednak zmniejszenie macierzy 2d do 1d jest kosztowne, jeśli matryca jest duża, powiedzmy 1000 * 1000.
Zhongjun „Mark” Jin

2

Jeśli chcesz złapać więcej niż jedną kolumnę, po prostu użyj wycinka:

 a = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
    print(a[:, [1, 2]])
[[2 3]
[5 6]
[8 9]]

2

Wolę następną wskazówkę: nazwać macierz matrix_ai użyć column_numberna przykład:

import numpy as np
matrix_a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
column_number=2

# you can get the row from transposed matrix - it will be a column:
col=matrix_a.transpose()[column_number]

1

Wystarczy użyć transpose (), aby uzyskać kolumny tak proste, jak wiersze

matrix=np.array(originalMatrix).transpose()
print matrix[NumberOfColum]

0

Wszystkie kolumny z macierzy na nową listę:

N = len(matrix) 
column_list = [ [matrix[row][column] for row in range(N)] for column in range(N) ]
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.