Jak wydrukować pełną tablicę NumPy bez obcięcia?

587

Kiedy drukuję tablicę numpy, otrzymuję obciętą reprezentację, ale chcę pełną tablicę.

Czy jest na to sposób?

Przykłady:

>>> numpy.arange(10000)
array([   0,    1,    2, ..., 9997, 9998, 9999])

>>> numpy.arange(10000).reshape(250,40)
array([[   0,    1,    2, ...,   37,   38,   39],
       [  40,   41,   42, ...,   77,   78,   79],
       [  80,   81,   82, ...,  117,  118,  119],
       ..., 
       [9880, 9881, 9882, ..., 9917, 9918, 9919],
       [9920, 9921, 9922, ..., 9957, 9958, 9959],
       [9960, 9961, 9962, ..., 9997, 9998, 9999]])

— Kame
źródło

18

Czy istnieje sposób na zrobienie tego jednorazowo? To znaczy, aby wydrukować pełne wyjście raz, ale nie w innym momencie w skrypcie?

— tumultous_rooster

4

@Matt O'Brien patrz odpowiedź ZSG poniżej

— użytkownik2398029

6

Czy możesz zmienić przyjętą odpowiedź na zalecającą np.inf? np.nani 'nan'działają tylko według total fluke, a 'nan'nawet nie działają w Pythonie 3, ponieważ zmieniono implementację porównania mieszanego typu, która threshold='nan'zależała od.

— użytkownik2357112 obsługuje Monikę

1

( threshold=np.nanzamiast 'nan'zależeć od innej fuksji, która polega na tym, że logika drukowania macierzy porównuje rozmiar macierzy z progiem a.size > _summaryThreshold. To zawsze wraca Falsedo _summaryThreshold=np.nan. Gdyby porównanie było a.size <= _summaryThreshold, testowanie, czy tablica powinna być w pełni wydrukowana zamiast testowania, czy powinna podsumowując, ten próg uruchomiłby podsumowanie dla wszystkich tablic.)

— user2357112 obsługuje Monikę

4

Jedyny w swoim rodzaju sposób: jeśli masz tmptylko numpy.array list(tmp). Inne opcje z innym formatowaniem są tmp.tolist()dla większej kontroli print("\n".join(str(x) for x in tmp)).

— travc

626

Użyj numpy.set_printoptions:

import sys
import numpy
numpy.set_printoptions(threshold=sys.maxsize)

— Raja Selvaraj
źródło

2

jeśli chcesz wydrukować numpytablicę tylko raz, niestety to rozwiązanie ma tę wadę, że wymaga zresetowania tej zmiany konfiguracji po wydrukowaniu.

— Trevor Boyd Smith

1

@TrevorBoydSmith, czy wiesz, jak zresetować ten parametr po wydruku?

— ColinMac

1

@ColinMac patrz stackoverflow.com/a/24542498/52074, gdzie zapisuje ustawienia. wykonuje operację. następnie przywraca ustawienia.

— Trevor Boyd Smith

1

Jak przywrócić go do normy?

— Gulzar

czy jest jakiś sposób, aby ręcznie wprowadzić rozmiar progowy?

— Amar Kumar,

225

import numpy as np
np.set_printoptions(threshold=np.inf)

Sugeruję używanie np.infzamiast tego, np.nanco sugerują inni. Oba działają dla twojego celu, ale ustawiając próg na „nieskończoność”, każdy odczytuje twój kod, co masz na myśli. Próg „nie liczby” wydaje mi się trochę niejasny.

— PaulMag
źródło

15

Jaka jest odwrotna operacja tego? Jak wrócić do poprzedniego ustawienia (z kropkami)?

— Karlo,

9

@Karlo Domyślna liczba to 1000, więc np.set_printoptions(threshold=1000)przywróci domyślne zachowanie. Ale możesz ustawić ten próg tak nisko lub wysoko, jak chcesz. np.set_printoptions(threshold=np.inf)po prostu zmienia maksymalny rozmiar drukowanej tablicy, zanim zostanie obcięta do nieskończoności, dzięki czemu nigdy nie zostanie obcięta bez względu na to, jak duża. Jeśli ustawisz próg na dowolną liczbę rzeczywistą, będzie to maksymalny rozmiar.

— PaulMag

8

Jest to nie tylko wyraźniejsze, ale także znacznie mniej kruche. Nie ma żadnego specjalnego postępowania dla np.inf, np.nanlub 'nan'. Cokolwiek tam umieścisz, NumPy nadal będzie używać zwykłego, >aby porównać rozmiar tablicy z twoim progiem. np.nandziała tylko dlatego, że jest a.size > _summaryThresholdzamiast a.size <= _summaryThresholdi np.nanzwraca Falsewszystkie porównania >/ </ >=/ <=. 'nan'działa tylko z powodu delikatnych szczegółów implementacji mieszanej logiki porównawczej Python 2; psuje się całkowicie w Pythonie 3.

— user2357112 obsługuje Monikę

2

Użyj sys.maxsize, ponieważ wartość jest udokumentowana jako int

— mattip

2

Aby poprawnie odpowiedzieć na pytanie @ Karlo, zwróć uwagę, że początkowa wartość progu opcji drukowania znajduje się w np.get_printoptions()['threshold']. Możesz zapisać tę wartość przed ustawieniem progu, a następnie przywrócić ją później (lub użyć withbloku, jak sugerowano w innych odpowiedziach).

— Ninjakannon

94

Poprzednie odpowiedzi są prawidłowe, ale jako słabszą alternatywę możesz przekształcić się w listę:

>>> numpy.arange(100).reshape(25,4).tolist()

[[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11], [12, 13, 14, 15], [16, 17, 18, 19], [20, 21,
22, 23], [24, 25, 26, 27], [28, 29, 30, 31], [32, 33, 34, 35], [36, 37, 38, 39], [40, 41,
42, 43], [44, 45, 46, 47], [48, 49, 50, 51], [52, 53, 54, 55], [56, 57, 58, 59], [60, 61,
62, 63], [64, 65, 66, 67], [68, 69, 70, 71], [72, 73, 74, 75], [76, 77, 78, 79], [80, 81,
82, 83], [84, 85, 86, 87], [88, 89, 90, 91], [92, 93, 94, 95], [96, 97, 98, 99]]

— Anoyz
źródło

14

To wydaje się być najlepszym jednorazowym sposobem, aby zobaczyć pełną tablicę w instrukcji print.

— Aaron Bramson

@AaronBramson Zgadzam się ... jest to mniej podatne na błędy, gdy potrzebujesz tylko jednej instrukcji drukowania (jeden wiersz kodu zamiast 3 wierszy dla: zmień konfigurację, wydrukuj, zresetuj konfigurację).

— Trevor Boyd Smith

Podoba mi się, że drukuje separatory przecinków

— ObviousChild

57

NumPy 1.15 lub nowszy

Jeśli używasz NumPy 1.15 (wydany 2018-07-23) lub nowszego, możesz użyć printoptionsmenedżera kontekstu:

with numpy.printoptions(threshold=numpy.inf):
    print(arr)

(oczywiście zastąpić numpyprzez npjeśli to jak importowane numpy)

Zastosowanie menedżera kontekstu ( with-block) zapewnia, że po zakończeniu menedżera kontekstu opcje drukowania powrócą do tego, co były przed rozpoczęciem bloku. Zapewnia to, że ustawienie jest tymczasowe i dotyczy tylko kodu w bloku.

Zobacz numpy.printoptionsdokumentację, aby uzyskać szczegółowe informacje na temat menedżera kontekstu i innych obsługiwanych przez niego argumentów.

— gerrit
źródło

41

To brzmi jak używasz numpy.

W takim przypadku możesz dodać:

import numpy as np
np.set_printoptions(threshold=np.nan)

To wyłączy drukowanie w rogu. Aby uzyskać więcej informacji, zobacz ten samouczek NumPy .

— Reed Copsey
źródło

4

ValueError: threshold must be numeric and non-NAN, try sys.maxsize for untruncated representation

— Eric

Tak, ta część oficjalnego samouczka Numpy jest nieprawidłowa

— aderchox

36

Oto jednorazowy sposób na zrobienie tego, co jest przydatne, jeśli nie chcesz zmieniać ustawień domyślnych:

def fullprint(*args, **kwargs):
  from pprint import pprint
  import numpy
  opt = numpy.get_printoptions()
  numpy.set_printoptions(threshold=numpy.inf)
  pprint(*args, **kwargs)
  numpy.set_printoptions(**opt)

— ZSG
źródło

13

Wygląda na to, że byłoby to dobre miejsce na użycie menedżera kontekstu, więc możesz powiedzieć „z pełnym nadrukiem”.

— Paul Price

8

Nie używać 'nan', np.nanlub któregokolwiek z powyższych. To nie jest obsługiwane, a ta zła rada powoduje ból dla osób przechodzących na python 3

— Eric

1

@ZSG Zamień wiersz 5 nanumpy.set_printoptions(threshold=numpy.inf)

— Nirmal,

Dzięki @Nirmal, edytowałem odpowiedź z 2014 roku, więc działa dzisiaj.

— Paul Rougieux

31

Używanie menedżera kontekstu, gdy Paul Price podstępnie

import numpy as np


class fullprint:
    'context manager for printing full numpy arrays'

    def __init__(self, **kwargs):
        kwargs.setdefault('threshold', np.inf)
        self.opt = kwargs

    def __enter__(self):
        self._opt = np.get_printoptions()
        np.set_printoptions(**self.opt)

    def __exit__(self, type, value, traceback):
        np.set_printoptions(**self._opt)


if __name__ == '__main__': 
    a = np.arange(1001)

    with fullprint():
        print(a)

    print(a)

    with fullprint(threshold=None, edgeitems=10):
        print(a)

— neok
źródło

7

Ten menedżer kontekstu jest wbudowany w numpy 1.15, dzięki github.com/numpy/numpy/pull/10406 , pod nazwąnp.printoptions

— Eric

13

numpy.savetxt

numpy.savetxt(sys.stdout, numpy.arange(10000))

lub jeśli potrzebujesz łańcucha:

import StringIO
sio = StringIO.StringIO()
numpy.savetxt(sio, numpy.arange(10000))
s = sio.getvalue()
print s

Domyślny format wyjściowy to:

0.000000000000000000e+00
1.000000000000000000e+00
2.000000000000000000e+00
3.000000000000000000e+00
...

i może być skonfigurowany z dalszymi argumentami.

Zwróć uwagę w szczególności, że nie pokazuje to również nawiasów kwadratowych i pozwala na wiele dostosowań, jak wspomniano w: Jak wydrukować tablicę Numpy bez nawiasów?

Testowane na Pythonie 2.7.12, numpy 1.11.1.

— Ciro Santilli
źródło

1

niewielką wadą tej metody jest to, że działa tylko z tablicami 1d i 2d

— Fnord

@ Dzięki dzięki za te informacje, daj mi znać, jeśli znajdziesz obejście!

— Ciro Santilli 郝海东冠状病六四事件法轮功

10

Jest to niewielka modyfikacja (usunięto opcję przekazywania dodatkowych argumentów do set_printoptions)odpowiedzi neoka .

Pokazuje, jak można contextlib.contextmanagerłatwo utworzyć takiego menedżera kontekstu z mniejszą liczbą wierszy kodu:

import numpy as np
from contextlib import contextmanager

@contextmanager
def show_complete_array():
    oldoptions = np.get_printoptions()
    np.set_printoptions(threshold=np.inf)
    try:
        yield
    finally:
        np.set_printoptions(**oldoptions)

W twoim kodzie można go użyć w następujący sposób:

a = np.arange(1001)

print(a)      # shows the truncated array

with show_complete_array():
    print(a)  # shows the complete array

print(a)      # shows the truncated array (again)

— MSeifert
źródło

1

Zawsze powinieneś umieścić try/ finallywokół yieldmenedżera kontekstu, aby czyszczenie odbywało się bez względu na wszystko.

— Eric

1

@Eric rzeczywiście. Dziękuję za pomocny komentarz i zaktualizowałem odpowiedź.

— MSeifert,

W wersji 1.15 można to przeliterowaćwith np.printoptions(threshold=np.inf):

— Eric

6

W uzupełnieniu do tej odpowiedzi z maksymalnej liczby kolumn (ustalonych za pomocą numpy.set_printoptions(threshold=numpy.nan)) istnieje również limit znaków do wyświetlenia. W niektórych środowiskach, takich jak wywoływanie Pythona z bash (zamiast sesji interaktywnej), można to naprawić, ustawiając parametr linewidthw następujący sposób.

import numpy as np
np.set_printoptions(linewidth=2000)    # default = 75
Mat = np.arange(20000,20150).reshape(2,75)    # 150 elements (75 columns)
print(Mat)

W takim przypadku twoje okno powinno ograniczyć liczbę znaków do zawinięcia linii.

Dla tych, którzy używają wzniosłego tekstu i chcą zobaczyć wyniki w oknie wyjściowym, należy dodać opcję kompilacji "word_wrap": falsedo pliku wzniosłej kompilacji [ źródło ].

— Traxidus Wolf
źródło

4

Od wersji NumPy 1.16 więcej informacji można znaleźć na bilecie GitHub 12251 .

from sys import maxsize
from numpy import set_printoptions

set_printoptions(threshold=maxsize)

— Velizar VESSELINOV
źródło

4

Aby go wyłączyć i powrócić do normalnego trybu

np.set_printoptions(threshold=False)

— ewalel
źródło

Działa dla mnie (Jupyter python wersja 3). Możesz wypróbować poniższy kod. Zgodnie z oficjalną dokumentacją poniższy kod powinien przywrócić domyślne opcje. Co też mi zrobiło. > np.set_printoptions (edgeitems = 3, infstr = 'inf', linewidth = 75, nanstr = 'nan', precyzja = 8, pomijanie = Fałsz, próg = 1000, formater = Brak)

— ewalel

Okej, to pewnie dlatego, że nie używam Jupytera. Jednak zaakceptowana odpowiedź działa dla mnie w czystym środowisku Pythona.

— Mathyou,

Oznacza to threshold=0, co oznacza „obcinaj tak szybko, jak to możliwe” - wcale nie to, czego chcesz.

— Eric

2

Załóżmy, że masz tablicę numpy

 arr = numpy.arange(10000).reshape(250,40)

Jeśli chcesz wydrukować pełną tablicę w sposób jednorazowy (bez przełączania np.set_printoptions), ale chcesz czegoś prostszego (mniej kodu) niż menedżer kontekstu, po prostu zrób

for row in arr:
     print row

— Mike Wojnowicz
źródło

2

Drobna modyfikacja: (ponieważ zamierzasz wydrukować ogromną listę)

import numpy as np
np.set_printoptions(threshold=np.inf, linewidth=200)

x = np.arange(1000)
print(x)

Zwiększy to liczbę znaków w wierszu (domyślna szerokość linii 75). Użyj dowolnej wartości szerokości linii, która odpowiada Twojemu środowisku kodowania. Dzięki temu nie będziesz musiał przechodzić przez ogromną liczbę linii wyjściowych, dodając więcej znaków w linii.

— Gayal Kuruppu
źródło

1

Możesz użyć array2stringfunkcji - docs .

a = numpy.arange(10000).reshape(250,40)
print(numpy.array2string(a, threshold=numpy.nan, max_line_width=numpy.nan))
# [Big output]

— Szymon Zmilczak
źródło

ValueError: threshold must be numeric and non-NAN, try sys.maxsize for untruncated representation

— Eric

1

Nie zawsze chcesz wydrukować wszystkie elementy, szczególnie w przypadku dużych tablic.

Prosty sposób, aby pokazać więcej przedmiotów:

In [349]: ar
Out[349]: array([1, 1, 1, ..., 0, 0, 0])

In [350]: ar[:100]
Out[350]:
array([1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 1,
       1, 1, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1])

Domyślnie działa dobrze, gdy tablica podzielona na <1000.

— Robin Qiu
źródło

0

Jeśli masz dostępne pandy,

    numpy.arange(10000).reshape(250,40)
    print(pandas.DataFrame(a).to_string(header=False, index=False))

unika efektu ubocznego wymagającego resetu numpy.set_printoptions(threshold=sys.maxsize)i nie dostajesz numpy.array i nawiasów. Uważam to za wygodne do zrzucania szerokiej tablicy do pliku dziennika

— Ben
źródło

-1

Jeśli tablica jest zbyt duża, aby ją wydrukować, NumPy automatycznie pomija środkową część tablicy i drukuje tylko rogi: Aby wyłączyć to zachowanie i zmusić NumPy do wydrukowania całej tablicy, możesz zmienić opcje drukowania za pomocą set_printoptions.

>>> np.set_printoptions(threshold='nan')

lub

>>> np.set_printoptions(edgeitems=3,infstr='inf',
... linewidth=75, nanstr='nan', precision=8,
... suppress=False, threshold=1000, formatter=None)

Możesz także skorzystać z dokumentacji numpy w dokumentacji numpy dla „lub części”, aby uzyskać dodatkową pomoc.

— Arshdeep Singh
źródło

3

Nie używać 'nan', np.nanlub któregokolwiek z powyższych. To nie jest obsługiwane, a ta zła rada powoduje ból dla osób przechodzących na python 3

— Eric

ValueError: threshold must be numeric and non-NAN, try sys.maxsize for untruncated representation

— Eric