Jak policzyć liczbę plików w katalogu przy użyciu Pythona


224

Muszę policzyć liczbę plików w katalogu przy użyciu Pythona.

Wydaje mi się, że najłatwiejszym sposobem jest to len(glob.glob('*')), ale sam katalog również liczy się jako plik.

Czy jest jakiś sposób na policzenie tylko plików w katalogu?


Aby pominąć katalogi, możesz zrobić „* .fileextension” dla dowolnego rozszerzenia pliku, którego szukasz.

Odpowiedzi:


275

os.listdir()będzie nieco bardziej wydajny niż używanie glob.glob. Aby sprawdzić, czy nazwa pliku jest zwykłym plikiem (a nie katalogiem lub inną jednostką), użyj os.path.isfile():

import os, os.path

# simple version for working with CWD
print len([name for name in os.listdir('.') if os.path.isfile(name)])

# path joining version for other paths
DIR = '/tmp'
print len([name for name in os.listdir(DIR) if os.path.isfile(os.path.join(DIR, name))])

14
Pamiętaj, aby dodać folder_pathwnętrze, os.path.filename(name)jeśli nie jesteś na cwd. stackoverflow.com/questions/17893542/…
Rafael Oliveira

1
To nie liczy pliku w zagnieżdżonych folderach.
codersofthedark

5
W przypadku rekurencyjnego zliczania plików zagnieżdżonych w katalogach lepiej byłoby skorzystać z rozwiązania os.walk ().
Joel B,

Jakie są korzyści z korzystania os.path.join(DIR, name)przez DIR + '/' + name? Ten drugi jest krótszy i, według IMO, wyraźniejszy niż ten pierwszy. Czy jest może jakiś system operacyjny, na którym ten ostatni zawiedzie?
HelloGoodbye,

@HelloGoodbye To jest dokładnie powód.
ellockie


48

Dla wszystkich rodzajów plików zawarte są podkatalogi:

import os

list = os.listdir(dir) # dir is your directory path
number_files = len(list)
print number_files

Tylko pliki (unikając podkatalogów):

import os

onlyfiles = next(os.walk(dir))[2] #dir is your directory path as string
print len(onlyfiles)

To nie jest rekurencyjne
Kyle Bridenstine

32

Tutaj bardzo przydatny jest program fnmatch:

import fnmatch

print len(fnmatch.filter(os.listdir(dirpath), '*.txt'))

Więcej informacji: http://docs.python.org/2/library/fnmatch.html


3
Jest to o wiele szybsze (mniej więcej połowa czasu, gdy testuję katalog z 10 000 plików), jeśli znasz wzorzec, którego szukasz, zamiast testować każdy plik os.path.isfile()zgodnie z przyjętą odpowiedzią. Również znacznie szybszy niż glob.glob().
CivFan 27.04.16

14

Jeśli chcesz policzyć wszystkie pliki w katalogu - w tym pliki w podkatalogach, najbardziej pythonowym sposobem jest:

import os

file_count = sum(len(files) for _, _, files in os.walk(r'C:\Dropbox'))
print(file_count)

Używamy sumy, która jest szybsza niż jawne dodawanie liczników plików (czas oczekiwania


1
Cześć, próbowałem zrozumieć ten kod (kod działa idealnie), wiem, że możemy użyć _w forpętli. os.walkja też wiem. Ale nie jestem pewien, co się dzieje z podkreśleniami wewnątrz sumfunkcji, czy mógłbyś to rozwinąć. Dzięki!
Ejaz

1
Unsderscore to po prostu nazwa zmiennej @Ejaz, zgodnie z konwencją używaną, gdy ignorujemy zmienną - to właśnie tutaj robimy - nazywamy walk i liczymy tylko liczbę plików w każdym katalogu, ignorując wartości zwracane przez root i dirs walk
Mr_and_Mrs_D

12
import os
print len(os.listdir(os.getcwd()))

2
Czasami może się to przydać, ale obejmuje również podkatalogi
Brian Burns

10
def directory(path,extension):
  list_dir = []
  list_dir = os.listdir(path)
  count = 0
  for file in list_dir:
    if file.endswith(extension): # eg: '.txt'
      count += 1
  return count


7

To używa os.listdiri działa dla dowolnego katalogu:

import os
directory = 'mydirpath'

number_of_files = len([item for item in os.listdir(directory) if os.path.isfile(os.path.join(directory, item))])

można to uprościć za pomocą generatora i nieco przyspieszyć za pomocą:

import os
isfile = os.path.isfile
join = os.path.join

directory = 'mydirpath'
number_of_files = sum(1 for item in os.listdir(directory) if isfile(join(directory, item)))

5
def count_em(valid_path):
   x = 0
   for root, dirs, files in os.walk(valid_path):
       for f in files:
            x = x+1
print "There are", x, "files in this directory."
return x

Zaczerpnięte z tego postu


2
1. filesjest listą. 2. OP nie szuka rekurencyjnego liczenia
SilentGhost

4
import os

def count_files(in_directory):
    joiner= (in_directory + os.path.sep).__add__
    return sum(
        os.path.isfile(filename)
        for filename
        in map(joiner, os.listdir(in_directory))
    )

>>> count_files("/usr/lib")
1797
>>> len(os.listdir("/usr/lib"))
2049

4

Formatowanie kodu Luke'a.

import os

print len(os.walk('/usr/lib').next()[2])

4

Oto proste polecenie w jednym wierszu, które uznałem za przydatne:

print int(os.popen("ls | wc -l").read())

Analizowanie wyniku lsjest na ogół niezadowolone (może często powodować problemy), chociaż nie jest to zła metoda „szybkiego i brudnego” w powłoce. Powinieneś jednak użyć ls -1, więc gwarantuje to jeden wiersz na plik.
Bloodgain

3

Chociaż zgadzam się z odpowiedzią udzieloną przez @DanielStutzbach: os.listdir()będzie nieco bardziej wydajna niż używanie glob.glob.

Jednak dodatkową precyzję, jeśli chcesz policzyć liczbę określonych plików w folderze, chcesz użyć len(glob.glob()). Na przykład, jeśli chcesz policzyć wszystkie pliki pdf w folderze, którego chcesz użyć:

pdfCounter = len(glob.glob1(myPath,"*.pdf"))

2

To jest proste:

print(len([iq for iq in os.scandir('PATH')]))

po prostu zlicza liczbę plików w katalogu, użyłem techniki rozumienia listy do iteracji przez określony katalog zwracając wszystkie pliki w zamian. „len (lista zwrócona)” zwraca liczbę plików.


1
Witamy w Stack Overflow. Jakość tej odpowiedzi można poprawić, dodając wyjaśnienie: Jak odpowiedzieć
Elletlar,

1
Dziękuję Elletlar, zredagowałem swoją odpowiedź, postaram się odpowiedzieć w bardziej wyczerpujący sposób: D
Agha Saad

1
import os

total_con=os.listdir('<directory path>')

files=[]

for f_n in total_con:
   if os.path.isfile(f_n):
     files.append(f_n)


print len(files)

OP poprosił o liczbę plików , zawiera również katalogi.
Korem

1

Jeśli będziesz używać standardowej powłoki systemu operacyjnego, możesz uzyskać wynik znacznie szybciej niż w czysto pythoniczny sposób.

Przykład dla systemu Windows:

import os
import subprocess

def get_num_files(path):
    cmd = 'DIR \"%s\" /A-D /B /S | FIND /C /V ""' % path
    return int(subprocess.check_output(cmd, shell=True))

1
Ale to nie będzie tak przenośne.
Politank-Z

1

Znalazłem inną odpowiedź, która może być poprawna jako odpowiedź zaakceptowana.

for root, dirs, files in os.walk(input_path):    
for name in files:
    if os.path.splitext(name)[1] == '.TXT' or os.path.splitext(name)[1] == '.txt':
        datafiles.append(os.path.join(root,name)) 


print len(files) 

0

Użyłem glob.iglobstruktury katalogów podobnej do

data
└───train
   └───subfolder1
   |      file111.png
   |      file112.png
   |      ...
   |
   └───subfolder2
          file121.png
          file122.png
          ...
└───test
       file221.png
       file222.png

Obie następujące opcje zwracają 4 (zgodnie z oczekiwaniami, tzn. Nie liczą samych podfolderów )

  • len(list(glob.iglob("data/train/*/*.png", recursive=True)))
  • sum(1 for i in glob.iglob("data/train/*/*.png"))

0

zrobiłem to i to zwróciło liczbę plików w folderze (Attack_Data) ... to działa dobrze.

import os
def fcount(path):
    #Counts the number of files in a directory
    count = 0
    for f in os.listdir(path):
        if os.path.isfile(os.path.join(path, f)):
            count += 1

    return count
path = r"C:\Users\EE EKORO\Desktop\Attack_Data" #Read files in folder
print (fcount(path))
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.