Iteracja w zakresie dat w Pythonie


367

Mam następujący kod, aby to zrobić, ale jak mogę to zrobić lepiej? W tej chwili myślę, że to lepsze niż zagnieżdżone pętle, ale zaczyna mieć Perl-one-linerish, gdy masz generator w zrozumieniu listy.

day_count = (end_date - start_date).days + 1
for single_date in [d for d in (start_date + timedelta(n) for n in range(day_count)) if d <= end_date]:
    print strftime("%Y-%m-%d", single_date.timetuple())

Notatki

  • Nie używam tego do drukowania. To tylko do celów demonstracyjnych.
  • start_dateI end_datezmienne datetime.dateobiektów, ponieważ nie muszę timestampów. (Zostaną wykorzystane do wygenerowania raportu).

Przykładowe dane wyjściowe

Dla daty początkowej 2009-05-30i końcowej 2009-06-09:

2009-05-30
2009-05-31
2009-06-01
2009-06-02
2009-06-03
2009-06-04
2009-06-05
2009-06-06
2009-06-07
2009-06-08
2009-06-09

3
Wystarczy wskazać: nie sądzę, aby istniała różnica między „time.strftime („% Y-% m-% d ”, single_date.timetuple ())” a krótszym „single_date.strftime („% Y-% m-% d ")”. Większość odpowiedzi wydaje się kopiować dłuższy styl.
Mu Mind

8
Wow, te odpowiedzi są zbyt skomplikowane. Spróbuj tego: stackoverflow.com/questions/7274267/…
Gringo Suave

@GringoSuave: co jest skomplikowanego w odpowiedzi Seana Cavanagha ?
jfs

Zastosowanie: oszukiwać w
pasmach

1
Zduplikowane czy nie, na drugiej stronie znajdziesz prostszą odpowiedź.
Gringo Suave,

Odpowiedzi:


552

Dlaczego są dwie zagnieżdżone iteracje? Dla mnie tworzy tę samą listę danych z tylko jedną iteracją:

for single_date in (start_date + timedelta(n) for n in range(day_count)):
    print ...

I żadna lista nie jest przechowywana, tylko jeden generator jest iterowany. Także „if” w generatorze wydaje się niepotrzebne.

W końcu sekwencja liniowa powinna wymagać tylko jednego iteratora, a nie dwóch.

Zaktualizuj po dyskusji z Johnem Machinem:

Być może najbardziej eleganckim rozwiązaniem jest użycie funkcji generatora, aby całkowicie ukryć / wyodrębnić iterację w zakresie dat:

from datetime import timedelta, date

def daterange(start_date, end_date):
    for n in range(int ((end_date - start_date).days)):
        yield start_date + timedelta(n)

start_date = date(2013, 1, 1)
end_date = date(2015, 6, 2)
for single_date in daterange(start_date, end_date):
    print(single_date.strftime("%Y-%m-%d"))

Uwaga: Aby zachować spójność z wbudowaną range()funkcją, iteracja zatrzymuje się przed osiągnięciem end_date. Tak więc w celu włączenia iteracji użyj następnego dnia, tak jak zrobiłbyś to range().


4
-1 ... wstępne obliczenie liczby dni i użycie zakresu nie jest niesamowite, gdy wystarczy prosta pętla while.
John Machin

7
@John Machin: OK. Wykonuję jednak iterację przed pętlami while z wyraźnym przyrostem wartości licznika lub wartości. Wzorzec interakcji jest bardziej pythonowy (przynajmniej moim osobistym zdaniem), a także bardziej ogólny, ponieważ pozwala wyrazić iterację, ukrywając szczegóły tego, jak ta iteracja jest wykonywana.
Ber

10
@ Ber: W ogóle mi się nie podoba; jest podwójnie źle. JUŻ JUŻ miałeś iterację! Zawinięcie w generatorze skarg, których dotyczy skarga, dodało jeszcze więcej narzutów związanych z wykonywaniem, a także odciągnęło uwagę użytkownika od innego miejsca, aby przeczytać kod 3-liniowy i / lub dokumenty. -2
John Machin

8
@John Machin: Nie zgadzam się. Nie chodzi o zmniejszenie liczby linii do absolutnego minimum. W końcu nie mówimy tutaj o Perlu. Ponadto mój kod wykonuje tylko jedną iterację (tak działa generator, ale chyba o tym wiesz). *** Chodzi mi o abstrakcyjne koncepcje ponownego użycia i zrozumiały kod. Uważam, że jest to o wiele bardziej opłacalne niż posiadanie możliwie najkrótszego kodu.
Ber

9
Jeśli szukasz zwięzłości, możesz użyć wyrażenia generatora:(start_date + datetime.timedelta(n) for n in range((end_date - start_date).days))
Mark Ransom

219

Może to być bardziej jasne:

from datetime import date, timedelta

start_date = date(2019, 1, 1)
end_date = date(2020, 1, 1)
delta = timedelta(days=1)
while start_date <= end_date:
    print (start_date.strftime("%Y-%m-%d"))
    start_date += delta

3
Bardzo jasne i krótkie, ale nie działa dobrze, jeśli chcesz używać kontynuuj
rslite

działa pięknie w moim przypadku użycia
doomdaam

169

Użyj dateutilbiblioteki:

from datetime import date
from dateutil.rrule import rrule, DAILY

a = date(2009, 5, 30)
b = date(2009, 6, 9)

for dt in rrule(DAILY, dtstart=a, until=b):
    print dt.strftime("%Y-%m-%d")

Ta biblioteka Pythona ma wiele bardziej zaawansowanych funkcji, z których niektóre są bardzo przydatne, takie jak relative deltas - i jest zaimplementowana jako pojedynczy plik (moduł), który łatwo można dołączyć do projektu.


3
Należy pamiętać, że ostateczna data w pętli for jest tutaj włącznie z untilnatomiast ostateczna data daterangemetody w odpowiedzi Bera jest wyłącznym od end_date.
Ninjakannon

bardziej nowoczesne dokumenty dateutil.readthedocs.io/en/stable/rrule.html
qwr

77

Pandy świetnie nadają się do szeregów czasowych i mają bezpośrednie wsparcie dla zakresów dat.

import pandas as pd
daterange = pd.date_range(start_date, end_date)

Następnie można zapętlić pętlę, aby wydrukować datę:

for single_date in daterange:
    print (single_date.strftime("%Y-%m-%d"))

Ma również wiele opcji ułatwiających życie. Na przykład, jeśli chcesz tylko dni powszednie, po prostu zamienisz na bdate_range. Zobacz http://pandas.pydata.org/pandas-docs/stable/timeseries.html#generating-ranges-of-timestamps

Moc Pandas to tak naprawdę ramki danych, które obsługują operacje wektoryzowane (podobnie jak numpy), dzięki czemu operacje na dużych ilościach danych są bardzo szybkie i łatwe.

EDYCJA: Możesz również całkowicie pominąć pętlę for i po prostu wydrukować ją bezpośrednio, co jest łatwiejsze i bardziej wydajne:

print(daterange)

„bardzo jak numpy” - Pandy są zbudowane na numpy: P
Zach Saucier

15
import datetime

def daterange(start, stop, step=datetime.timedelta(days=1), inclusive=False):
  # inclusive=False to behave like range by default
  if step.days > 0:
    while start < stop:
      yield start
      start = start + step
      # not +=! don't modify object passed in if it's mutable
      # since this function is not restricted to
      # only types from datetime module
  elif step.days < 0:
    while start > stop:
      yield start
      start = start + step
  if inclusive and start == stop:
    yield start

# ...

for date in daterange(start_date, end_date, inclusive=True):
  print strftime("%Y-%m-%d", date.timetuple())

Ta funkcja robi więcej niż jest to ściśle wymagane, obsługując krok ujemny itp. Tak długo, jak uwzględnisz logikę zakresu, nie potrzebujesz osobnego day_counti, co najważniejsze, kod staje się łatwiejszy do odczytania, gdy wywołujesz funkcję z wielu miejsca.


Dzięki, przemianowanym w celu ściślejszego dopasowania parametrów zakresu, zapomniałem zmienić ciało.

+1 ... ale ponieważ zezwalasz, aby krok był timedelta, powinieneś (a) nazwać go dateTIMErange () i sprawić, aby kroki np. Timedelta (godziny = 12) i timedelta (godziny = 36) działały poprawnie lub ( b) pułapki kroków, które nie są całkowitą liczbą dni lub (c) oszczędzają dzwoniącemu kłopotów i wyrażają krok jako liczbę dni zamiast timedelta.
John Machin

Każda timedelta powinna już działać, ale dodałem datetime_range i date_range do mojej osobistej kolekcji złomu po napisaniu tego, z powodu (a). Nie jestem pewien, czy inna funkcja jest warta (c), najczęstszy przypadek dni = 1 jest już załatwiony, a konieczność podania wyraźnej timedelty pozwala uniknąć zamieszania. Być może przesyłanie go gdzieś jest najlepsze: bitbucket.org/kniht/scraps/src/tip/python/gen_range.py

aby to działało w przyrostach innych niż dni, powinieneś sprawdzić w stosunku do step.total_seconds (), a nie step.days
amohr

12

To najbardziej czytelne dla człowieka rozwiązanie, jakie mogę wymyślić.

import datetime

def daterange(start, end, step=datetime.timedelta(1)):
    curr = start
    while curr < end:
        yield curr
        curr += step

11

Dlaczego nie spróbować:

import datetime as dt

start_date = dt.datetime(2012, 12,1)
end_date = dt.datetime(2012, 12,5)

total_days = (end_date - start_date).days + 1 #inclusive 5 days

for day_number in range(total_days):
    current_date = (start_date + dt.timedelta(days = day_number)).date()
    print current_date

7

arangeFunkcję Numpy można zastosować do dat:

import numpy as np
from datetime import datetime, timedelta
d0 = datetime(2009, 1,1)
d1 = datetime(2010, 1,1)
dt = timedelta(days = 1)
dates = np.arange(d0, d1, dt).astype(datetime)

Zastosowanie astypeto do konwersji numpy.datetime64na tablicę datetime.datetimeobiektów.


Super szczupła konstrukcja! Ostatnia linia działa dla mnie zdates = np.arange(d0, d1, dt).astype(datetime.datetime)
pyano

+1 za opublikowanie ogólnego rozwiązania jednowierszowego, które pozwala na dowolną timedelta, zamiast stałego zaokrąglonego kroku, takiego jak godzina / minuta /…
F.Raab

7

Pokaż ostatnie n dni od dzisiaj:

import datetime
for i in range(0, 100):
    print((datetime.date.today() + datetime.timedelta(i)).isoformat())

Wynik:

2016-06-29
2016-06-30
2016-07-01
2016-07-02
2016-07-03
2016-07-04

Dodaj okrągłe nawiasy klamrowe, takie jakprint((datetime.date.today() + datetime.timedelta(i)).isoformat())
TitanFighter

@ TitanFighter prosimy o edycję, zaakceptuję je.
user1767754

2
Próbowałem. Edycja wymaga minimum 6 znaków, ale w tym przypadku konieczne jest dodanie tylko 2 znaków, „(” i „)”
TitanFighter 21.01.2018

print((datetime.date.today() + datetime.timedelta(i)))bez .isoformat () daje dokładnie taki sam wynik. Potrzebuję mojego skryptu, aby wydrukować RRMMDD. Czy ktoś wie jak to zrobić?
mr.zog

Po prostu zrób to w pętli for zamiast instrukcji printd = datetime.date.today() + datetime.timedelta(i); d.strftime("%Y%m%d")
user1767754

5
import datetime

def daterange(start, stop, step_days=1):
    current = start
    step = datetime.timedelta(step_days)
    if step_days > 0:
        while current < stop:
            yield current
            current += step
    elif step_days < 0:
        while current > stop:
            yield current
            current += step
    else:
        raise ValueError("daterange() step_days argument must not be zero")

if __name__ == "__main__":
    from pprint import pprint as pp
    lo = datetime.date(2008, 12, 27)
    hi = datetime.date(2009, 1, 5)
    pp(list(daterange(lo, hi)))
    pp(list(daterange(hi, lo, -1)))
    pp(list(daterange(lo, hi, 7)))
    pp(list(daterange(hi, lo, -7))) 
    assert not list(daterange(lo, hi, -1))
    assert not list(daterange(hi, lo))
    assert not list(daterange(lo, hi, -7))
    assert not list(daterange(hi, lo, 7)) 


4

Dla kompletności Panda ma również period_rangefunkcję znaczników czasu, które są poza zakresem:

import pandas as pd

pd.period_range(start='1/1/1626', end='1/08/1627', freq='D')

3

Mam podobny problem, ale muszę iterować co miesiąc zamiast codziennie.

To jest moje rozwiązanie

import calendar
from datetime import datetime, timedelta

def days_in_month(dt):
    return calendar.monthrange(dt.year, dt.month)[1]

def monthly_range(dt_start, dt_end):
    forward = dt_end >= dt_start
    finish = False
    dt = dt_start

    while not finish:
        yield dt.date()
        if forward:
            days = days_in_month(dt)
            dt = dt + timedelta(days=days)            
            finish = dt > dt_end
        else:
            _tmp_dt = dt.replace(day=1) - timedelta(days=1)
            dt = (_tmp_dt.replace(day=dt.day))
            finish = dt < dt_end

Przykład 1

date_start = datetime(2016, 6, 1)
date_end = datetime(2017, 1, 1)

for p in monthly_range(date_start, date_end):
    print(p)

Wynik

2016-06-01
2016-07-01
2016-08-01
2016-09-01
2016-10-01
2016-11-01
2016-12-01
2017-01-01

Przykład nr 2

date_start = datetime(2017, 1, 1)
date_end = datetime(2016, 6, 1)

for p in monthly_range(date_start, date_end):
    print(p)

Wynik

2017-01-01
2016-12-01
2016-11-01
2016-10-01
2016-09-01
2016-08-01
2016-07-01
2016-06-01

3

Czy „t * uwierzyć to pytanie istnieje od 9 lat i nikt nie sugeruje prostą funkcję rekurencyjną:

from datetime import datetime, timedelta

def walk_days(start_date, end_date):
    if start_date <= end_date:
        print(start_date.strftime("%Y-%m-%d"))
        next_date = start_date + timedelta(days=1)
        walk_days(next_date, end_date)

#demo
start_date = datetime(2009, 5, 30)
end_date   = datetime(2009, 6, 9)

walk_days(start_date, end_date)

Wynik:

2009-05-30
2009-05-31
2009-06-01
2009-06-02
2009-06-03
2009-06-04
2009-06-05
2009-06-06
2009-06-07
2009-06-08
2009-06-09

Edycja: * Teraz mogę w to uwierzyć - zobacz Czy Python optymalizuje rekurencję ogona? . Dziękuję Tim .


3
Dlaczego miałbyś zastąpić prostą pętlę rekurencją? Dzieje się tak w przypadku przedziałów dłuższych niż około dwa i pół roku.
Tim-Erwin,

@ Tim-Erwin Szczerze mówiąc nie miałem pojęcia, że ​​CPython nie optymalizuje rekurencji ogona, więc twój komentarz jest cenny.
Pocketsand

2

Możesz wygenerować serię dat między dwiema datami, korzystając z biblioteki pand w prosty i godny zaufania sposób

import pandas as pd

print pd.date_range(start='1/1/2010', end='1/08/2018', freq='M')

Możesz zmienić częstotliwość generowania dat, ustawiając częstotliwość jako D, M, Q, Y (dzienna, miesięczna, kwartalna, roczna)


Odpowiedziałem już w tym wątku w 2014 r.
Aleksiej Waznownov

2
> pip install DateTimeRange

from datetimerange import DateTimeRange

def dateRange(start, end, step):
        rangeList = []
        time_range = DateTimeRange(start, end)
        for value in time_range.range(datetime.timedelta(days=step)):
            rangeList.append(value.strftime('%m/%d/%Y'))
        return rangeList

    dateRange("2018-09-07", "2018-12-25", 7)  

    Out[92]: 
    ['09/07/2018',
     '09/14/2018',
     '09/21/2018',
     '09/28/2018',
     '10/05/2018',
     '10/12/2018',
     '10/19/2018',
     '10/26/2018',
     '11/02/2018',
     '11/09/2018',
     '11/16/2018',
     '11/23/2018',
     '11/30/2018',
     '12/07/2018',
     '12/14/2018',
     '12/21/2018']

1

Ta funkcja ma kilka dodatkowych funkcji:

  • może przekazać ciąg pasujący do DATE_FORMAT dla początku lub końca i jest konwertowany na obiekt daty
  • może przekazać obiekt daty dla początku lub końca
  • sprawdzanie błędów, jeśli koniec jest starszy niż początek

    import datetime
    from datetime import timedelta
    
    
    DATE_FORMAT = '%Y/%m/%d'
    
    def daterange(start, end):
          def convert(date):
                try:
                      date = datetime.datetime.strptime(date, DATE_FORMAT)
                      return date.date()
                except TypeError:
                      return date
    
          def get_date(n):
                return datetime.datetime.strftime(convert(start) + timedelta(days=n), DATE_FORMAT)
    
          days = (convert(end) - convert(start)).days
          if days <= 0:
                raise ValueError('The start date must be before the end date.')
          for n in range(0, days):
                yield get_date(n)
    
    
    start = '2014/12/1'
    end = '2014/12/31'
    print list(daterange(start, end))
    
    start_ = datetime.date.today()
    end = '2015/12/1'
    print list(daterange(start, end))

1

Oto kod ogólnej funkcji zakresu dat, podobny do odpowiedzi Ber, ale bardziej elastyczny:

def count_timedelta(delta, step, seconds_in_interval):
    """Helper function for iterate.  Finds the number of intervals in the timedelta."""
    return int(delta.total_seconds() / (seconds_in_interval * step))


def range_dt(start, end, step=1, interval='day'):
    """Iterate over datetimes or dates, similar to builtin range."""
    intervals = functools.partial(count_timedelta, (end - start), step)

    if interval == 'week':
        for i in range(intervals(3600 * 24 * 7)):
            yield start + datetime.timedelta(weeks=i) * step

    elif interval == 'day':
        for i in range(intervals(3600 * 24)):
            yield start + datetime.timedelta(days=i) * step

    elif interval == 'hour':
        for i in range(intervals(3600)):
            yield start + datetime.timedelta(hours=i) * step

    elif interval == 'minute':
        for i in range(intervals(60)):
            yield start + datetime.timedelta(minutes=i) * step

    elif interval == 'second':
        for i in range(intervals(1)):
            yield start + datetime.timedelta(seconds=i) * step

    elif interval == 'millisecond':
        for i in range(intervals(1 / 1000)):
            yield start + datetime.timedelta(milliseconds=i) * step

    elif interval == 'microsecond':
        for i in range(intervals(1e-6)):
            yield start + datetime.timedelta(microseconds=i) * step

    else:
        raise AttributeError("Interval must be 'week', 'day', 'hour' 'second', \
            'microsecond' or 'millisecond'.")

0

Co z następującymi czynnościami dotyczącymi zakresu zwiększanego o dni:

for d in map( lambda x: startDate+datetime.timedelta(days=x), xrange( (stopDate-startDate).days ) ):
  # Do stuff here
  • startDate i stopDate są obiektami datetime.date

W przypadku wersji ogólnej:

for d in map( lambda x: startTime+x*stepTime, xrange( (stopTime-startTime).total_seconds() / stepTime.total_seconds() ) ):
  # Do stuff here
  • startTime i stopTime są obiektami datetime.date lub datetime.datetime (oba powinny być tego samego typu)
  • stepTime jest obiektem timedelta

Zauważ, że .total_seconds () jest obsługiwany tylko po Pythonie 2.7. Jeśli utkniesz we wcześniejszej wersji, możesz napisać własną funkcję:

def total_seconds( td ):
  return float(td.microseconds + (td.seconds + td.days * 24 * 3600) * 10**6) / 10**6

0

Nieco inne podejście do odwracalnych kroków poprzez przechowywanie rangeargumentów w krotce.

def date_range(start, stop, step=1, inclusive=False):
    day_count = (stop - start).days
    if inclusive:
        day_count += 1

    if step > 0:
        range_args = (0, day_count, step)
    elif step < 0:
        range_args = (day_count - 1, -1, step)
    else:
        raise ValueError("date_range(): step arg must be non-zero")

    for i in range(*range_args):
        yield start + timedelta(days=i)

0
import datetime
from dateutil.rrule import DAILY,rrule

date=datetime.datetime(2019,1,10)

date1=datetime.datetime(2019,2,2)

for i in rrule(DAILY , dtstart=date,until=date1):
     print(i.strftime('%Y%b%d'),sep='\n')

WYNIK:

2019Jan10
2019Jan11
2019Jan12
2019Jan13
2019Jan14
2019Jan15
2019Jan16
2019Jan17
2019Jan18
2019Jan19
2019Jan20
2019Jan21
2019Jan22
2019Jan23
2019Jan24
2019Jan25
2019Jan26
2019Jan27
2019Jan28
2019Jan29
2019Jan30
2019Jan31
2019Feb01
2019Feb02

Witamy w Stack Overflow! Chociaż ten kod może rozwiązać pytanie, w tym wyjaśnienie, w jaki sposób i dlaczego rozwiązuje problem, szczególnie w przypadku pytań ze zbyt wieloma dobrymi odpowiedziami, naprawdę pomógłby poprawić jakość twojego postu i prawdopodobnie spowodowałby więcej głosów pozytywnych. Pamiętaj, że odpowiadasz na pytanie dla czytelników w przyszłości, nie tylko dla osoby zadającej teraz pytanie. Proszę edytować swoje odpowiedzi, aby dodać wyjaśnień i dać wskazówkę co zastosować ograniczenia i założenia. Z recenzji
podwójny dźwięk
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.