Pozwólcie, że dodam moje 2 centy, moim zadaniem jest pozyskiwanie dobrych i czystych danych dla funduszu hedgingowego, widziałem całkiem sporo źródeł danych i dostawców danych historycznych. Dotyczy to głównie danych o amerykańskich akcjach.
Na początek, jeśli masz trochę pieniędzy, nie przejmuj się pobieraniem danych z Yahoo, pobierz dane na koniec dnia bezpośrednio z danych CSI , to tutaj Yahoo pobiera również swoje dane EOD AFAIK. Posiadają interfejs API, w którym można wyodrębnić dane do dowolnego formatu. Myślę, że roczna subskrypcja danych to kilka 100 dolarów.
Główny problem z pobieraniem danych z bezpłatnej usługi polega na tym, że dostajesz tylko zapasy, które nadal istnieją, nazywa się to uprzedzeniem przetrwania i może dać złe wyniki, jeśli spojrzysz na wiele zapasów, ponieważ uwzględnisz tylko te, które sprawiły, że tak daleko, a nie te, które zostały usunięte z listy.
Do zabawy z niektórymi danymi śróddziennymi zajrzałbym do IQFeed , zapewniają one kilka interfejsów API do wydobywania danych historycznych, chociaż są one głównie zestawem do kanałów w czasie rzeczywistym. Ale tutaj jest sporo opcji, niektórzy brokerzy zapewniają nawet pobieranie danych historycznych za pośrednictwem swoich interfejsów API, więc po prostu wybierz swoją truciznę.
ALE zwykle wszystkie te dane nie są bardzo czyste, gdy naprawdę zaczniesz testowanie z powrotem, zobaczysz, że niektórych zapasów brakuje lub pojawiają się jako dwa różne symbole, lub podziały zapasów nie są odpowiednio rozliczane itp. I wtedy zdajesz sobie sprawę, że historyczne dane dywidendy są również potrzebne, więc zaczynasz biegać w kręgach, łatając dane ze 100 różnych źródeł danych i tak dalej. Zacznijmy od pliku danych z rabatem, ale jak tylko przeprowadzisz bardziej kompleksowe testy wsteczne, możesz napotkać problemy w zależności od tego, co robisz. Jeśli spojrzymy na, powiedzmy, akcje S&P 500, nie będzie to jednak problemem i zrobi to „tania” transmisja śróddzienna.
To, czego nie znajdziesz, to bezpłatne dane śróddzienne. Mam na myśli, że możesz znaleźć kilka przykładów, jestem pewien, że pływa około 5 lat danych tykania MSFT, ale to nie zaprowadzi cię daleko.
Następnie, jeśli potrzebujesz prawdziwych rzeczy (księga zamówień poziomu II, wszystkie tiki, jakie miały miejsce na wszystkich giełdach), jeden „niedrogi”, ale doskonałą opcją jest Nanex . Dostarczą ci dysk z terabajtami danych. Jeśli dobrze pamiętam, to około 3k-4K $ danych rocznie. Ale zaufaj mi, gdy zrozumiesz, jak trudno jest uzyskać dobre dane śróddzienne, nie będziesz myśleć, że to w ogóle bardzo dużo pieniędzy.
Trudno nie zniechęcić, ale zdobyć dobre dane, tak trudne, że wiele funduszy hedgingowych i banków wydaje setki tysięcy dolarów miesięcznie, aby uzyskać dane, którym mogą zaufać. Znowu możesz zacząć gdzieś, a potem stamtąd iść, ale dobrze jest zobaczyć to trochę w kontekście.
Edycja: Powyższa odpowiedź pochodzi z mojego własnego doświadczenia. Ten artykuł Caltech na temat dostępnych plików danych da więcej informacji, a szczególnie zaleca QuantQuote .