Próbuję zrozumieć, w jaki sposób wszystkie komponenty „big data” grają razem w rzeczywistym świecie, np. Hadoop, monogodb / nosql, storm, kafka, ... Wiem, że jest to dość szeroka gama narzędzi używanych do różne typy, ale chciałbym dowiedzieć się więcej o ich interakcji w aplikacjach, np. myślenie maszynowe dla aplikacji, aplikacji internetowej, sklepu internetowego.
Mam vistors / sesję, dane transakcji itp. I przechowuję je; ale jeśli chcę formułować rekomendacje w locie, nie mogę uruchamiać wolnych zadań mapowania / zmniejszania w tym przypadku w jakiejś dużej bazie danych dzienników. Gdzie mogę dowiedzieć się więcej na temat aspektów infrastruktury? Myślę, że mogę korzystać z większości narzędzi samodzielnie, ale podłączanie ich do siebie wydaje się być sztuką samą w sobie.
Czy są dostępne jakieś publiczne przykłady / przypadki użycia itp.? Rozumiem, że poszczególne potoki silnie zależą od przypadku użycia i użytkownika, ale tylko przykłady prawdopodobnie będą dla mnie bardzo przydatne.