Powiedziałbym, że DryadLinq jest najbliższą Hadoopowi rzeczą, jaką my, ludzie .NET, mamy. Ale to zależy do czego chcesz używać hadoopa. Jeśli szukasz zoptymalizowanego samoobsługowego systemu plików rozproszonych (DFS), to DryadLINQ nie jest tym, czego szukasz. Ma odpowiednik DFS, ale musisz ręcznie zbudować partycje i rozprowadzić każdą partycję.
Biorąc to pod uwagę, jeśli jego aspekt wykonania rozproszonego Hadoop, którego szukasz, niż DryadLINQ jest naprawdę wspaniały (i nie, nie jestem powiązany z MS). Tak długo, jak masz konfigurację klastra Microsoft HPC, rozpoczęcie pracy z DryadLINQ jest naprawdę łatwe.
Kod, który piszesz, jest w rzeczywistości po prostu prostym kodem LINQ, z wyjątkiem tego, że zamiast wykonywania LINQ IEnumerable<T>
musisz go wykonać PartitionedTable<T>
(własna kompilacja rozproszonej struktury danych).
To, co naprawdę było fajne w DryadLINQ, to szybki czas zmiany (spróbuj, przetestuj, dostosuj, powtórz) podczas opracowywania algorytmów. Po prostu piszesz kod LINQ, aby wykonać obliczenia, a DryadLINQ zajmie się całą częścią rozproszonego wykonania. Jest to najbardziej naturalny analog, z jakim się spotkałem, który sprawia, że pisanie kodu do przetwarzania rozproszonego jest takie samo, jak pisanie kodu do przetwarzania pojedynczego procesu.