Pracuję nad skonfigurowaniem zestawu maszyn wirtualnych do eksperymentowania ze Spark przed wydaniem pieniędzy na zbudowanie klastra z pewnym sprzętem. Szybka uwaga: Jestem naukowcem z doświadczeniem w stosowanym uczeniu maszynowym i trochę przestałem pracować w informatyce. Używam narzędzi do obliczeń, rzadko musiałbym je konfigurować.
Utworzyłem 3 maszyny wirtualne (1 master, 2 slave) i pomyślnie zainstalowałem Spark. Wszystko wydaje się działać tak, jak powinno. Mój problem polega na utworzeniu serwera Jupyter, do którego można się podłączyć z przeglądarki, która nie działa na komputerze w klastrze.
Pomyślnie zainstalowałem notatnik Jupyter ... i działa. Dodałem nowy profil IPython łączący się ze zdalnym serwerem za pomocą Spark.
teraz problem
Komenda
$ ipython --profile=pyspark
działa dobrze i łączy się z klastrem iskier. Jednak,
$ ipython notebook --profile=pyspark
[<stuff is here>] Unrecognized alias: "profile=pyspark", it will probably have no effect.
domyślnie jest to default
profil, a nie pyspark
profil.
Moja konfiguracja notebooka pyspark
ma:
c = get_config()
c.NotebookApp.ip = '*'
c.NotebookApp.open_browser = False
c.NotebookApp.port = 8880
c.NotebookApp.server_extensions.append('ipyparallel.nbextension')
c.NotebookApp.password = u'some password is here'
$ ipython --profile=pyspark notebook
? Możliwe, że problem dotyczył tylko kolejności argumentów.