Chciałbym zakodować klastry kmeans w pythonie przy użyciu pand i scikit learning. Aby wybrać dobre k, chciałbym zakodować statystykę luk z Tibshirani i in. 2001 ( pdf ).
Chciałbym wiedzieć, czy mogę użyć wyniku bezwładności scikit i dostosować formułę statystyki szczeliny bez konieczności przekodowywania wszystkich obliczeń odległości.
Czy ktoś zna formułę bezwładności stosowaną w scikit / zna prosty sposób na przekodowanie statystyki luki za pomocą funkcji odległości wysokiego poziomu?
python
.