W tej chwili próbuję zaimplementować jakiś bufor głębokości w oprogramowaniu i mam ogromny problem, kiedy do niego piszę. Posiadanie jednego muteksu to absolutna przesada. Stworzyłem więc wiele muteksów równych liczbie wątków. Blokuję muteks na podstawie bieżącego piksela (pixel_index% mutexes_number) i działa to lepiej, ale nadal bardzo bardzo wolno. I zastanawiam się, jak to się robi w prawdziwym GPU? Czy istnieje sprytny algorytm lub sprzęt go obsługuje?