2
깊이 버퍼 업데이트는 GPU에서 어떻게 작동합니까?
지금은 소프트웨어에서 일종의 깊이 버퍼를 구현하려고하는데 그것에 쓸 때 큰 문제가 있습니다. 하나의 뮤텍스를 갖는 것은 절대적으로 과잉입니다. 그래서 스레드 수와 동일한 수의 뮤텍스를 만들었습니다. 현재 픽셀 (pixel_index % mutexes_number)을 기반으로 뮤텍스를 잠그고 있으며 더 잘 작동하지만 여전히 매우 느립니다. 실제 GPU에서 어떻게 수행되는지 궁금합니다. 영리한 알고리즘이나 하드웨어가 처리합니까?
10
buffers