<div dir="ltr"><div>Hi,</div><div>Thanks for sharing your results.</div><div>RTK uses CUFFT for the ramp filtering which does its own blocks/grid management. For backprojection, it's pretty simple, see</div><div><a href="https://github.com/SimonRit/RTK/blob/master/src/rtkCudaFDKBackProjectionImageFilter.cu#L198">https://github.com/SimonRit/RTK/blob/master/src/rtkCudaFDKBackProjectionImageFilter.cu#L198</a></div><div>mostly hardcoded, independent of the number of CUDA cores and could be optimized. There is one compilation parameter that you can try to change to see if that speeds up the computation, that is the cmake variable RTK_CUDA_PROJECTIONS_SLAB_SIZE which controls how many projections are backprojected simultaneously.</div><div>We currently currently don't propose any way to use multiple GPUs.</div><div>Please keep us posted if you continue to do some tests. In particular, I advise turning on RTK_TIME_EACH_FILTER in cmake so that you get a report with -v option in applications on how much time your program spent in each filter.</div><div>Best regards,</div><div>Simon<br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jul 18, 2018 at 6:48 PM, Elena Padovani <span dir="ltr"><<a href="mailto:elenapadovani.lk@gmail.com" target="_blank">elenapadovani.lk@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hi RTK-users,<div><br></div><div>I compiled RTK with CUDA and tried to setup a benchmark to analyze the performances trend of the GPUs when using the CUDA-FDK reconstruction filter. Precisely, when reconstructing the same volume from the same data-set on NVS510 GTX860M and GTX970M i got results consistent with the number of GPUs cuda cores. Indeed, when setting up this benchmark i was expecting <span style="font-size:small;background-color:rgb(255,255,255);text-decoration-style:initial;text-decoration-color:initial;float:none;display:inline">a reduction in the reconstruction time with the increase of cuda cores(at least until the dimension of the reconstructed volume was not the actual bottleneck). </span>However, when testing it on a Tesla P100 i got performances comparable to the GTX860M. Would you expect such a result? </div><div><br></div><div>Unfortunately i am new to CUDA and i was wondering if any of you could help me figuring this out. <br></div><div>How does rtk with CUDA manage the number of blocks/grid dimension ? </div><div>Is the number of blocks/grid dimension depedent on the GPU cuda cores?</div><div>Is there a way to use multiple GPUs?</div><div><br></div><div>The test was carried with the following data:</div><div>- 360 projections</div><div>- reconstructed volume 600x700x800 px</div><div><br></div><div>Thank you in advance </div><div>Kind regards</div><span class="HOEnZb"><font color="#888888"><div><br></div><div>Elena </div><div><br></div></font></span></div>
<br>______________________________<wbr>_________________<br>
Rtk-users mailing list<br>
<a href="mailto:Rtk-users@public.kitware.com">Rtk-users@public.kitware.com</a><br>
<a href="https://public.kitware.com/mailman/listinfo/rtk-users" rel="noreferrer" target="_blank">https://public.kitware.com/<wbr>mailman/listinfo/rtk-users</a><br>
<br></blockquote></div><br></div>