Tidy-up CUDA implementation of IProductWRTDerivBase and add CUDA kernels with additional parallelism (!72) · Merge requests · Nektar / redesign-prototype