accelerInt/fd__jacob_8cu_source.html

 #include "fd_jacob.cuh"

 #define FD_ORD 1

 // Finite difference coefficients
 #if FD_ORD == 2
   __constant__ double x_coeffs[FD_ORD] = {-1.0, 1.0};
   __constant__ double y_coeffs[FD_ORD] = {-0.5, 0.5};
 #elif FD_ORD == 4
   __constant__ double x_coeffs[FD_ORD] = {-2.0, -1.0, 1.0, 2.0};
   __constant__ double y_coeffs[FD_ORD] = {1.0 / 12.0, -2.0 / 3.0, 2.0 / 3.0, -1.0 / 12.0};
 #elif FD_ORD == 6
   __constant__ double x_coeffs[FD_ORD] = {-3.0, -2.0, - 1.0, 1.0, 2.0, 3.0};
   __constant__ double y_coeffs[FD_ORD] = {-1.0 / 60.0, 3.0 / 20.0, -3.0 / 4.0, 3.0 / 4.0, -3.0 / 20.0, 1.0 / 60.0};
 #endif

 __device__
 void eval_jacob (const double t, const double pres, const double * __restrict__ cy,
                     double * __restrict__ jac, const mechanism_memory* __restrict__ d_mem,
                     double* __restrict__ y_temp, double* __restrict__ ewt) {
   double* dy = d_mem->dy;

   #pragma unroll
   for (int i = 0; i < NSP; ++i) {
     y_temp[INDEX(i)] = cy[INDEX(i)];
     ewt[INDEX(i)] = ATOL + (RTOL * fabs(cy[INDEX(i)]));
   }

   dydt (t, pres, cy, dy, d_mem);
   #if FD_ORD == 1
   #pragma unroll
   for (int j = 0; j < NSP; ++j) {
       #pragma unroll
       for (int i = 0; i < NSP; ++i) {
         jac[INDEX(i + NSP*j)] = dy[INDEX(i)];
       }
   }
   #endif

   // unit roundoff of machine
   double srur = sqrt(DBL_EPSILON);

   double sum = 0.0;
   #pragma unroll
   for (int i = 0; i < NSP; ++i) {
     sum += (ewt[INDEX(i)] * dy[INDEX(i)]) * (ewt[INDEX(i)] * dy[INDEX(i)]);
   }
   double fac = sqrt(sum / ((double)(NSP)));
   double r0 = 1000.0 * RTOL * DBL_EPSILON * ((double)(NSP)) * fac;


   #pragma unroll
   for (int j = 0; j < NSP; ++j) {
     double yj_orig = y_temp[INDEX(j)];
     double r = fmax(srur * fabs(yj_orig), r0 / ewt[INDEX(j)]);

     #if FD_ORD == 1
       y_temp[INDEX(j)] = yj_orig + r;
       dydt (t, pres, y_temp, dy, d_mem);

       #pragma unroll
       for (int i = 0; i < NSP; ++i) {
         jac[INDEX(i + NSP*j)] = (dy[INDEX(i)] - jac[INDEX(i + NSP*j)]) / r;
       }
     #else
       #pragma unroll
       for (int i = 0; i < NSP; ++i) {
         jac[INDEX(i + NSP*j)] = 0.0;
       }
       #pragma unroll
       for (int k = 0; k < FD_ORD; ++k) {
         y_temp[INDEX(j)] = yj_orig + x_coeffs[k] * r;
         dydt (t, pres, y_temp, dy, d_mem);

         #pragma unroll
         for (int i = 0; i < NSP; ++i) {
           jac[INDEX(i + NSP*j)] += y_coeffs[k] * y_temp[INDEX(i)];
         }
       }
       #pragma unroll
       for (int i = 0; i < NSP; ++i) {
         jac[INDEX(i + NSP*j)] /= r;
       }
     #endif

     y_temp[INDEX(j)] = yj_orig;
   }

 }
van_der_pol::dydt
void dydt(const double t, const double mu, const double *__restrict__ y, double *__restrict__ dy)
An implementation of the RHS of the van der Pol equation.
Definition: dydt.c:22

NSP
#define NSP
The IVP system size.
Definition: header.cuh:20

fd_jacob.cuh
Header definition of CUDA Finite Difference Jacobian.

RTOL
#define RTOL
Definition: solver_options.cuh:24

eval_jacob
__device__ void eval_jacob(const double t, const double pres, const double *__restrict__ cy, double *__restrict__ jac, const mechanism_memory *__restrict__ d_mem, double *__restrict__ y_temp, double *__restrict__ ewt)
Computes a finite difference Jacobian of order FD_ORD of the RHS function dydt at the given pressure ...
Definition: fd_jacob.cu:35

ATOL
#define ATOL
Definition: solver_options.cuh:22

genericcu::y_temp
double * y_temp
temorary storage
Definition: solver_interface.cu:28

FD_ORD
#define FD_ORD
The finite difference order [Default: 1].
Definition: fd_jacob.cu:9

INDEX
#define INDEX(i)
Convenience macro to get the value of a vector at index i, calculated as i * GRID_DIM + T_ID...
Definition: gpu_macros.cuh:24