% -*- mode: Noweb; noweb-code-mode: c-mode -*- \index{rayTracing} The ray tracing method involves 4 steps \cite{}: \begin{enumerate} \item the ray coordinates are transformed into the coordinate system of the surface their interact with, \item he intersection of the ray with the surface is found, \item the directions of the ray after the surface is computed according to Snell''s law, \item the coordinates and directions of the ray is transformed back into its original coordinate systems \end{enumerate} \section{The files} \label{sec:files} \subsection{Header} \label{sec:header} <>= #ifndef __RAYTRACING_H__ #define __RAYTRACING_H__ #ifndef __UTILITIES_H__ #include "utilities.h" #endif #ifndef __SOURCE_H__ #include "source.h" #endif #define SNELL_N_ITERATION 100 #define TOL 1E-9 <> <> __host__ __device__ rtd even_asphere(rtd r, int N, rtd *a); __host__ __device__ rtd partial_x_or_y_even_asphere(rtd x_or_y, rtd r2, int N, rtd *a); <> __host__ __device__ rtd zernike_surface(rtd r, rtd o, int max_n, rtd *a); __host__ __device__ rtd zernike_surface_x_derivative(rtd r, rtd o, int max_n, rtd *a); __host__ __device__ rtd zernike_surface_y_derivative(rtd r, rtd o, int max_n, rtd *a); __host__ __device__ void zernike_surface_and_partials(rtd *ZS, rtd *dZSdx, rtd *dZSdy, rtd r, rtd o, int max_n, rtd *a, rtd *ax, rtd *ay); int zern_dx_coef(rtd *b, int j, int n, int m, int jp, int np, int mp); int zern_dy_coef(rtd *b,int j, int n, int m, int jp, int np, int mp); __host__ __device__ rtd conic_equation(vector *v, vector *v0, const rtd k, const rtd c, const int N, rtd *a); __device__ rtd conic_surface(vector *v, vector *v0, const rtd k, const rtd c, const int N, rtd *a); __device__ rtd partial_x_conic_surface(vector *v, vector *v0, const rtd k, const rtd c, const int N, rtd *a); __device__ rtd partial_y_conic_surface(vector *v, vector *v0, const rtd k, const rtd c, const int N, rtd *a); __device__ rtd partial_z_conic_surface(void); <> __global__ void intersection(char *mask, ray *d__ray, int N_RAY); __host__ __device__ void forward_transform(vector *v_out, vector *v_in, rtd *d__R, vector *d__origin); __host__ __device__ void forward_transform_centered(vector *v_out, vector *v_in, rtd *d__R); __host__ __device__ void backward_transform(vector *v_out, vector *v_in, rtd *d__R, vector *d__origin); __host__ __device__ void backward_transform_centered(vector *v_out, vector *v_in, rtd *d__R); __device__ rtd aspheric_surface(vector *v, vector *v0, const rtd k, const rtd c, const int max_n, rtd *a, const rtd R); __device__ rtd zernike_surface(vector *v, vector *v0, const int max_n, rtd *a, const rtd R); __device__ rtd partial_x_aspheric_surface(vector *v, vector *v0, const rtd k, const rtd c, const int max_n, rtd *cx, const rtd R); __device__ rtd partial_x_zernike_surface(vector *v, vector *v0, const int max_n, rtd *cx, const rtd R); __device__ rtd partial_y_aspheric_surface(vector *v, vector *v0, const rtd k, const rtd c, const int max_n, rtd *cy, const rtd R); __device__ rtd partial_y_zernike_surface(vector *v, vector *v0, const int max_n, rtd *cy, const rtd R); __device__ rtd partial_z_aspheric_surface(void); __device__ rtd partial_z_zernike_surface(void); void transform_to_S(bundle *rays, conic *F); void transform_to_S(bundle *rays, aperture *A); void transform_to_R(bundle *rays, conic *F); void transform_to_R(bundle *rays, aperture *A); void intersect(bundle *rays, conic *F); void reflect(bundle *rays); void refract(bundle *rays, rtd mu); #endif // __RAYTRACING_H__ @ \subsection{Source} \label{sec:source} <>= #include "rayTracing.h" <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> <> @ \section{Coordinate system} \label{sec:coordinate-system} \index{rayTracing!coordinate\_system} The surface location and orientation with respect to the GCS is specified with a coordinate vector: <>= vector *origin; @ and with 3 Euler angles with respected to the x, y and z axis. <>= vector *euler_angles; @ The surface can be made of [[N]] identical segments <>= int N; @ The rotation matrix [[R]] used to transform the ray coordinates into the surface coordinates (and back!) is defined with <>= rtd *R, *d__R; float *float_R; vector *d__origin; @ Coordinate systems can be tagged: <>= char tag[32]; @ They are gathered in a new coordinate system data type <>= struct coordinate_system{ <> void setup(void); void setup(vector _origin_, vector _euler_angles_); void setup(vector *_origin_, vector *_euler_angles_, int _N_); void setup(vector *_origin_, vector *_euler_angles_, int _N_, char *_tag_); void cleanup(void); void info(void); void info_details(void); void update(void); void update(vector _origin_, vector _euler_angles_,int idx); }; @ \subsection{Setup \& Cleanup} \label{sec:setup--cleanup} A coordinate system structure is initialized with \begin{itemize} \item a single origin and orientation, \index{rayTracing!coordinate\_system!setup} <>= void coordinate_system::setup(vector _origin_, vector _euler_angles_) { N = 1; HANDLE_ERROR( cudaMalloc((void**)&d__R, sizeof(rtd)*9*N ) ); HANDLE_ERROR( cudaMalloc((void**)&d__origin, sizeof(vector)*N ) ); int n_byte = sizeof(vector)*N; origin = (vector *)malloc( n_byte ); euler_angles = (vector *)malloc( n_byte ); memcpy( origin , &_origin_ , n_byte); memcpy(euler_angles, &_euler_angles_, n_byte); <> strcpy(tag,"coordinate_system"); info(); } @ \item origin and orientation align to the main coordinate system, \index{rayTracing!coordinate\_system!setup} <>= void coordinate_system::setup(void) { N = 1; HANDLE_ERROR( cudaMalloc((void**)&d__R, sizeof(rtd)*9*N ) ); HANDLE_ERROR( cudaMalloc((void**)&d__origin, sizeof(vector)*N ) ); int n_byte = sizeof(vector)*N; origin = (vector *)malloc( n_byte ); euler_angles = (vector *)malloc( n_byte ); origin[0].x = 0; origin[0].y = 0; origin[0].z = 0; euler_angles[0].x = 0; euler_angles[0].y = 0; euler_angles[0].z = 0; <> strcpy(tag,"coordinate_system"); info(); } @ \item an array of [[N]] origins and orientations: \begin{itemize} \item without a tag: \index{rayTracing!coordinate\_system!setup} <>= void coordinate_system::setup(vector *_origin_, vector *_euler_angles_, int _N_) { strcpy(tag,"coordinate_system"); <> } @ \item or with a tag: \index{rayTracing!coordinate\_system!setup} <>= void coordinate_system::setup(vector *_origin_, vector *_euler_angles_, int _N_, char *_tag_) { strcpy(tag,_tag_); <> } @ \end{itemize} where <>= N = _N_; HANDLE_ERROR( cudaMalloc((void**)&d__R, sizeof(rtd)*9*N ) ); HANDLE_ERROR( cudaMalloc((void**)&d__origin, sizeof(vector)*N ) ); int n_byte = sizeof(vector)*N; origin = (vector *)malloc( n_byte ); euler_angles = (vector *)malloc( n_byte ); memcpy( origin , _origin_ , n_byte); memcpy(euler_angles, _euler_angles_, n_byte); <> info(); @ \end{itemize} The rotation matrix to transform the ray coordinates in the GCS is given by \begin{eqnarray} R &=& \left[ \begin{array}{ccc} c\gamma & -s\gamma & 0 \\ s\gamma & c\gamma & 0 \\ 0 & 0 & 1 \end{array} \right] \left[ \begin{array}{ccc} c\beta & 0 & s\beta \\ 0 & 1 & 0 \\ -s\beta & 0 & c\beta \end{array} \right] \left[ \begin{array}{ccc} 1 & 0 & 0 \\ 0 & c\alpha & -s\alpha \\ 0 & s\alpha & c\alpha \end{array} \right] \\ &=& \left[ \begin{array}{ccc} c\beta c\gamma & s\alpha s\beta c\gamma - c\alpha s\gamma & c\alpha s\beta c\gamma + s\alpha s\gamma \\ c\beta s\gamma & s\alpha s\beta s\gamma + c\alpha c\gamma & c\alpha s\beta s\gamma - s\alpha c\gamma \\ -s\beta & s\alpha c\beta & c\alpha c\beta \end{array} \right] \end{eqnarray} where $cx$ and $sx$ stands for $\sin(x)$ and $\cos(x)$, respectively. $\alpha$, $\beta$ and $\gamma$ are the Euler angles along the x, y and z axis respectively. The matrix is computed with <>= R = (rtd *)malloc( sizeof(rtd)*9*N ); rtd ca, sa, cb, sb, cg, sg; int k, idx; for (k=0; k> } <> /* for (k=0;k<9*N;k++) */ /* *(float_R+k) = (float) R[k]; */ @ with <>= ca = cos(euler_angles[idx].x); sa = sin(euler_angles[idx].x); cb = cos(euler_angles[idx].y); sb = sin(euler_angles[idx].y); cg = cos(euler_angles[idx].z); sg = sin(euler_angles[idx].z); idx *= 9; R[idx++] = cb*cg; R[idx++] = sa*sb*cg - ca*sg; R[idx++] = ca*sb*cg + sa*sg; R[idx++] = cb*sg; R[idx++] = sa*sb*sg + ca*cg; R[idx++] = ca*sb*sg - sa*cg; R[idx++] = -sb; R[idx++] = sa*cb; R[idx++] = ca*cb; @ and <>= HANDLE_ERROR( cudaMemcpy( d__R, R, sizeof(rtd)*9*N, cudaMemcpyHostToDevice ) ); HANDLE_ERROR( cudaMemcpy( d__origin, origin, sizeof(vector)*N, cudaMemcpyHostToDevice ) ); @ where the elements of $R$ are stored in the row major format. \index{rayTracing!coordinate\_system!cleanup} <>= void coordinate_system::cleanup(void) { INFO("@(CEO)>coordinate_system: freeing memory!\n"); free( origin ); free( euler_angles ); free(R); HANDLE_ERROR( cudaFree( d__R ) ); HANDLE_ERROR( cudaFree( d__origin ) ); } @ The coordinate system is updated with \index{rayTracing!coordinate\_system!update} <>= void coordinate_system::update(void) { int k, idx; rtd ca, sa, cb, sb, cg, sg; for (k=0; k> } <> } @ or with the origin [[_origin_]] and euler angles [[_euler_angles_]] vectors of a single segment identified with its index [[idx]] <>= void coordinate_system::update(vector _origin_, vector _euler_angles_,int idx) { int n_byte = sizeof(vector); memcpy( origin + idx , &_origin_ , n_byte); memcpy(euler_angles + idx, &_euler_angles_, n_byte); rtd ca, sa, cb, sb, cg, sg; <> <> } @ \subsection{Input/Output} \label{sec:inputoutput} The main parameters of the coordinate systems are displayed with the [[info]] routine: \index{rayTracing!coordinate\_system!info\_details} <>= void coordinate_system::info_details(void) { INFO("\n\x1B[1;42m@(CEO)>%s:\x1B[;42m\n",tag); INFO(" ID (Tx Ty Tz)[m] (Ox Oy Oz)[deg]\n"); float c = 180.0/PI; int k;//, i, j, idx; for (k=0; k>= void coordinate_system::info(void) { //info_details(); /* INFO("\n\x1B[1;42m@(CEO)>%s:\x1B[;42m\n",tag); INFO(" %d coordinate systems\n",N); INFO("----------------------------------------------------\x1B[0m\n"); */ } @ \section{Conic surface} \label{sec:surface} \index{rayTracing!conic} A conic surface is represented with the [[conic]] structure: <>= struct conic { <> void setup(rtd _c_, rtd _k_); void setup(rtd _c_, rtd _k_, vector _origin_, vector _euler_angles_); void setup(rtd _c_, rtd _k_, vector _origin_, vector _euler_angles_, vector conic_origin); void setup(rtd _c_, rtd _k_, vector _origin_, vector _euler_angles_, vector conic_origin, rtd _refractive_index_); void setup(rtd _c_, rtd _k_, vector _origin_, vector _euler_angles_, vector conic_origin, rtd _refractive_index_, int asphere_N, rtd *asphere_a); void cleanup(void); void trace(bundle *src); void info(void); }; @ A conic surface is defined at a given location within a given coordinate system: <>= coordinate_system ref_frame; vector origin, *d__origin; @ The conic is specified with three parameters: <>= rtd c, k, refractive_index; @ where [[c]] is the vertex curvature, [[k]] is the conic parameter and [[refractive_index]] is the index of refraction. @ An even asphere surface can be added to the conic surface. It is defined with the number of even polynomials [[even_asphere_N]] and their coefficients [[even_asphere_a]]. <>= int even_asphere_N; rtd *d__even_asphere_a; @ \subsection{Conic definition} \label{sec:conic-definition} The conic surface is defined with \begin{equation} \label{eq:4} F(x,y,z) = z - {c\rho^2 \over 1 + \sqrt{1 - \kappa c^2 \rho^2} } = 0. \end{equation} The conic expression is computed with \index{rayTracing!conic!conic\_equation} <>= __host__ __device__ rtd conic_equation(vector *v, vector *v0, const rtd k, const rtd c, const int N, rtd *a) { rtd rho2, asphere; rho2 = v->rho2_shift(v0->x,v0->y); asphere = even_asphere(rho2, N, a); rho2 *= c; if (c==0) return 0.0 + asphere; else { if (k==0) return rho2*0.5 + asphere; else return rho2/( 1 + sqrt(1 - k*c*rho2) ) + asphere; } } @ and the surface equation with \index{rayTracing!conic!conic\_surface} <>= __device__ rtd conic_surface(vector *v, vector *v0, const rtd k, const rtd c, const int N, rtd *a) { return v->z - v0->z - conic_equation(v, v0, k, c, N, a); } @ @ The partial derivative of the conic equation are written \begin{itemize} \item \begin{equation} { \partial F(x,y,z) \over \partial x } = -x {c \over \sqrt{ 1 - \kappa c^2 \rho^2 } } \end{equation} \index{rayTracing!conic!partial\_x\_conic\_surface} <>= __device__ rtd partial_x_conic_surface(vector *v, vector *v0, const rtd k, const rtd c, const int N, rtd *a) { rtd rho2, asphere; rho2 = v->rho2_shift(v0->x,v0->y); asphere = partial_x_or_y_even_asphere(v->x - v0->x, rho2, N, a); rho2 *= c; if (c==0) return 0.0 - asphere; else if (k==0) return -(v->x - v0->x)*c - asphere; else { return -(v->x - v0->x)*c*rsqrt(1 - k*c*rho2) - asphere; } } @ \item \begin{equation} { \partial F(x,y,z) \over \partial y } = -y {c \over \sqrt{ 1 - \kappa c^2 \rho^2 } } \end{equation} \index{rayTracing!conic!partial\_y\_conic\_surface} <>= __device__ rtd partial_y_conic_surface(vector *v, vector *v0, const rtd k, const rtd c, const int N, rtd *a) { rtd rho2, asphere; rho2 = v->rho2_shift(v0->x,v0->y); asphere = partial_x_or_y_even_asphere(v->y - v0->y, rho2, N, a); rho2 *= c; if (c==0) return 0.0 - asphere; else if (k==0) return -(v->y - v0->y)*c - asphere; else { return -(v->y - v0->y)*c*rsqrt(1 - k*c*rho2) - asphere; } } @ \item \begin{equation} { \partial F(x,y,z) \over \partial z } = 1 \end{equation} \index{rayTracing!conic!partial\_z\_conic\_surface} <>= __device__ rtd partial_z_conic_surface(void) { return 1.0; } @ \end{itemize} \subsection{Zernike aspheric definition} \label{sec:zern-asph-defin} The generic expression for aspheric surface is given by \begin{equation} \label{eq:69} F(x,y,z) = z - {c\rho^2 \over 1 + \sqrt{1 - \kappa c^2 \rho^2} } - \sum_{i=1}^N a_i Z_i(\rho,\theta) = 0. \end{equation} \index{rayTracing!conic!aspheric\_surface} <>= __device__ rtd aspheric_surface(vector *v, vector *v0, const rtd k, const rtd c, const int max_n, rtd *a, const rtd R) { return conic_surface(v, v0, k, c, 0, a) - zernike_surface(v->mag(R), v->angle(), max_n, a); } @ The Zernike surface (Eq.~(\ref{eq:51}) and Sec.~\ref{sec:zern-surf-equat}) of the asphere is given by: \index{rayTracing!conic!zernike\_surface} <>= __device__ rtd zernike_surface(vector *v, vector *v0, const int max_n, rtd *a, const rtd R) { return -zernike_surface(v->mag(R), v->angle(), max_n, a); } @ The partial derivatives of the aspheric equation are written \begin{itemize} \item \begin{equation} { \partial F(x,y,z) \over \partial x } = -x {c \over \sqrt{ 1 - \kappa c^2 \rho^2 } }, \end{equation} \index{rayTracing!conic!partial\_x\_aspheric\_surface} <>= __device__ rtd partial_x_aspheric_surface(vector *v, vector *v0, const rtd k, const rtd c, const int max_n, rtd *cx, const rtd R) { return partial_x_conic_surface(v, v0, k, c, 0, cx) - zernike_surface(v->mag(R), v->angle(), max_n-1, cx); } @ the Zernike x--derivative (Eq.~(\ref{eq:57}) and Sec.~\ref{sec:zern-surf-deriv}) is computed with: \index{rayTracing!conic!partial\_x\_zernike\_surface} <>= __device__ rtd partial_x_zernike_surface(vector *v, vector *v0, const int max_n, rtd *cx, const rtd R) { return -zernike_surface(v->mag(R), v->angle(), max_n-1, cx); } @ \item \begin{equation} { \partial F(x,y,z) \over \partial y } = -y {c \over \sqrt{ 1 - \kappa c^2 \rho^2 } } \end{equation} \index{rayTracing!conic!partial\_y\_aspheric\_surface} <>= __device__ rtd partial_y_aspheric_surface(vector *v, vector *v0, const rtd k, const rtd c, const int max_n, rtd *cy, const rtd R) { return partial_y_conic_surface(v, v0, k, c, 0, cy) - zernike_surface(v->mag(R), v->angle(), max_n-1, cy); } @ the Zernike y--derivative (Eq.~(\ref{eq:57}) and Sec.~\ref{sec:zern-surf-deriv}) is computed with: \index{rayTracing!conic!partial\_y\_zernike\_surface} <>= __device__ rtd partial_y_zernike_surface(vector *v, vector *v0, const int max_n, rtd *cy, const rtd R) { return -zernike_surface(v->mag(R), v->angle(), max_n-1, cy); } @ \item \begin{equation} { \partial F(x,y,z) \over \partial z } = 1 \end{equation} \index{rayTracing!conic!partial\_z\_aspheric\_surface} <>= __device__ rtd partial_z_aspheric_surface(void) { return 1.0; } @ the Zernike z--derivative is computed with: \index{rayTracing!conic!partial\_z\_zernike\_surface} <>= __device__ rtd partial_z_zernike_surface(void) { return 0.0; } @ \end{itemize} @ Aspheric surface and partial derivatives: <>= __device__ void aspheric_surface_and_partials(rtd *S, rtd *dSdx, rtd *dSdy, rtd *dSdz, vector *v, vector *v0, const rtd k, const rtd c, const int max_n, rtd *a, rtd *cx, rtd *cy, const rtd R) { zernike_surface_and_partials(S, dSdx, dSdy, v->mag(R), v->angle(), max_n, a, cx, cy); S[0] = v->z - v0->z - S[0]; dSdx[0] = -dSdx[0]; dSdy[0] = -dSdy[0]; dSdz[0] = 1.0; if (c!=0) { rtd rho2; rho2 = c*v->rho2_shift(v0->x,v0->y); if (k==0) { S[0] -= rho2*0.5; dSdx[0] -= (v->x - v0->x)*c; dSdy[0] -= (v->y - v0->y)*c; } else { rtd red,rsqrt_red; red = 1 - k*c*rho2; rsqrt_red = rsqrt(red); S[0] -= rho2/( 1 + sqrt(red) ); dSdx[0] -= (v->x - v0->x)*c*rsqrt_red; dSdy[0] -= (v->y - v0->y)*c*rsqrt_red; } } } @ \subsection{Even asphere definition} \label{sec:even-asph-defin} An even asphere is defined by \begin{equation} \label{eq:2} A(\rho) = \sum_{n=1}^8 \alpha_n \rho^{2n}. \end{equation} \index{rayTracing!conic!even\_asphere} <>= __host__ __device__ rtd even_asphere(rtd r2, int N, rtd *a) { int k; rtd A, _r2_; if (N==0) return 0.0; else { _r2_ = r2; A = a[0]*_r2_; for (k=1;k>= __host__ __device__ rtd partial_x_or_y_even_asphere(rtd x_or_y, rtd r2, int N, rtd *a) { <> return A; } @ with <>= int k; rtd A, _r2_; if (N==0) A = 0.0; else { _r2_ = 1; A = a[0]; for (k=1;k>= void conic::setup(rtd _c_, rtd _k_, vector _origin_, vector _euler_angles_) { c = _c_; k = _k_; origin.x = 0; origin.y = 0; origin.z = 0; ref_frame.setup(_origin_, _euler_angles_); <> } @ or with a surface centered on [[origin]] \index{rayTracing!conic!setup} <>= void conic::setup(rtd _c_, rtd _k_, vector _origin_, vector _euler_angles_, vector conic_origin) { c = _c_; k = _k_; origin.x = conic_origin.x; origin.y = conic_origin.y; origin.z = conic_origin.z; ref_frame.setup(_origin_, _euler_angles_); <> info(); } @ and with the refractive index <>= void conic::setup(rtd _c_, rtd _k_, vector _origin_, vector _euler_angles_, vector conic_origin, rtd _refractive_index_) { c = _c_; k = _k_; origin.x = conic_origin.x; origin.y = conic_origin.y; origin.z = conic_origin.z; ref_frame.setup(_origin_, _euler_angles_); <> refractive_index = _refractive_index_; } @ The parameters of an even asphere surface are set with <>= void conic::setup(rtd _c_, rtd _k_, vector _origin_, vector _euler_angles_, vector conic_origin, rtd _refractive_index_, int asphere_N, rtd *asphere_a) { c = _c_; k = _k_; origin.x = conic_origin.x; origin.y = conic_origin.y; origin.z = conic_origin.z; ref_frame.setup(_origin_, _euler_angles_); <> refractive_index = _refractive_index_; even_asphere_N = asphere_N; HANDLE_ERROR( cudaMalloc((void**)&d__even_asphere_a, sizeof(rtd)*even_asphere_N ) ); HANDLE_ERROR( cudaMemcpy( d__even_asphere_a, &asphere_a, sizeof(rtd)*even_asphere_N, cudaMemcpyHostToDevice ) ); } @ A conic surface that sets in the GCS is simply defined with \index{rayTracing!conic!setup} <>= void conic::setup(rtd _c_, rtd _k_) { c = _c_; k = _k_; origin.x = 0; origin.y = 0; origin.z = 0; ref_frame.setup(); <> } @ Some common variables are initialized with: <>= refractive_index = 1.0; HANDLE_ERROR( cudaMalloc((void**)&d__origin, sizeof(vector) ) ); HANDLE_ERROR( cudaMemcpy( d__origin, &origin, sizeof(vector), cudaMemcpyHostToDevice ) ); even_asphere_N = 0; d__even_asphere_a = NULL; @ The GMT M1 segmented conic is defined with <>= void conic::setup_GMT_M1(void) { c = 1./36.0; k = 1 - 0.9982857; D_seg = 8.365; ri = 2.4412/8.365; N = 7; vector origin[7]; vector euler_angles[7]; origin[0].x = origin[0].y = origin[0].z = 0.0; euler_angles[0].x = euler_angles[0].y = euler_angles[0].z = 0.0; rtd D_c, o, zo, sa; sa = sin(13.522*PI/180); D_c = 8.710 - (0.691-0.445)*sa; zo = 8.417*sa*0.5 + 0.691 - 0.445; int k; for (k=1; k>= void conic::cleanup(void) { INFO("@(CEO)>conic: freeing memory!\n"); ref_frame.cleanup(); HANDLE_ERROR( cudaFree( d__origin ) ); if (d__even_asphere_a!=NULL) HANDLE_ERROR( cudaFree( d__even_asphere_a ) ); } @ Ray tracing, to and through the surface, is computed with <>= void conic::trace(bundle *rays) { transform_to_S_kernel LLL 1 , 1 RRR (rays->d__chief_ray, 1, ref_frame.d__R, ref_frame.d__origin); dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(rays->N_RAY/N_THREAD2+1,1); transform_to_S_kernel LLL gridDim , blockDim RRR (rays->d__ray, rays->N_RAY, ref_frame.d__R, ref_frame.d__origin); intersect_chief_kernel LLL 1 , 1 RRR (rays->d__chief_ray, 1, k, c, d__origin, even_asphere_N, d__even_asphere_a); intersect_kernel LLL gridDim , blockDim RRR (rays->d__ray, rays->N_RAY, k, c, d__origin, rays->d__chief_ray, even_asphere_N, d__even_asphere_a); if (rays->refractive_index==refractive_index) reflect(rays); else { refract(rays, rays->refractive_index/refractive_index); rays->refractive_index = refractive_index; } transform_to_R_kernel LLL 1 , 1 RRR (rays->d__chief_ray, 1, ref_frame.d__R, ref_frame.d__origin); transform_to_R_kernel LLL gridDim , blockDim RRR (rays->d__ray, rays->N_RAY, ref_frame.d__R, ref_frame.d__origin); } @ <>= void conic::info(void) { INFO("\n\x1B[1;42m@(CEO)>conic:\x1B[;42m\n"); INFO(" . curvature : %g\n",c); INFO(" . conic constant : %g\n",k); INFO(" . refractive index: %g\n",refractive_index); INFO("----------------------------------------------------\x1B[0m\n"); ref_frame.info(); } @ \section{Zernike surface} \label{sec:zernike-surface} \index{rayTracing!zernikeS} A Zernike surface is defined as the weighted sum of Zernike polynomials and it is represented with the [[zernikeS]] structure: <>= struct zernikeS { <> void setup(int max_n, rtd *a); void setup(int _max_n_, rtd *_a_, int _N_); void setup(int max_n, rtd *a, vector _origin_, vector _euler_angles_); void setup(int max_n, rtd *a, vector _origin_, vector _euler_angles_, int _N_); void cleanup(void); void surface(rtd *S, rtd *r, rtd *o, const int N); void surface(rtd *S, rtd *r, rtd *o, const int N, int surf_id); void update(rtd *a); void surface_derivative_coefs(void); void surface_derivatives(rtd *d__dSdx, rtd *d__dSdy, rtd *d__r, rtd *d__o, const int N); void surface_and_derivatives(rtd *d__S, rtd *d__dSdx, rtd *d__dSdy, rtd *d__r, rtd *d__o, const int N); void surface_and_derivatives(rtd *d__S, rtd *d__dSdx, rtd *d__dSdy, rtd *d__r, rtd *d__o, const int N, int surf_id); void projection(float *d__phase, rtd *d__r, rtd *d__o, const int N); }; @ A Zernike surface is given by \begin{equation} \label{eq:43} \varphi\left( \vec r \right) = \sum_{j=1}^J a_j Z_j\left(\vec r\right), \end{equation} where $a_j$ is the Zernike coefficients corresponding to the Zernike polynomials $Z_j\left(\vec r\right)$ and $\vec r$ is a vector defined such as $0\leq r \geq 1$. Zernike polynomials are defined as: \begin{equation} \label{eq:44} Z_j\left(\vec r\right) = \sqrt{n+1} R_{nm}(r) A_{jm}(\theta), \end{equation} where \begin{equation} \label{eq:45} R_{nm}(r) = \sum_{k=0}^{n-m\over 2}(-1)^k{(n-k)! \over k!\left( {n+|m|\over 2} -k \right)!\left( {n-|m|\over 2} -k \right)!}r^{n-2k}, \end{equation} and \begin{equation} \label{eq:46} A_{jm}(\theta) = 2^{1-\delta_{m0}\over 2}\cos\left( m\theta + (1-\delta_{m0})((-1)^j-1){\pi\over 4} \right), \end{equation} with $\delta_{m0}$ the Kronecker symbol. The parameters of the [[zernikeS]] structure are \begin{itemize} \item the Zernike mode [[j]], radial order [[n]] and azimuthal order [[m]] <>= int max_n; unsigned int j, n, m, n_mode; @ \item the Zernike coeffcients [[a]] <>= rtd *a, *d__a; @ \item the Zernike derivative coefficients [[bx]] and [[by]] <>= rtd *bx, *by, *d__bx, *d__by; @ \item the arrays for the sparse column format storage of [[bx]] and [[by]] <>= unsigned int *bx_row_idx, *bx_col_ptr, *by_row_idx, *by_col_ptr, bx_nnz, by_nnz; @ \item the Zernike surface derivative coefficients [[c]] <>= rtd *cx, *d__cx, *cy, *d__cy; @ \item the number of Zernike surfaces [[N]] <>= int N; @ \end{itemize} Eq.~(\ref{eq:43}) is re--written \begin{equation} \label{eq:51} \varphi\left( \vec r \right) = \sum_{n=0}^N \sqrt{n+1} \sum_{m=n}^{ \begin{array}{c} m=m-2\\ m\geq 0 \end{array} } R_{nm}(r) \left\{ \begin{array}{l} \sqrt{2} \left[ a_j \cos(m\theta) + a_j\sin(m\theta) \right] \\ a_j \end{array} \right\} \end{equation} The Zernike surface is defined in a given coordinate system: <>= coordinate_system ref_frame; @ \subsection{Setup \& Cleanup} \label{sec:setup--cleanup-3} A [[zernikeS]] structure is initialized with the largest radial order in the surface and the series of Zernike coefficients for all the modes up to that radial order: \index{rayTracing!zernikeS!setup} <>= void zernikeS::setup(int _max_n_, rtd *_a_) { N = 1; max_n = _max_n_; n_mode = (max_n+1.0)*(max_n+2.0)*0.5; int n_byte = sizeof(rtd)*n_mode; a = (rtd *)malloc( n_byte ); memcpy( a, _a_, n_byte); HANDLE_ERROR( cudaMalloc((void**)&d__a, n_byte ) ); HANDLE_ERROR( cudaMemcpy( d__a, a, n_byte, cudaMemcpyHostToDevice ) ); ref_frame.setup(); <> } @ The origin vector and Euler angles of the coordinate systems where the Zernike polynomials are defined can be passed as arguments: \index{rayTracing!zernikeS!setup} <>= void zernikeS::setup(int _max_n_, rtd *_a_, vector _origin_, vector _euler_angles_) { N = 1; max_n = _max_n_; n_mode = (max_n+1.0)*(max_n+2.0)*0.5; int n_byte = sizeof(rtd)*n_mode; a = (rtd *)malloc( n_byte ); memcpy( a, _a_, n_byte); HANDLE_ERROR( cudaMalloc((void**)&d__a, n_byte ) ); HANDLE_ERROR( cudaMemcpy( d__a, a, n_byte, cudaMemcpyHostToDevice ) ); ref_frame.setup(_origin_, _euler_angles_); <> } @ An array of [[N]] Zernike surface is created with \index{rayTracing!zernikeS!setup} <>= void zernikeS::setup(int _max_n_, rtd *_a_, int _N_) { N = _N_; max_n = _max_n_; n_mode = (max_n+1.0)*(max_n+2.0)*0.5; int n_byte = sizeof(rtd)*n_mode*N; a = (rtd *)malloc( n_byte ); memcpy( a, _a_, n_byte); HANDLE_ERROR( cudaMalloc((void**)&d__a, n_byte ) ); HANDLE_ERROR( cudaMemcpy( d__a, a, n_byte, cudaMemcpyHostToDevice ) ); ref_frame.setup(); <> } @ or with \index{rayTracing!zernikeS!setup} <>= void zernikeS::setup(int _max_n_, rtd *_a_, vector _origin_, vector _euler_angles_, int _N_) { N = _N_; max_n = _max_n_; n_mode = (max_n+1.0)*(max_n+2.0)*0.5; int n_byte = sizeof(rtd)*n_mode*N; a = (rtd *)malloc( n_byte ); memcpy( a, _a_, n_byte); HANDLE_ERROR( cudaMalloc((void**)&d__a, n_byte ) ); HANDLE_ERROR( cudaMemcpy( d__a, a, n_byte, cudaMemcpyHostToDevice ) ); ref_frame.setup(_origin_, _euler_angles_); <> } @ where <>= if (max_n==0) return; INFO("Computing Zernike derivative coefficients: ...."); int nel = n_mode*n_mode/2; int n_col_ptr = (max_n+1.0)*max_n*0.5 + 1; bx = (rtd *) malloc( sizeof(rtd)*nel); bx_row_idx = (unsigned int *) malloc( sizeof(unsigned int)*nel); bx_col_ptr = (unsigned int *) malloc( sizeof(unsigned int)*n_col_ptr); memset( bx_col_ptr, 0 , sizeof(unsigned int)*n_col_ptr ); by = (rtd *) malloc( sizeof(rtd)*nel); by_row_idx = (unsigned int *) malloc( sizeof(unsigned int)*nel); by_col_ptr = (unsigned int *) malloc( sizeof(unsigned int)*n_col_ptr); memset( by_col_ptr, 0 , sizeof(unsigned int)*n_col_ptr ); <> INFO("\b\b"); /* INFO("bx_nnz=%d\n",bx_nnz); INFO("b ; row_idx ; col_ptr\n"); for (int k=0;k>= int j, n, m, jp, np, mp, kx=0, ky=0; for (np=0;np> ++jp; if (mp>0) { <> ++jp; } mp += 2; } } bx_col_ptr[jp-1] = kx; bx_nnz = kx; by_col_ptr[jp-1] = ky; by_nnz = ky; @ <>= for (n=np+1;n<=max_n;n++) { j = n*(n+1)/2 + 1; m = n%2; while (m<=n) { <> ++j; if (m>0) { <> ++j; } m += 2; } } bx_col_ptr[jp] = kx; by_col_ptr[jp] = ky; @ <>= if (zern_dx_coef(bx+kx,j,n,m,jp,np,mp)) { bx_row_idx[kx] = j-1; ++kx; } if (zern_dy_coef(by+ky,j,n,m,jp,np,mp)) { by_row_idx[ky] = j-1; ++ky; } @ From the Zernike derivative coefficients, the coefficients of the Zernike surface derivative are computed: \index{rayTracing!zernikeS!surface\_derivative\_coefs} <>= void zernikeS::surface_derivative_coefs(void) { int k,l,n,p, idx_a, idx_c; n = (max_n+1.0)*max_n*0.5; for (p=0;p>= void zernikeS::update(rtd *_a_) { int n_byte = sizeof(rtd)*n_mode*N; memcpy( a, _a_, n_byte); HANDLE_ERROR( cudaMemcpy( d__a, a, n_byte, cudaMemcpyHostToDevice ) ); surface_derivative_coefs(); int n_col_ptr = (max_n+1.0)*max_n*0.5 + 1; n_byte = N*sizeof(rtd)*(n_col_ptr-1); HANDLE_ERROR( cudaMemcpy( d__cx, cx, n_byte, cudaMemcpyHostToDevice ) ); HANDLE_ERROR( cudaMemcpy( d__cy, cy, n_byte, cudaMemcpyHostToDevice ) ); } @ Memory is freed with: \index{rayTracing!zernikeS!cleanup} <>= void zernikeS::cleanup(void) { INFO("@(CEO)>zernikeS: freeing memory!\n"); free( a ); HANDLE_ERROR( cudaFree( d__a) ); if (max_n>0) { free( bx ); free( bx_row_idx ); free( bx_col_ptr ); free( by ); free( by_row_idx ); free( by_col_ptr ); free( cx ); free( cy ); HANDLE_ERROR( cudaFree( d__cx) ); HANDLE_ERROR( cudaFree( d__cy) ); } } @ \subsection{Zernike surface equation} \label{sec:zern-surf-equat} \index{rayTracing!zernikeS!surface} <>= void zernikeS::surface(rtd *d__S, rtd *d__r, rtd *d__o, const int N) { dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(N/N_THREAD2+1,1); surface_kern LLL gridDim, blockDim RRR (d__S, d__r, d__o, N, max_n, d__a); } @ \index{rayTracing!zernikeS!surface} <>= void zernikeS::surface(rtd *d__S, rtd *d__r, rtd *d__o, const int N, int surf_id) { //INFO("a offset = %d\n",surf_id*n_mode); dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(N/N_THREAD2+1,1); surface_kern LLL gridDim, blockDim RRR (d__S, d__r, d__o, N, max_n, d__a + surf_id*n_mode); } @ with <>= __global__ void surface_kern(rtd *S, rtd *r, rtd *o, const int N, int max_n, rtd *a) { int i, j, k; i = blockIdx.x * blockDim.x + threadIdx.x; j = blockIdx.y * blockDim.y + threadIdx.y; k = j * gridDim.x * blockDim.x + i; if (k>= __host__ __device__ rtd zernike_surface(rtd r, rtd o, int max_n, rtd *a) { int n, m, mH, a_idx,j; rtd R, R2, R4, A, S_n, S, H1, H2, H3, sm, cm, s2, c2, s ,c, sqrt2; if (max_n<0)//( (r>1.0) || (max_n<0) ) S = 0.0; else { R = 1.0; S = a[0]*R; <> } return S; } @ The Zernike surface and its partial derivatives with respect to x and y can be computed simultaneously with <>= __host__ __device__ void zernike_surface_and_partials(rtd *ZS, rtd *dZSdx, rtd *dZSdy, rtd r, rtd o, int max_n, rtd *a, rtd *ax, rtd *ay) { int n, m, mH, a_idx,j; rtd R, R2, R4, A, Ax, Ay, S_n, Sx_n, Sy_n, S, Sx, Sy, H1, H2, H3, sm, cm, s2, c2, s ,c, sqrt2; if (max_n==0) {//( (r>1.0) || (max_n<0) ) S = a[0]; Sx = Sy = 0.0; } else { R = 1.0; S = a[0]*R; Sx = ax[0]*R; Sy = ay[0]*R; <> } ZS[0] = S; dZSdx[0] = Sx; dZSdy[0] = Sy; } @ The Zernike surface is computed by summing all the azimuthal order of a each radial order from the highest to the lowest azimuthal order. The Zernike coefficients [[a]] are ordered by increasing azimuthal order. <>= sqrt2 = sqrt(2.0); sincos(2*o,&s2,&c2); for (n=1;n<=max_n;n++) { j = (n+1)*(n+2)/2; a_idx = j - 1; m = n; R = pow(r,n); sincos(m*o, &sm, &cm); if (j%2) { A = a[a_idx--]*sm; A += a[a_idx--]*cm; } else { A = a[a_idx--]*cm; A += a[a_idx--]*sm; } j -= 2; A *= sqrt2; S_n = R*A; m -= 2; if (m>=0) { R2 = n*R - (n-1.0)*pow(r,m); <> S_n += R2*A; } m -= 2; while (m>=0) { mH = m + 4; if (r>0) { <

> <

> <> <> } else { R4 = (m==0) ? pow(-1.0,0.5n) : 0.0; A = 1.0; } S_n += R4A; R = R2; R2 = R4; m -= 2; } S += sqrt(n+1.0)S_n; } @ The azimuthal function are computed in a decreasing $m$ order starting from $m=n$, to $n-2$, $n-4$,... The azimuthal function are derived using the following recurrence relation \begin{eqnarray} \label{eq:54} \cos(m-2\theta) &=& \cos(m\theta)\cos(2\theta) + \sin(m\theta)\sin(2\theta) \\ \sin(m-2\theta) &=& \sin(m\theta)\cos(2\theta) - \cos(m\theta)\sin(2\theta) \end{eqnarray} <>= if (m>0) { c = cmc2 + sms2; s = smc2 - cms2; if (j%2) { A = a[a_idx--]s; A += a[a_idx--]c; } else { A = a[a_idx--]c; A += a[a_idx--]s; } j -= 2; A = sqrt2; cm = c; sm = s; } else { A = a[a_idx--]; --j; } @ The radial functions $R_{nm}(r)$ are derived from the recurrence relation\cite{CRM03}: \begin{equation} \label{eq:47} R_{n(m-4)}(r) = H_1R_{nm}(r) + \left( H_2 + {H_3 \over r^2} \right) R_{n(m-2)}(r), \end{equation} <>= R4 = H1R + ( H2 + H3/(rr) )R2; @ starting at $m=n$ and with \begin{equation} \label{eq:52} R_{nn}(r) = r^n, \end{equation} and \begin{equation} \label{eq:53} R_{n(n-2)}(r) = nR_{nn}(r) - (n-1)R_{(n-2)(n-2)}(r). \end{equation} @ where \begin{equation} \label{eq:48} H_1 = {m(m-1) \over 2} - mH_2 + H_3{ (n+m+2)(n-m) \over 8 }, \end{equation} <
>= H1 = mH(mH-1.0)0.5 - mHH2 + H3(n+mH+2.0)(n-mH)0.125; @ \begin{equation} \label{eq:49} H_2 = H_3{(n+m)(n-m+2) \over 4(m-1) } + (m-2), \end{equation} <
>= H2 = H30.25(n+mH)(n-mH+2.0)/(mH-1.0) + mH - 2.0; @ and \begin{equation} \label{eq:50} H_3 = {-4(m-2)(m-3) \over (n+m-2)(n-m+4) }. \end{equation} <
>= H3 = -4.0(mH-2.0)(mH-3.0)/((n+mH-2.0)(n-mH+4.0)); @ A modification of the above algorithm to compute simultaneously the surface and its partial derivatives: <>= sqrt2 = sqrt(2.0); sincos(2o,&s2,&c2); for (n=1;n<=max_n-1;n++) { j = (n+1)(n+2)/2; a_idx = j - 1; m = n; R = pow(r,n); sincos(mo, &sm, &cm); if (j%2) { Ax = ax[a_idx]sm; Ay = ay[a_idx]sm; A = a[a_idx--]sm; Ax += ax[a_idx]cm; Ay += ay[a_idx]cm; A += a[a_idx--]cm; } else { Ax = ax[a_idx]cm; Ay = ay[a_idx]cm; A = a[a_idx--]cm; Ax += ax[a_idx]sm; Ay += ay[a_idx]sm; A += a[a_idx--]sm; } j -= 2; Ax = sqrt2; Ay = sqrt2; A = sqrt2; Sx_n = RAx; Sy_n = RAy; S_n = RA; m -= 2; if (m>=0) { R2 = nR - (n-1.0)pow(r,m); <> Sx_n += R2Ax; Sy_n += R2Ay; S_n += R2A; } m -= 2; while (m>=0) { mH = m + 4; if (r>0) { <
> <
> <
> <> <> } else { R4 = (m==0) ? pow(-1.0,0.5n) : 0.0; Ax = 1.0; Ay = 1.0; A = 1.0; } Sx_n += R4Ax; Sy_n += R4Ay; S_n += R4A; R = R2; R2 = R4; m -= 2; } Sx += sqrt(n+1.0)Sx_n; Sy += sqrt(n+1.0)Sy_n; S += sqrt(n+1.0)S_n; } n = max_n; j = (n+1)(n+2)/2; a_idx = j - 1; m = n; R = pow(r,n); sincos(mo, &sm, &cm); if (j%2) { A = a[a_idx--]sm; A += a[a_idx--]cm; } else { A = a[a_idx--]cm; A += a[a_idx--]sm; } j -= 2; A = sqrt2; S_n = RA; m -= 2; if (m>=0) { R2 = nR - (n-1.0)pow(r,m); <> S_n += R2A; } m -= 2; while (m>=0) { mH = m + 4; if (r>0) { <
> <
> <
> <> <> } else { R4 = (m==0) ? pow(-1.0,0.5n) : 0.0; A = 1.0; } S_n += R4A; R = R2; R2 = R4; m -= 2; } S += sqrt(n+1.0)S_n; @ with <>= if (m>0) { c = cmc2 + sms2; s = smc2 - cms2; if (j%2) { Ax = ax[a_idx]s; Ay = ay[a_idx]s; A = a[a_idx--]s; Ax += ax[a_idx]c; Ay += ay[a_idx]c; A += a[a_idx--]c; } else { Ax = ax[a_idx]c; Ay = ay[a_idx]c; A = a[a_idx--]c; Ax += ax[a_idx]s; Ay += ay[a_idx]s; A += a[a_idx--]s; } j -= 2; Ax = sqrt2; Ay = sqrt2; A = sqrt2; cm = c; sm = s; } else { Ax = ax[a_idx]; Ay = ay[a_idx]; A = a[a_idx--]; --j; } @ \subsection{Zernike surface derivative} \label{sec:zern-surf-deriv} The partial derivative of the Zernike surface given in Eq.~(\ref{eq:43}) is written \begin{equation} \label{eq:55} {\partial \varphi \left( \vec r \right) \over \partial x } = \sum_{j=2}^N a_j {\partial Z_j \left( \vec r \right) \over \partial x }, \end{equation} where \begin{equation} \label{eq:56} {\partial Z_j \left( \vec r \right) \over \partial x } = \sum_{k=1}^{j-1} b_{jk}^x Z_k \left( \vec r \right) \end{equation} Inserting Eq.~(\ref{eq:55}) into Eq.~(\ref{eq:56}) leads to \begin{equation} \label{eq:57} {\partial \varphi \left( \vec r \right) \over \partial x } = \sum_{j=2}^N a_j \sum_{k=1}^{j-1} b_{jk}^x Z_k \left( \vec r \right) = \sum_{k=1}^{N-1} Z_k \left( \vec r \right) \sum_{j={k+1}}^N a_jb_{jk}^x = \sum_{k=1}^{N-1} Z_k \left( \vec r \right) c_{k}^x, \end{equation} with \begin{equation} \label{eq:58} c_k^x = \sum_{j={k+1}}^N a_jb_{jk}^x. \end{equation} The x and y derivatives of the Zernike surface are computed with \index{rayTracing!zernikeS!surface\_derivatives} <>= void zernikeS::surface_derivatives(rtd ddSdx, rtd ddSdy, rtd dr, rtd do, const int N) { dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(N/N_THREAD2+1,1); surface_kern LLL gridDim, blockDim RRR (ddSdx, dr, d__o, N, max_n-1, d__cx); surface_kern LLL gridDim, blockDim RRR (ddSdy, dr, d__o, N, max_n-1, d__cy); } @ Both derivatives depends on the projection coefficients of Zernike x and y derivatives: <>= int zern_dx_coef(rtd b, int j, int n, int m, int jp, int np, int mp) { int delta_m, rule_0, rule_1, rule_2, rule_3; delta_m = mp - m; rule_0 = (delta_m==1) || (delta_m==-1); rule_1 = (j-jp)%2 == 0 && !( (m==0) || (mp==0) ); rule_2 = ( (m==0) && (mp!=0) ) && (jp%2 == 0); rule_3 = ( (m!=0) && (mp==0) ) && (j%2 == 0); if ( rule_0 && (rule_1||rule_2||rule_3) ) b = sqrt( (n+1.0)(np+1.0) ); else return 0; if ( (m==0) || (mp==0) ) b = sqrt(2.0); return 1; } @ <>= int zern_dy_coef(rtd b, int j, int n, int m, int jp, int np, int mp) { int delta_m, rule_0, rule_1, rule_2, rule_3, sign_rule_1, sign_rule_2; delta_m = mp - m; rule_0 = (delta_m==1) || (delta_m==-1); rule_1 = (j-jp)%2 == 1 && !( (m==0) || (mp==0) ); rule_2 = ( (m==0) && (mp!=0) ) && (jp%2 == 1); rule_3 = ( (m!=0) && (mp==0) ) && (j%2 == 1); if ( rule_0 && (rule_1||rule_2||rule_3) ) b = sqrt( (n+1.0)(np+1.0) ); else return 0; sign_rule_1 = (delta_m==+1) && (j%2 == 1); sign_rule_2 = (delta_m==-1) && (j%2 == 0); if ( ( (m!=0) && (mp!=0) ) && ( sign_rule_1 || sign_rule_2 ) ) b = -1; if ( (m==0) || (mp==0) ) b = sqrt(2.0); return 1; } @ \subsection{Zernike surface and derivatives} \label{sec:zern-surf-deriv-1} \index{rayTracing!zernikeS!surface\_and\_derivatives} <>= void zernikeS::surface_and_derivatives(rtd dS, rtd ddSdx, rtd ddSdy, rtd dr, rtd d__o, const int N) { dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(N/N_THREAD2+1,1); surface_and_derivatives_kern LLL gridDim, blockDim RRR (dS, ddSdx, ddSdy, dr, d__o, N, max_n, da, dcx, d__cy); } @ \index{rayTracing!zernikeS!surface} <>= void zernikeS::surface_and_derivatives(rtd dS, rtd ddSdx, rtd ddSdy, rtd dr, rtd d__o, const int N, int surf_id) { //INFO("a offset = %d\n",surf_idn_mode); dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(N/N_THREAD2+1,1); surface_and_derivatives_kern LLL gridDim, blockDim RRR (dS, ddSdx, ddSdy, dr, d__o, N, max_n, d__a + surf_idn_mode, d__cx + surf_idn_mode, d__cy + surf_idn_mode); } @ with <>= global void surface_and_derivatives_kern(rtd S, rtd dSdx, rtd dSdy, rtd r, rtd o, const int N, int max_n, rtd a, rtd ax, rtd ay) { int i, j, k; i = blockIdx.x blockDim.x + threadIdx.x; j = blockIdx.y * blockDim.y + threadIdx.y; k = j * gridDim.x * blockDim.x + i; if (k>= void zernikeS::projection(float dphase, rtd dr, rtd d__o, const int N) { int k; int n_byte = sizeof(rtd)n_mode; rtd *d__ap; HANDLE_ERROR( cudaMalloc((void**)&d__ap, n_byte ) ); HANDLE_ERROR( cudaMemset(d__ap, 0, n_byte ) ); dim3 blockDim(1,1); dim3 gridDim(1,1); for (k=0;k>= global void projection_kern(rtd a, float phase, rtd r, rtd o, const int N, int max_n, rtd ap, int mode) { int i; rtd num, denom, z; num = denom = 0.0; ap[mode] = 1.0; for (i=0; i>= struct aperture { <> void setup(rtd _D_, int _D_px_, vector _origin_, vector _euler_angles_); void setup(rtd _D_, rtd _ri_, int _D_px_, vector _origin_, vector _euler_angles_); void setup(rtd _D_, rtd _ri_, rtd _D_seg_, int _D_px_, vector _origin_, vector _euler_angles_, int N_segment); void setup_GMT_M1(rtd _D_, int _D_px_); void cleanup(void); void vignetting(bundle rays); }; @ A circular aperture is defined by its diameter [[D]] in meter of [[D_px]] in pixel. If the aperture is annular [[ri]] defines the ratio between the inner and outer diameter. The aperture can be segmented with [[N]] identical segments of diameter [[D_seg]]. The location of the aperture segments is defined within a given coordinate system [[ref_frame]]. A mask [[V]] is used to select the rays that are not vignetted by the aperture. <>= int D_px; rtd D, ri, D_seg; int N; mask V; coordinate_system ref_frame; @ \subsection{Setup \& Cleanup} \label{sec:aper-setup--cleanup} An aperture is initialized with: \begin{itemize} \item for a circular aperture, \index{rayTracing!aperture!setup} <>= void aperture::setup(rtd _D_, int _D_px_, vector _origin_, vector _euler_angles_) { D_px = _D_px_; D_seg = D = _D_; ri = 0.0; N = 1; V.setup(D_pxD_px); ref_frame.setup(_origin_, _euler_angles_); } @ \item for an annular aperture, \index{rayTracing!aperture!setup} <>= void aperture::setup(rtd _D_, rtd _ri_, int _D_px_, vector _origin_, vector _euler_angles_) { D_px = _D_px_; D_seg = D = _D_; ri = _ri_; N = 1; V.setup(D_pxD_px); ref_frame.setup(_origin_, _euler_angles_); } @ \item for an aperture with [[N_segment]] circular segment of diameter [[D_seg]], each segment with a different coordinate system, \index{rayTracing!aperture!setup} <>= void aperture::setup(rtd _D_, rtd _ri_, rtd _D_seg_, int _D_px_, vector _origin_, vector _euler_angles_, int N_segment) { D_px = _D_px_; D = _D_; D_seg = _D_seg_; ri = _ri_; N = N_segment; V.setup(D_pxD_pxN); ref_frame.setup(_origin_, _euler_angles_, N); } @ \end{itemize} The memory is freed with \index{rayTracing!aperture!cleanup} <>= void aperture::cleanup(void) { INFO("@(CEO)>aperture: freeing memory!\n"); V.cleanup(); ref_frame.cleanup(); } @ The vignetting of the rays are done with \index{rayTracing!aperture!vignetting} <>= void aperture::vignetting(bundle rays) { rtd R2, Rri2; R2 = D_segD_seg0.25; Rri2 = R2riri; //INFO("R2=%g - Rri2=%5.2f\n",R2,Rri2); dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(rays->N_RAY/N_THREAD2+1,1); HANDLE_ERROR( cudaMemset(V.m, 0, sizeof(char)rays->N_RAY ) ); vignetting_kernel LLL gridDim , blockDim RRR (V.m, rays->d__ray, rays->N_RAY, Rri2, R2, ref_frame.d__R, ref_frame.dorigin); intersection LLL gridDim , blockDim RRR (V.m, rays->dray, rays->N_RAY); } @ calling the device kernel: <>= global void vignetting_kernel(char mask, ray d__ray, int N_RAY, rtd inner2, rtd outer2, rtd dR, vector dorigin) { int i, j, ij, iCoordSys, idx; rtd rho2; rtd x, y, z, u, v, w, x1, y1, s0, k, l, m; i = blockIdx.x * blockDim.x + threadIdx.x; j = threadIdx.y; iCoordSys = blockIdx.y; ij = j * gridDim.x * blockDim.x + i; if ( ij>= global void intersection(char mask, ray d__ray, int N_RAY) { int i, j, ij, iSource; i = blockIdx.x * blockDim.x + threadIdx.x; j = threadIdx.y; ij = j * gridDim.x * blockDim.x + i; iSource = blockIdx.z; if ( ij>= void transform_to_S(bundle rays, conic F) { transform_to_S_kernel LLL 1 , 1 RRR (rays->d__chief_ray, 1, F->ref_frame.d__R, F->ref_frame.d__origin); dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(rays->N_RAY/N_THREAD2+1,1); transform_to_S_kernel LLL gridDim , blockDim RRR (rays->d__ray, rays->N_RAY, F->ref_frame.d__R, F->ref_frame.d__origin); } void transform_to_S(bundle rays, aperture A) { transform_to_S_kernel LLL 1 , 1 RRR (rays->d__chief_ray, 1, A->ref_frame.d__R, A->ref_frame.d__origin); dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(rays->N_RAY/N_THREAD2+1,1); transform_to_S_kernel LLL gridDim , blockDim RRR (rays->d__ray, rays->N_RAY, A->ref_frame.d__R, A->ref_frame.dorigin); } @ <>= global__ void transform_to_S_kernel(ray d__ray, int N_RAY, rtd dR, vector dorigin) { int i, j, ij; i = blockIdx.x blockDim.x + threadIdx.x; j = blockIdx.y * blockDim.y + threadIdx.y; ij = j * gridDim.x * blockDim.x + i; if ( (ij>= host device void forward_transform(vector v_out, vector v_in, rtd dR, vector dorigin) { rtd u, v, w; u = v_in->x - d__origin->x; v = v_in->y - d__origin->y; w = v_in->z - d__origin->z; v_out->x = dR[0]u + dR[3]v + d__R[6]w; v_out->y = dR[1]u + dR[4]v + d__R[7]w; v_out->z = dR[2]u + dR[5]v + dR[8]w; } host device__ void forward_transform_centered(vector v_out, vector v_in, rtd d__R) { rtd u, v, w; u = v_in->x; v = v_in->y; w = v_in->z; v_out->x = dR[0]u + dR[3]v + d__R[6]w; v_out->y = dR[1]u + dR[4]v + d__R[7]w; v_out->z = dR[2]u + dR[5]v + d__R[8]w; } @ <>= void transform_to_R(bundle rays, conic F) { transform_to_R_kernel LLL 1 , 1 RRR (rays->d__chief_ray, 1, F->ref_frame.d__R, F->ref_frame.d__origin); dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(rays->N_RAY/N_THREAD2+1,1); transform_to_R_kernel LLL gridDim , blockDim RRR (rays->d__ray, rays->N_RAY, F->ref_frame.d__R, F->ref_frame.d__origin); } void transform_to_R(bundle rays, aperture A) { transform_to_R_kernel LLL 1 , 1 RRR (rays->d__chief_ray, 1, A->ref_frame.d__R, A->ref_frame.d__origin); dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(rays->N_RAY/N_THREAD2+1,1); transform_to_R_kernel LLL gridDim , blockDim RRR (rays->d__ray, rays->N_RAY, A->ref_frame.d__R, A->ref_frame.dorigin); } @ <>= global__ void transform_to_R_kernel(ray d__ray, int N_RAY, rtd dR, vector dorigin) { int i, j, ij; i = blockIdx.x * blockDim.x + threadIdx.x; j = blockIdx.y * blockDim.y + threadIdx.y; ij = j * gridDim.x * blockDim.x + i; if ( (ij>= host device void backward_transform(vector v_out, vector v_in, rtd dR, vector dorigin) { rtd u, v, w; u = v_in->x; v = v_in->y; w = v_in->z; v_out->x = dR[0]u + dR[1]v + d__R[2]w; v_out->y = dR[3]u + dR[4]v + d__R[5]w; v_out->z = dR[6]u + dR[7]v + d__R[8]w; v_out->x += d__origin->x; v_out->y += d__origin->y; v_out->z += dorigin->z; } host device__ void backward_transform_centered(vector v_out, vector v_in, rtd d__R) { rtd u, v, w; u = v_in->x; v = v_in->y; w = v_in->z; v_out->x = dR[0]u + dR[1]v + d__R[2]w; v_out->y = dR[3]u + dR[4]v + d__R[5]w; v_out->z = dR[6]u + dR[7]v + d__R[8]w; } @ \subsection{Surface intersection} \label{sec:surface-intersection} <>= void intersect(bundle rays, conic F) { intersect_chief_kernel LLL 1 , 1 RRR (rays->d__chief_ray, 1, F->k, F->c, F->d__origin, F->even_asphere_N, F->d__even_asphere_a); dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(rays->N_RAY/N_THREAD2+1,1); intersect_kernel LLL gridDim , blockDim RRR (rays->d__ray, rays->N_RAY, F->k, F->c, F->dorigin, rays->dchief_ray, F->even_asphere_N, F->d__even_asphere_a); } <>= global void intersect_chief_kernel(ray d__ray, const int N_RAY, const rtd Fk, const rtd Fc, vector dorigin, const int N, rtd a) { int j, ij; rtd s0, s1, x1, y1, k, l, m, S, K, L ,M, dSds; vector vv; ij = 0; <> dray[ij].optical_path_length = s0; s0 = s1 = 0; for (j=0; j> s0 = s1; } } global void intersect_kernel(ray d__ray, int N_RAY, rtd Fk, const rtd Fc, vector dorigin, ray dchief_ray, int N, rtd a) { int i, j, ij; rtd s0, s1, x1, y1, k, l, m, S, K, L ,M, dSds; vector vv; i = blockIdx.x * blockDim.x + threadIdx.x; j = blockIdx.y * blockDim.y + threadIdx.y; ij = j * gridDim.x * blockDim.x + i; if ( (ij> d__ray[ij].optical_path_length = s0; s0 = s1 = 0; for (j=0; j> s0 = s1; } d__ray[ij].optical_path_difference += d__ray[ij].optical_path_length - d__chief_ray->optical_path_length; } } @ The intersection of a ray with the surface is derived using the parametric equations of the ray \begin{eqnarray} \label{eq:3} x &=& x_0 + ks \\ y &=& y_0 + ls \\ z &=& z_0 + ms \end{eqnarray} where $s$ is the distance along the ray from the point $(x_0,y_0,z_0)$. Eq.~(\ref{eq:3}) are inserted into the surface definition Eq.~(\ref{eq:4}) that is solved for $s$. The intersection with the plane $z=0$ in the LCS is derived first leading to \begin{eqnarray} \label{eq:5} s_0 &=& -z_0/m \\ x_1 &=& x_0 + ks_0 \\ y_1 &=& y_0 + ls_0 \end{eqnarray} <>= k = dray[ij].directions.x; l = dray[ij].directions.y; m = dray[ij].directions.z; if (m==0) { return; } s0 = -dray[ij].coordinates.z/m; x1 = dray[ij].coordinates.x + ks0; y1 = dray[ij].coordinates.y + ls0; @ and giving a new set of parametric equations \begin{eqnarray} \label{eq:6} x &=& x_1 + ks \\ y &=& y_1 + ls \\ z &=& ms \end{eqnarray} The distance $s$ to the surface is obtained with the Newton--Raphson iterative method \begin{equation} \label{eq:7} s_{j+1} = s_j - { F(x_j,y_j,z_j) \over F^\prime(x_j,y_j,z_j) } \end{equation} where \begin{eqnarray} \label{eq:8} x_j &=& x_1 + ks_j \\ y_j &=& y_1 + ls_j \\ z_j &=& ms_j \end{eqnarray} <>= vv.x = x1 + ks0; vv.y = y1 + ls0; vv.z = ms0; @ and where \begin{eqnarray} \label{eq:9} F^\prime(x_j,y_j,z_j) &=& \left. { {\mathrm d} F \over {\mathrm d} s } \right|_{s=s_j} \\ &=& k\left.{ \partial F(x,y,z) \over \partial x } \right|_j + l\left. { \partial F(x,y,z) \over \partial y }\right|_j + m\left.{ \partial F(x,y,z) \over \partial z }\right|_j \end{eqnarray} <>= S = conic_surface(&vv, d__origin, Fk, Fc, N, a); K = partial_x_conic_surface(&vv, d__origin, Fk, Fc, N, a); L = partial_y_conic_surface(&vv, d__origin, Fk, Fc, N, a); M = partial_z_conic_surface(); dSds = Kk + Ll + Mm; if (dSds==0) { return; } s1 = s0 - S/dSds; if (abs(s1-s0)>= K = d__ray[ij].surface_normal.x; L = d__ray[ij].surface_normal.y; M = d__ray[ij].surface_normal.z; G2 = KK + LL + MM; k = dray[ij].directions.x; l = dray[ij].directions.y; m = d__ray[ij].directions.z; a = mu(kK + lL + mM)/G2; @ and \begin{equation} \label{eq:18} b = { \mu^2 -1 \over K^2 + L^2 + M^2 }. \end{equation} <>= b = (mumu-1)/G2; @ Eq.~(\ref{eq:16}) is solved with the Newton--Raphson iterative method by introducing the new function \begin{equation} \label{eq:19} V(\Gamma) = \Gamma^2 + 2a\Gamma + b, \end{equation} and writing $\Gamma$ as \begin{equation} \label{eq:20} \Gamma_{j+1} = \Gamma_j - { V(\Gamma_j) \over V^\prime(\Gamma_j) }. \end{equation} Noting that \begin{equation} \label{eq:21} V^\prime(\Gamma_j) = \left. { \mathrm d V \over \mathrm d \Gamma } \right|_j = 2\left( \Gamma_j + a \right), \end{equation} Eq.~(\ref{eq:20}) becomes \begin{equation} \label{eq:22} \Gamma_{j+1} = { \Gamma_j^2 - b \over 2(\Gamma_j + a) }. \end{equation} with \begin{equation} \label{eq:23} \Gamma_1 = {-b \over 2a }. \end{equation} <>= void refract(bundle rays, const rtd mu) { refract_kernel LLL 1 , 1 RRR (rays->d__chief_ray, 1, mu); dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(rays->N_RAY/N_THREAD2+1,1); refract_kernel LLL gridDim , blockDim RRR (rays->d__ray, rays->N_RAY, mu); } @ <>= global void refract_kernel(ray d__ray, int N_RAY, const rtd mu) { int i, j, ij; rtd k, l, m, K, L ,M, G2, a, b, gamma0, gamma1, gamma_relative_error; i = blockIdx.x * blockDim.x + threadIdx.x; j = blockIdx.y * blockDim.y + threadIdx.y; ij = j * gridDim.x * blockDim.x + i; if ( (ij> <> gamma0 = -0.5b/a; for (j=0; j>= void reflect(bundle rays) { reflect_kernel LLL 1 , 1 RRR (rays->d__chief_ray, 1, 1.0); dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(rays->N_RAY/N_THREAD2+1,1); reflect_kernel LLL gridDim , blockDim RRR (rays->d__ray, rays->N_RAY, 1.0); } @ Setting $\mu=-1$ makes the mirror behaving like a thin lens: <>= void thin_lens(bundle rays) { dim3 blockDim(N_THREAD,N_THREAD); dim3 gridDim(rays->N_RAY/N_THREAD2+1,1); reflect_kernel LLL gridDim , blockDim RRR (rays->d__ray, rays->N_RAY, -1.0); } @ <>= global void reflect_kernel(ray d__ray, int N_RAY, float mu) { int i, j, ij; rtd k, l, m, K, L ,M, G2, a; i = blockIdx.x * blockDim.x + threadIdx.x; j = blockIdx.y * blockDim.y + threadIdx.y; ij = j * gridDim.x * blockDim.x + i; if ( (ij> a = -2.0; dray[ij].directions.x = muk + aK; dray[ij].directions.y = mul + aL; d__ray[ij].directions.z = mum + aM; } } @ \section{Input/Output} \label{sec:inputoutput} \section{Tests} \label{sec:tests} <>= <> @ \subsection{Test I} \label{sec:test-i} <>= #include #include #include #include "ceo.h" using namespace std; int main(int argc,char argv[]) { int N_GS, N_GS_max, nPx, k_nPx, k_GS, zern_j, zern_n, k; float elaspedTime, rms; rtd D; vector src_origin, zern_origin, zern_euler_angles; //ostream f; float zen, azi; D = 25.5; src_origin.x = 0.0; src_origin.y = 0.0; src_origin.z = 25.0; nPx = 256; stopwatch tid; source src; zernikeS zern; gmt_m1 M1; gmt_m2 M2; zern_n = 0; zern_j = (zern_n+1)(zern_n+2)/2; rtd a; a = (rtd )malloc( sizeof(rtd)zern_j ); for (k=0;k>= #include #include #include "ceo.h" using namespace std; int main(int argc,char argv[]) { int N_GS, N_GS_max, nPx, k_nPx, k_GS, zern_j, zern_n, k; float elaspedTime, rms; rtd D; vector src_origin, zern_origin, zern_euler_angles; ofstream f; float zen, azi; D = 25.5; src_origin.x = 0.0; src_origin.y = 0.0; src_origin.z = 25.0; nPx = 256; stopwatch tid; source src; zernikeS zern; gmt_m1 M1; gmt_m2 M2; zern_n = 6; zern_j = (zern_n+1)(zern_n+2)/2; rtd a; a = (rtd )malloc( sizeof(rtd)zern_j ); for (k=0;k>= #include #include #include "ceo.h" using namespace std; int main(int argc,char argv[]) { int N_GS, N_GS_max, nPx, k_nPx, k_GS, zern_j, zern_n, k; float elaspedTime; rtd D; vector src_origin, zern_origin, zern_euler_angles; ofstream f; float zen, azi; rtd a; D = 25.5; src_origin.x = 0.0; src_origin.y = 0.0; src_origin.z = 25.0; nPx = 256; stopwatch tid; source src; zernikeS zern; gmt_m1 M1; gmt_m2 M2; f.open("bench_zernike.txt"); f.precision(3); / f << "nPx"; / / for (k_GS=1;k_GS<=N_GS_max;k_GS++) / / f << "\t" << k_GS << "GS"; / / f << endl; / for (zern_n = 0;zern_n<11;zern_n++) { // f << zern_n; zern_j = (zern_n+1)(zern_n+2)/2; f << zern_j; a = (rtd )malloc( sizeof(rtd)zern_j ); for (k=0;k>= #include #include "ceo.h" /** /usr/local/cuda/bin/nvprof ./a.out / int main(int argc,char argv[]) { int N_GS, nPx, k, nIteration, zern_j, zern_n; rtd D; vector src_origin, zern_origin, zern_euler_angles; N_GS = 1; float zen[] = {0.0}; float azi[] = {0.0}; D = 25.5; src_origin.x = 0.0; src_origin.y = 0.0; src_origin.z = 25.0; nPx = 469; stopwatch tid; source src; src.setup("R",zen,azi,INFINITY,N_GS,D,nPx,src_origin); zernikeS zern; /* rtd a[] = {0.0}; / / zern_origin.x = zern_origin.y = zern_origin.z = 0.0; / / zern_euler_angles.x = zern_euler_angles.y = zern_euler_angles.z = 0.0; / / zern.setup(0,a,zern_origin,zern_euler_angles,7); / zern_n = 6; zern_j = (zern_n+1)(zern_n+2)/2; rtd a; a = (rtd )malloc( sizeof(rtd)*zern_j ); for (k=0;k

> <

> <

>= H1 = mH*(mH-1.0)*0.5 - mH*H2 + H3*(n+mH+2.0)*(n-mH)*0.125; @ \begin{equation} \label{eq:49} H_2 = H_3{(n+m)(n-m+2) \over 4(m-1) } + (m-2), \end{equation} <

>= H2 = H3*0.25*(n+mH)*(n-mH+2.0)/(mH-1.0) + mH - 2.0; @ and \begin{equation} \label{eq:50} H_3 = {-4(m-2)(m-3) \over (n+m-2)(n-m+4) }. \end{equation} <

> <

> <

> <

> <

>= H1 = mH(mH-1.0)0.5 - mHH2 + H3(n+mH+2.0)(n-mH)0.125; @ \begin{equation} \label{eq:49} H_2 = H_3{(n+m)(n-m+2) \over 4(m-1) } + (m-2), \end{equation} <

>= H2 = H30.25(n+mH)*(n-mH+2.0)/(mH-1.0) + mH - 2.0; @ and \begin{equation} \label{eq:50} H_3 = {-4(m-2)(m-3) \over (n+m-2)(n-m+4) }. \end{equation} <