d8/df4/05__dense__b_8parallel_8c_source.html

 #include "c_backend_api.h"

 #ifdef BAMBU_PROFILING
 extern void __builtin_bambu_time_start();
 extern void __builtin_bambu_time_stop();
 #endif

 TVMValue param[4];
 TVMArray a0[1];
 TVMArray a1[1];
 TVMArray a2[1];
 TVMArray a3[1];

 __attribute__((noinline))
 void kernel(int32_t y_outer_x_outer_fused, float *compute, float* placeholder, float* placeholder1)
 {
     float compute1[1];
     compute1[0] = 0.000000e+00f;
     compute1[0] = (compute1[0] + (placeholder[0] * placeholder1[y_outer_x_outer_fused]));
     compute[y_outer_x_outer_fused] = 0.000000e+00f;
     compute[y_outer_x_outer_fused] = (compute[y_outer_x_outer_fused] + compute1[0]);
 }

 __attribute__((noinline))
 void parallel(float *compute, float* placeholder, float* placeholder1)
 {
    int32_t y_outer_x_outer_fused;
    #pragma omp parallel for
    for (y_outer_x_outer_fused = 0; y_outer_x_outer_fused < 64; ++y_outer_x_outer_fused)
    {
         kernel(y_outer_x_outer_fused, compute, placeholder, placeholder1);
    }
 }

 __attribute__((noinline))
 int32_t fused_nn_dense_add( void* args,  void* arg_type_ids, int32_t num_args)
 {

   void* arg0 = (((TVMValue*)args)[0].v_handle);
   float* placeholder = (float*)(((TVMArray*)arg0)[0].data);

   void* arg1 = (((TVMValue*)args)[1].v_handle);
   float* placeholder1 = (float*)(((TVMArray*)arg1)[0].data);

   void* arg2 = (((TVMValue*)args)[2].v_handle);
   float* placeholder2 = (float*)(((TVMArray*)arg2)[0].data);

   void* arg3 = (((TVMValue*)args)[3].v_handle);
   float* T_add = (float*)(((TVMArray*)arg3)[0].data);

   float compute[64];

   parallel(compute, placeholder, placeholder1);
   int32_t ax1;
   for (ax1 = 0; ax1 < 64; ++ax1) {
     T_add[ax1] = (compute[ax1] + placeholder2[ax1]);
   }
   return 0;
 }

 int32_t fused_nn_dense_add_wrapper(float* placeholder, float* placeholder1, float* placeholder2, float* T_add)
 {
   int32_t res;
   a0[0].data = placeholder;
   a1[0].data = placeholder1;
   a2[0].data = placeholder2;
   a3[0].data = T_add;
   param[0].v_handle = a0;
   param[1].v_handle = a1;
   param[2].v_handle = a2;
   param[3].v_handle = a3;
 #ifdef BAMBU_PROFILING
   __builtin_bambu_time_start();
 #endif

   res = fused_nn_dense_add(param, 0, 0);

 #ifdef BAMBU_PROFILING
   __builtin_bambu_time_stop();
 #endif

   return res;
 }
fused_nn_dense_add
TVM_DLL int32_t fused_nn_dense_add(void *args, void *arg_type_ids, int32_t num_args)
Definition: 04_dense_a.cc:7

__builtin_bambu_time_start
void __builtin_bambu_time_start()

TVMValue::v_handle
void * v_handle
Definition: c_runtime_api.h:154

compute
int compute(int a, int b, int c, int d, int e, int f, int g, int expected)
Definition: main.c:10

a0
TVMArray a0[1]
Definition: 05_dense_b.parallel.c:9

a3
TVMArray a3[1]
Definition: 05_dense_b.parallel.c:12

TVMValue
Union type of values being passed through API and function calls.
Definition: c_runtime_api.h:151

DLTensor::data
void * data
The opaque data pointer points to the allocated data. This will be CUDA device pointer or cl_mem hand...
Definition: dlpack.h:131

kernel
void kernel(unsigned vertex, unsigned *p_Qnext, unsigned *Qnext_N, unsigned *map)
Definition: bfs.c:44

__attribute__
__attribute__((noinline))
Convert the given fixedpt number to a decimal string.
Definition: 05_dense_b.parallel.c:14

test_panda.args
args
Definition: test_panda.py:468

a1
TVMArray a1[1]
Definition: 05_dense_b.parallel.c:10

a2
TVMArray a2[1]
Definition: 05_dense_b.parallel.c:11

c_backend_api.h

param
TVMValue param[4]
Definition: 05_dense_b.parallel.c:8

DLTensor
Plain C Tensor object, does not manage memory.
Definition: dlpack.h:111

fused_nn_dense_add_wrapper
int32_t fused_nn_dense_add_wrapper(float *placeholder, float *placeholder1, float *placeholder2, float *T_add)
Definition: 05_dense_b.parallel.c:61

__builtin_bambu_time_stop
void __builtin_bambu_time_stop()