Arreglo de sum de integers sin signo de 8 bits utilizando el marco de aceleración

¿Puedo usar Accelerate Framework para sumr una matriz de numbers integers sin signo de 8 bits sin convertir a una matriz de flotadores.

Mi enfoque actual es:

vDSP_vfltu8(intArray, 1, floatArray, 1, size); vDSP_sve(floatArray, 1, &result, size); 

Pero vDSP_vfltu8 es bastante lento.

  1. Si es importante para usted que vDSP_vfltu8( ) sea ​​rápido, presente un informe de error . Si hay alguna pregunta, presente un informe de error . El performance inadecuado es un error y será tratado como tal si lo informa. Los escritores de bibliotecas usan este tipo de comentarios para determinar cómo priorizar su trabajo; su informe de errores es la diferencia entre una function que está al frente de la queue para la optimization y que es # 1937 en la queue.
  2. Como se ha insinuado, la acumulación de integers se complica por las preocupaciones de desbordamiento, pero si fuera útil tener una function optimizada para un caso específico provisto por la biblioteca vDSP, por favor, presente un informe de error para solicitar dicha function (¿notando un patrón?) . Los escritores de bibliotecas no son psíquicos y no escriben funciones que no se solicitan. Asegúrate de explicar cómo utilizarías esa function, dada esta información, pueden presentar una function ligeramente diferente que sea aún más útil para ti.
  3. Si decide escribir algún código NEON usted mismo, querrá usar el vaddw_u8( ) .