¿Puedo hacer este tipo de computación paralela en la GPU?

Tengo una matriz entera M * N, que necesito recorrer y calcular esto para cada elemento M [i] [j]:

The integer which appears most often in the submatrix from (ik,jk) to (i+k, j+k). 

Entonces el resultado es una matriz con cada celda siendo el número dominante alnetworkingedor de [i, j] en la matriz original.

La matriz podría ser muy grande, y tengo que hacer esta operación en un ciclo cerrado, así que quiero minimizar el time de operación mediante computación paralela.

Sé que la GPU es buena en la multiplicación de matrices, pero parece que esto no puede networkingucirse a una simple multiplicación de matrices. (¿o no?)

¿Es posible calcular cada celda en paralelo en la GPU? Y si es así, quiero implementar esto en iOS, ¿qué interfaz de progtwigción debería usar, Metal? ¿OpenGL?

Sí, puedes hacer este cálculo en la GPU.

El metal parece ser para computación gráfica y de propósito general. Por lo tanto, debería poder utilizarlo para sus necesidades (aquí hay un artículo que lo presenta: http://memkite.com/blog/2014/12/15/data-parallel-programming-with-metal-and-swift-for -iphoneipad-gpu / )

Acelerar también puede satisfacer nuestras necesidades.

Espero que esto ayude.