Problemas de escalabilidad en el uso de notifications push como el único medio para enviar posts en una aplicación de postría

Estoy diseñando un Mobile Messenger (que funcionará en Android / Windows / iOS). No lo estoy diseñando solo para fines de aprendizaje, por lo que mi aplicación debe ser lo más real posible mientras sirve a millones de clientes.

Arquitectura actual

En este momento, he empleado las notifications push como el único medio para enviar notifications a los clientes. La lógica para enviar notifications es como si hubiera una queue que recostack todos los posts y luego un trabajo cron procesa esa queue y envía posts a los clientes uno por uno. Todo está bien en este momento, pero ¿qué pasa si mi aplicación tiene que enviar millones de posts (que residen en la queue)? ¿Debo emplear algunas forms alternativas para entregar notifications? Además, ¿hay algún tipo de cuota para las notifications push en iOS o Android? Solo sé sobre WNS (Windows Notification Service).

Si tuviera que sugerir una forma alternativa de entregar notifications para dicha aplicación, ¿cuál sería? Gracias por echar un vistazo a mi problema.