Quantidade de GPUs sendo usadas no treinamento n é métrica de desempenho, se o grok3 usa 100k GPUs só significa que ele vai ter treinado mais rapidamente ou q no mesmo intervalo de tempo o modelo vai ser mais robusto.