Hardware11 de março de 2026 às 16:32Por ELOVIRAL24 leituras
NVIDIA FP4 permite rodar modelos de 70B parâmetros em GPU única
A NVIDIA disponibilizou a quantização NVFP4 para GPUs da série RTX 50 Blackwell. A compressão para aproximadamente 4,5 bits efetivos reduz a necessidade de VRAM em 3,5 vezes comparado ao FP16. Em testes práticos, modelos que antes exigiam clusters multi-GPU agora rodam em uma única placa de vídeo com perda mínima de qualidade. A tecnologia é um marco para democratizar o acesso a modelos de linguagem de grande escala.
Relacionados
E
Samsung Galaxy Glasses têm KI e câmera de 12 MP sem tela
E
NVIDIA avalia uso de tecnologia da Intel em sua próxima GPU
E
Coros Watch ganha controle de voz como Apple e Garmin em atualização
E
Asus ROG Zephyrus Duo GX651 tem dupla tela e potência de gaming mas custa mais de 5 mil dólares
E
Intel Lança Arc Pro com 32GB de RAM para Atacar Mercado de IA
E
Dell XPS 16 Bate Recorde de Bateria com Tela 1Hz e Chip Intel Panther Lake
E