OpenAI fica em último lugar em benchmark de calibração social

Um novo benchmark chamado FratBench revelou que a OpenAI tem o pior desempenho em calibração social entre os principais modelos de linguagem testados. O estudo avaliou como os LLMs interpretam nuances interpessoais e respondem a contextos sociais complexos, áreas onde a OpenAI surpreendentemente ficou em último lugar. Essa performance abaixo da média expõe lacunas críticas no treinamento e alinhamento dos modelos, especialmente para desenvolvedores e empresas que dependem desses sistemas para interações humanizadas. O resultado sugere que mesmo as empresas líderes em IA ainda enfrentam desafios significativos para replicar a compreensão social humana. Especialistas apontam que essa deficiência pode afetar desde chatbots de atendimento até assistentes virtuais corporativos, exigindo ajustes urgentes nos métodos de treinamento.

OpenAI fica em último lugar em benchmark de calibração social

Relacionados

Prefeito de Nova York exige divulgação de imagens de IA em aluguéis

Psiquiatra alerta que efeitos da IA no cérebro ainda são incertos

Drone da USAF com IA dispara míssil AMRAAM real em teste histórico

Anthropic encara o muro da consciência em IA com aposta de risco

Líderes da Anthropic em Washington para resolver Conflitos com administração Trump

Polêmica anti-IA na biblioteca Jqwik expõe tensões éticas entre desenvolvedores e ferramentas generativas

Foto hands-on expõe Xiaomi Mix Fold 5 rodando HyperOS 4 no Android 17