OpenAI fica em último lugar em benchmark de calibração social
Um novo benchmark chamado FratBench revelou que a OpenAI tem o pior desempenho em calibração social entre os principais modelos de linguagem testados. O estudo avaliou como os LLMs interpretam nuances interpessoais e respondem a contextos sociais complexos, áreas onde a OpenAI surpreendentemente ficou em último lugar. Essa performance abaixo da média expõe lacunas críticas no treinamento e alinhamento dos modelos, especialmente para desenvolvedores e empresas que dependem desses sistemas para interações humanizadas. O resultado sugere que mesmo as empresas líderes em IA ainda enfrentam desafios significativos para replicar a compreensão social humana. Especialistas apontam que essa deficiência pode afetar desde chatbots de atendimento até assistentes virtuais corporativos, exigindo ajustes urgentes nos métodos de treinamento.