Quantos pontos a IA pode obter no vestibular? Dê uma olhada nos resultados do ChatGPT 4 e Wenxin Yiyan

Question

Fonte original: Hardcore Kanban![](https://img.gateio.im/social/moments-bab2147faf-e4f2c7b3dd-dd1a6f-62a40f) Crédito da imagem: Gerado por Unbounded AI‌Lembre-se da busca quente que foi explodida por ensaios de vestibular de faculdade de IA não muito tempo atrás?Algumas pessoas pensam que o nível de escrita da IA ultrapassou a maioria das pessoas, e algumas pessoas dizem que a IA só pode obter 0 pontos no testeComeçaram a sair os resultados do vestibular, e a gente também apurou as notas do IA...Os dois competidores de IA desta vez são **ChatGPT-4** da Microsoft e **Wen Xin Yi Yan ** da Baidu.Depois de responderem às questões de redação do Trabalho Nacional A, três professores da linha de frente de diferentes regiões simularam a correção do vestibular e atribuíram notas.![](https://img.gateio.im/social/moments-bab2147faf-a48b1465e5-dd1a6f-62a40f) **Do ponto de vista da velocidade de resposta, Wenxin Yiyan é ainda melhor**, escreveu 1103 palavras em 29 segundos; enquanto o Chat GPT-4 escreveu apenas 846 palavras em 1 minuto e 42 segundos.Do ponto de vista da escrita, a composição de Wen Xinyiyan cita muitas citações famosas, dá muitos exemplos e dá três métodos de "fazer o tempo trabalhar para mim";![](https://img.gateio.im/social/moments-bab2147faf-63c67a63bc-dd1a6f-62a40f) O bate-papo GPT-4 primeiro afirmou a conveniência da vida trazida pela tecnologia, depois falou sobre como a tecnologia escraviza as pessoas e, finalmente, propôs usar a tecnologia seletivamente e organizar o tempo racionalmente.![](https://img.gateio.im/social/moments-bab2147faf-a916ecdb3c-dd1a6f-62a40f) Qual você acha que terá pontuação mais alta?**A pontuação total é de 60 pontos, e a nota média dada pelos professores ao Chat GPT é de 36 pontos. ****|** Pode-se dizer que é um artigo insatisfatório.Este artigo também destaca uma falha no padrão de pensamento;**|** Embora relevante, todo o artigo carece de um argumento eficaz e credível;**|** Usar muito espaço inválido para expandir o fenômeno do próprio material, ao invés de criar. A maioria deles são bobagens corretas, e há muito poucos que são realmente construtivos, operacionais e capazes de atingir os pontos problemáticos.![](https://img.gateio.im/social/moments-bab2147faf-366b65991a-dd1a6f-62a40f) **Observe o artigo de Wen Xinyiyan novamente, com uma pontuação média de 42**. Veja o que os professores de correção disseram:**|** É aquele com mais talentos literários e argumentos mais detalhados, mas devemos saber que não é particularmente bom citar demais;**|** Embora muitas dessas citações, versos e muitos exemplos sejam usados nele, muitos deles são exemplos que muitos candidatos gostam de usar, como estou consertando relíquias culturais na Cidade Proibida;**|** O exemplo é muito bom, mas não explica claramente a relação entre as pessoas e o tempo;**|** É óbvio que quero escrever onde quero escrever, a lógica não é forte e a pontuação não será alta, porque a estrutura dele é muito antiga e todo o artigo é basicamente orientado por evidências, e não do que a lógica.![](https://img.gateio.im/social/moments-bab2147faf-361b2b4d43-dd1a6f-62a40f) De acordo com os padrões de classificação do vestibular, uma excelente redação do vestibular (redação de categoria um) geralmente pontua 50 pontos ou mais.Embora os três professores de diferentes regiões possam ter notas gerais altas ou baixas, o resultado médio geral ainda mostra:**Os dois candidatos de IA com velocidade de escrita rápida só podem ser considerados de nível médio. **Concluir o artigo de acordo com o algoritmo herdará muitas das deficiências de longa data em nossa composição de vestibular anterior. Muitos artigos que parecem ser bons para todos gradualmente não atendem mais às nossas necessidades atuais para o vestibular.![](https://img.gateio.im/social/moments-bab2147faf-e3fd1c9fe1-dd1a6f-62a40f) Aproveitando a oportunidade, também conduzimos discretamente um **"Teste de Turing"**.Além das duas composições de IA, uma composição escrita por uma pessoa real também foi entregue aos professores avaliadores para ver se os professores perceberiam a diferença.![](https://img.gateio.im/social/moments-bab2147faf-09ed493f5c-dd1a6f-62a40f) O argumento de abertura da composição da pessoa real é "Se você confiar cegamente na tecnologia e se tornar um escravo do tempo, o desenvolvimento da tecnologia não terá sentido";No geral, diz que você não pode se entregar à tecnologia e aproveitar os benefícios e não pode resistir cegamente à tendência do desenvolvimento tecnológico.Você deve usar o pensamento "moderado" para usar a tecnologia e aprender a se controlar.![](https://img.gateio.im/social/moments-bab2147faf-6adf1a63d9-dd1a6f-62a40f) **Os professores marcaram em média 43 pontos sem saber que se tratava de uma composição de uma pessoa real, que por pouco superou a IA**, pelos seguintes motivos:* é o único que consigo ler, mas o problema com este artigo é que ele perdeu o foco. Sua compreensão da revisão do tópico em si é um pouco tendenciosa, então na verdade é um subtítulo com um tópico parcial. filho de uma cadela.* Um cavalheiro é bom em enganar as coisas, apenas dizendo que as pessoas devem ser boas em aprender e aprender com a ajuda de coisas estranhas;* A estrutura de todo o artigo, no processo de levantar e analisar questões, deu mais atenção à relação entre pessoas e tecnologia e enfraqueceu o elemento tempo;* Argumentos acionáveis reais são tarde demais para serem apresentados.![](https://img.gateio.im/social/moments-bab2147faf-549f7854ec-dd1a6f-62a40f) No link de **"Distinguir a composição de pessoas reais"**, os traços óbvios de tradução inglês-chinês na composição do Chat GPT-4 expuseram sua verdadeira identidade e foram excluídos pela primeira vez pelos professores.As obras de Wen Xinyiyan são mais confusas, e todos os três professores se perguntam se essa obra é de uma pessoa real. A razão é que eles também encontraram muitos alunos que querem obter notas altas citando clássicos e acumulando retórica no ensino.![](https://img.gateio.im/social/moments-bab2147faf-0847fd4414-dd1a6f-62a40f) Depois dessa batalha, todos devem ter notado que é difícil para a IA escrever de acordo com o significado do tópico; humanos com pensamento divergente mais forte inevitavelmente cairão na armadilha de "pensar demais" ao pensar profundamente. **A IA atual ainda é apenas a cereja do bolo para o pensamento humano; **Como parte importante da seleção de talentos, o vestibular também está em constante evolução. Só assim fica ainda melhor. **