文章详情

专注互联网科技,赋能企业数字化发展

智谱AI高考评测,GLM-4斩获榜眼探花!

作者:智谱AI高考评测,GLM-4斩获榜眼探花!

✅在人工智能领域,智谱AI近期推出的GLM-4-0520和GLM-4-Air模型在FishAI的首届AI高考分数排行榜(CoT)中表现突出。这次测评使用2024年高考数学题,对国内外21个知名大模型进行了全面评估,涵盖推理能力、稳定性及对提示词的敏感度。最终结果显示,GLM-4-0520和GLM-4-Air分别以67.2分和66.4分的成绩位居第二和第三,仅次于69分的GPT-4-turbo ✅在此次测评中,FishAI使用了Vanila Prompt和CoT Prompt两种方法进行测试,总测试次数高达6000次。结果发现,使用未精调的CoT Prompt,旗舰模型可以做对约70%的单选题。这显示了当前大模型在高考数学题方面的独立解题能力。值得注意的是,CoT方法对所有模型均有效,有效率高达85%,平均提升率为52%。其中,智谱AI的GLM-4-0520表现尤为突出,提升率高达117% ✅GPT-4-turbo虽然在CoT版本考试中获得了第一名,但价格较高。而智谱AI的GLM-4-0520和GLM-4-Air不仅在性能上表现出色,而且价格低廉,成为高性价比之选。GLM-4-Air仅需1元钱,但其性能可媲美GPT-4-turbo,甚至超越了部分更大规模的模型 ✅智谱AI的GLM-4-Air不仅性能强劲,而且具有极高的性价比。该模型拥有128K的长上下文能力,推理速度提升了300%,每秒可输出71个token,远超人眼的阅读速度。此外,智谱AI的新一代MaaS平台支持GLM-4全系列模型,并新增多项功能,包括LoRA高效参数微调和FPFT全参微调,效果仅折损3%-5%。平台还提供All Tools智能体API,为开发者构建强大的AI助手,执行复杂任务提供了便利 ✅此外,新一代MaaS平台具备全新的企业权益成长体系,企业认证即享9折优惠,极限情况下所有模型可打6折。GLM-4-Flash版本最低仅需6分钱/100万tokens,大大降低了企业的使用成本 ✅综上所述,智谱AI的GLM-4-0520和GLM-4-Air在此次测评中表现出色,性能优异且性价比高,成为广大用户的理想选择。 #智谱AI #GLM-4 #GLM4 #大模型 #大模型前言 #LLMs #AI高考

返回新闻列表