上证报中国证券网讯(记者 罗茂林)6月23日,第三方机构友松实验室发布针对高考志愿填报场景的AI能力测评报告《高考志愿AI测评基准》,该报告以千问高考志愿填报Agent作为测评对象。结果显示,千问多项表现已达到人类志愿咨询师水平,在稳定性、精确性、结构化表达与效率层面更具优势。 据悉,此次测评覆盖高考志愿基本事实与规则、模拟志愿填报、开放式咨询和志愿推荐报告四个环节,对应考生和家长填报志愿时从查资料、看规则,到排方案、做决策的主要流程。 结果显示,在44道客观题中,千问全部答对,准确率为100%;在模拟志愿填报中,千问方案包含6个可录取志愿,未出现显性偏好违背,并命中事后评估的最优结果;在开放式咨询中,评审专家在100场匿名对比中,有58次更倾向选择千问版本。 但报告同时指出,人类咨询师的价值同样不可替代。尤其在收入预期、就业判断等需要结合个体情况谨慎校准的话题上,咨询师更能给出贴近实际的建议。
上证报中国证券网讯(记者 罗茂林)6月23日,第三方机构友松实验室发布针对高考志愿填报场景的AI能力测评报告《高考志愿AI测评基准》,该报告以千问高考志愿填报Agent作为测评对象。结果显示,千问多项表现已达到人类志愿咨询师水平,在稳定性、精确性、结构化表达与效率层面更具优势。
据悉,此次测评覆盖高考志愿基本事实与规则、模拟志愿填报、开放式咨询和志愿推荐报告四个环节,对应考生和家长填报志愿时从查资料、看规则,到排方案、做决策的主要流程。
结果显示,在44道客观题中,千问全部答对,准确率为100%;在模拟志愿填报中,千问方案包含6个可录取志愿,未出现显性偏好违背,并命中事后评估的最优结果;在开放式咨询中,评审专家在100场匿名对比中,有58次更倾向选择千问版本。
但报告同时指出,人类咨询师的价值同样不可替代。尤其在收入预期、就业判断等需要结合个体情况谨慎校准的话题上,咨询师更能给出贴近实际的建议。
上一篇:2026最新高考分数线公布!