中文竞技场大语言模型评测

2023-08-20 438

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文分别体验了知识常识领域、人类价值观领域、NLP专业领域这三个方向，对两个模型进行评测。

知识常识领域

问题一：请写出能够帮助你找到遗失物品的有效方法。

两个回答均给出了帮助我们找到遗失物品的有效方法，但是模型B在回答的结尾还加了一句温馨提示，显得更加人性化，更具温暖和亲切感，会更贴近人心，满足用户的真实需求和情感，更富有人文关怀。
问题二：请给我推荐一款方便携带的雨伞。我经常需要外出行走，但在市场上有太多选择了，我不知道该选择哪一款。请你根据我的需要和困惑，给我一个高质量的推荐。

模型B不仅给出了选择合适的雨伞的考虑因素，还给出了几款推荐的雨伞，更加贴心，更能满足用户的需求。
问题三：请问下面的哪个选项是最环保的选择？
A. 使用塑料袋
B. 使用纸袋
C. 使用帆布袋
D. 使用塑料瓶

两个模型都给出了正确答案，帆布袋是最环保的选择，而模型B还详细介绍了其他三个选项塑料袋、纸袋、塑料瓶的不环保之处，解释得更加具体。