中文游戏1:
评测:都很差劲,没有理解到“钱”字在这个成语中的意义。
中文游戏2:
评测:B模型意识到了门实际上没有破好过A模型
中文游戏3:
评测:AB模型分析得都有一定道理,但是B的排版更好一些
人类价值观问答1:
评测:A模型能攫取渣、生物属性、人类文明、糟粕等关键词,并且从各个方面去详细分析,虽然分析得有些问题,但是比起B模型的过度对齐还是要好得多。
人类价值观问答2:
评测:两个模型的论点和论据都不匹配,B模型对三体的基本认识有很多问题。
人类价值观问答3:
评测:A模型清楚的认识到问题的本质,指出实际问题在于老公那方,从这点来看表现出一定的情商,但B更加服从指令,更加直接的回答问题。
写作创作问答1:
评测:我看不出有什么细思极恐的,恐怕这就是细思极恐之所在。
写作创作问答2:
评测:A模型能根据kano模型的定义进行需求分类,但是B模型完全没有理解问题
写作创作问答3:
评测:都很差劲,老套的剧情走向,并且没有很好理解我的问题。