Claude 4来了 ,与DeepSeek/Qwen/Hunyuan 谁更强?
Claude 4发布,号称多项突破与超越。本文通过国内首款办公提效AI牛马智能体AiPy,在端午旅游规划场景下测评Claude 4、DeepSeek v3、Qwen-Plus和HunYuan-Turbos的表现。测评任务为制定1500元内端午旅行计划,并生成HTML报告。结果显示,Claude 4表现卓越但价格昂贵,是国产大模型的十倍以上;DeepSeek性价比高,值得称赞。国产大模型虽有亮点,但仍需努力追赶国际水平。测评结果附有各模型生成的报告截图对比。