GPT-4 性能炸天:10 秒做出一个网站,在考试中击败 90% 人类

简介: GPT-4 性能炸天:10 秒做出一个网站,在考试中击败 90% 人类

一、GPT-4吊打ChatGPT!



一觉醒来,万众期待的 GPT-4,它来了!

OpenAI老板Sam Altman直接开门见山地介绍道:这是我们迄今为止功能最强大的模型!

b35e5ce46cc347f48774ef43065b3922.png


二、GPT-4,新功能一览



究竟有多强?GPT-4gpt-4


01、接受图像输入,文本输出


比起此前的ChatGPT(依靠GPT-3.5模型),GPT-4在日常对话表现中并没有太大革新性的进步。但作为一个“多模态”模型,GPT-4不仅适用更多语种,而且在语言文本之外新增了强大的识图功能。


OpenAI表示,用户同时输入文本和图像的情况下,它能够生成自然语言和代码等文本,而此前的GPT-3.5只接受文本。


根据官方演示,我们浅看一波GPT-4图像生成功能:

在纸上任意画一个网站的草稿图:

网络异常,图片无法展示
|


拍一张照片上传给GPT-4,它就可以立马生成网站的HTML代码!

image.gif


这挺牛掰的!能够更好的处理图像内容,还是识别手写文字,这是计算机能更好地理解了人类交流方式的一大跨越。


02、会推理判断,考试能力超过“做题家”


由于有着强大的推理能力,在标准化的技能测试中,GPT-4比起ChatGPT的表现有了实质性的提升。

image.png

OpenAI官网称,在模拟美国律师从业资格考试中,ChatGPT的成绩在全体考生中只能排到末尾10%,而GPT-4能排进前10%。在难度更高的国际生物学奥赛中,GPT-4甚至能吊打99%的人类选手。

image.png

03、会“角色扮演”不同人格


看完GPT-4的“露出庐山真面目,它和以前人们印象中“不近人情”的AI相比,在图片和文字领域都更“善解人意”,甚至能扮演不同的人格和用户对话。


具体来说,用户可以要求模型假扮各种角色,比如电视台进行采访的主持人、面对老年用户的基金经理等。根据案例展示,GPT-4可以熟练切换语言风格适应自己的角色定位。比如在和老年人对话时,使用平和缓慢的语气,而在担任经理下达命令时又采取果断坚决的态度。


三、小结



本文试图尝试描述技术进步带来的多元化、优越性。低代码工具类人工智能也曾是技术家们创造出的提效办公利器,仅需少量代码或无需代码就可以开发出各类应用管理系统,由于多数采用组件和封装的接口进行开发,使得开发效率大幅提升。网址:https://www.jnpfsoft.com/?csdn

image.png

作为一站式的应用开发平台,JNFP低代码支持应用的完整生命周期管理,即从设计开始,历经开发、构建、测试和部署,一直到上线后的各种运维(e.g. 监控报警、应用上下线)和运营(e.g. 数据报表、用户反馈)。

image.png


在该闭环中,还会涉及到产品经理、需求分析师、架构师、开发人员、测试人员、运维人员、运营人员、技术支持人员等各种各样的角色本职工作。有了低代码平台,企业开发应用将不需要耗费高人力,有效避免这项高成本的需求,让应用开发更简单。

相关文章
|
3月前
|
API 云栖大会
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o
1269 11
|
7天前
|
数据采集 人工智能 数据可视化
InternVL 2.5,首个MMMU超过70%的开源模型,性能媲美GPT-4o
近期Internvl2.5发布,性能与GPT-4o和Claude-3.5-sonnet等领先的商业模型相媲美,成为首个在MMMU上超过70%的开源模型,通过链式思考(CoT)推理实现了3.7个百分点的提升,展示了强大的测试时间可扩展性潜力。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
o1医学领域大胜GPT-4,性能暴涨!顶尖华人团队激动发文:离AI医生越来越近了
【10月更文挑战第29天】近日,一支顶尖华人团队发布论文《A Preliminary Study of o1 in Medicine: Are We Closer to an AI Doctor?》,揭示了OpenAI最新语言模型o1在医学领域的卓越表现。研究显示,o1在概念识别、文本总结、问答等任务上远超GPT-4,显著提升了医学领域的AI应用水平,向实现AI医生的目标迈进了一大步。
53 3
|
4月前
|
自然语言处理 测试技术 计算机视觉
ECCV 2024:提升GPT-4V、Gemini检测任务性能,你需要这种提示范式
【8月更文挑战第14天】在2024年ECCV上,一篇论文介绍了DetToolChain——一种创新提示范式,旨在提升GPT-4V等多模态大型语言模型在检测任务上的表现。它利用精心设计的视觉提示引导模型关注图像的关键区域,并通过Chain-of-Thought方法将复杂任务分解为简单步骤,显著提高了零样本目标检测的准确性。实验显示,在多个基准测试上,DetToolChain带来了高达24.23%的性能提升。然而,这种方法可能需要大量计算资源,并且在不同任务和数据集上的效果仍有待验证。
189 66
|
3月前
|
数据可视化 Swift
小钢炮进化,MiniCPM 3.0 开源!4B参数超GPT3.5性能,无限长文本,超强RAG三件套!模型推理、微调实战来啦!
旗舰端侧模型面壁「小钢炮」系列进化为全新 MiniCPM 3.0 基座模型,再次以小博大,以 4B 参数,带来超越 GPT-3.5 的性能。并且,量化后仅 2GB 内存,端侧友好。
小钢炮进化,MiniCPM 3.0 开源!4B参数超GPT3.5性能,无限长文本,超强RAG三件套!模型推理、微调实战来啦!
|
3月前
|
人工智能 安全 测试技术
忘掉GPT-5!OpenAI推出全新AI模型系列o1,声称性能达到博士级
忘掉GPT-5!OpenAI推出全新AI模型系列o1,声称性能达到博士级
|
3月前
|
人工智能 自然语言处理 数据挖掘
【通义】AI视界|性能超越GPT-4o?最强大的开源AI模型来了……
本文介绍了五项最新AI技术动态,包括性能超越GPT-4o的开源AI模型Reflection70B、智谱清言App限时免费的视频通话功能、哈佛医学院研发的癌症诊断AI模型CHIEF、Replit推出的AI编程助手,以及英特尔与日本AIST合作设立的芯片制造研发中心。这些进展展示了AI领域的快速创新与广泛应用。更多详情,请访问通义官网体验。
|
3月前
|
机器学习/深度学习 数据采集 人工智能
Llama 8B搜索100次超越GPT-4o!推理+搜索即可提升性能,新Scaling Law诞生?
【9月更文挑战第8天】在人工智能领域,理查德·萨顿提出了一项重要观点,即利用通用计算方法最终是最有效的途径,这一理念在诸如计算机象棋、围棋、语音识别及视觉等多个子领域中得到了验证。萨顿强调,计算能力的指数增长使得依赖大量计算的技术更加吸引人,并且从长远来看,计算能力将是唯一重要的因素。尽管他的观点强调了搜索和学习方法的力量,但也有人批评其忽略了领域知识和其他因素的重要性。
41 2
|
5月前
|
测试技术
8B尺寸达到GPT-4级性能!北大等提出医疗专家模型训练方法
【7月更文挑战第8天】北京大学等研究者提出的新方法缓解了大模型如Llama-3-8B在持续预训练时的“稳定性差距”,通过多轮次训练、高质量子语料库选择和数据混合策略,提升性能和效率。在医疗领域,他们将OpenLlama-3B性能提升至40.7%,并创建的Llama-3-Physician模型达到GPT-4级别。尽管取得突破,该方法在其他模型和领域的适用性仍需探索,且持续预训练仍资源密集。[链接: https://arxiv.org/abs/2406.14833]
97 25
|
7月前
|
人工智能
苹果推出理解、转化模型ReALM,性能超GPT-4
【5月更文挑战第13天】苹果发布ReALM模型,将参考解析转化为语言建模,超越GPT-4。ReALM通过将非文本实体转为文本处理,解决了AI在处理特定问题时的局限。实验显示,ReALM在多种参考解析任务上优于GPT-3.5和GPT-4,尤其在屏幕实体参考解析上提升超5%。但模型可能因信息丢失和高计算需求带来挑战。[链接](https://arxiv.org/abs/2403.20329)
62 3

热门文章

最新文章