|
5月前
|
机器学习/深度学习 人工智能 算法
|

ChatGPT如何思考?心理学和神经科学破解AI大模型,Nature发文

【6月更文挑战第5天】Nature文章探讨了人工智能,尤其是ChatGPT这类大型语言模型(LLMs)的思考机制。随着AI复杂性的增加,理解其决策过程成为挑战。可解释AI(XAI)领域致力于揭示这些“黑盒子”的工作原理,但LLMs的规模和潜在问题(如错误信息和隐私泄露)使这一任务更具紧迫性。研究人员借助心理学和神经科学方法尝试理解模型决策,但目前仍处于早期阶段,且有争议认为模型可能只是模拟而非真正理解文本。

91 1
|
5月前
|
人工智能
|

GPT-4被证实具有人类心智登Nature!AI比人类更好察觉讽刺和暗示

【6月更文挑战第5天】Nature发表的论文显示,GPT-4在心智理论任务中表现出色,特别是在识别讽刺上超越了人类。然而,在理解失礼行为和相关社会意识方面,GPT-4逊于人类,而LLaMA2-Chat在此类情境中表现更佳。尽管如此,GPT-4在失礼行为可能性测试中展现出高超的理解力。该研究强调了AI在模拟人类心理状态方面的进步与局限性。[链接](https://www.nature.com/articles/s41562-024-01882-z)

80 1
|
5月前
|
数据采集 人工智能 测试技术
|

模块化重构LLaVA,替换组件只需添加1-2个文件,开源TinyLLaVA Factory来了

【6月更文挑战第5天】TinyLLaVA Factory是新推出的开源模块化代码库,简化小规模多模态模型的设计与训练,采用工厂模式,允许用户通过添加或替换少量文件轻松重构模型组件,提高开发效率。该库支持定制LMMs并提供训练配方,通过模块化和开源促进社区合作,已实验证实在复现性能上与原始模型相当。尽管面临兼容性等挑战,但其前瞻性的技术路线图确保了其在AI领域的相关性和活力。论文链接:[arxiv.org/abs/2405.11788](https://arxiv.org/abs/2405.11788)

79 0
|
5月前
|
JSON 前端开发 JavaScript
|

Ajax的一种替代方式

演示了两种方式执行Ajax请求:传统的jQuery方法,包括设置URL、类型、数据类型、数据及回调函数;以及现代的fetch API,使用async/await处理POST请求,检查响应状态并转换为JSON。

44 1
|
5月前
|
算法 IDE 开发工具
|

通义灵码插件的优化建议

通义灵码是基于阿里云通义大模型的编码辅助工具,旨在提升开发者效率。为更好地满足开发需求,提出以下优化建议:1)提升生成速度,优化算法,引入分批处理;2)增强跨文件感知能力,理解代码上下文;3)完善云服务支持,深化与阿里云服务集成;4)丰富功能体验,增加编程语言支持;5)提升稳定性和兼容性,确保多环境运行;6)优化用户界面和交互,提供自定义选项;7)增加用户反馈渠道和社区支持,建立开发者交流平台。通过这些改进,通义灵码将为开发者带来更高效智能的编码体验。【6月更文挑战第1天】

161 2
|
5月前
|

通义灵码

灵码

41 0
|
6月前
|
人工智能 安全 算法
|

【平衡点:解锁中国大模型开源闭源的新时代】关于大模型是否开源的分析

本文探讨了开源与闭源软件在大模型技术发展中的角色,深入比较了两者在质量、安全、产业化、适应性和可靠性等方面的优缺点。开源软件得益于全球开发者社区,通常在创新和适应性上表现出色,但安全性和质量可能因分散的开发而有所波动。闭源软件则在代码质量和安全性上有一定优势,但可能限制了产业的协作与创新。 在商业模式方面,开源通常依赖服务和支持盈利,闭源则通过软件授权和订阅服务获利。开源模式的市场竞争更激烈,闭源模式则更注重市场份额和控制。企业需要根据自身情况选择合适的战略,有些可能会采用

234 1
|
6月前
|
存储 人工智能 缓存
|

AI 提示词模板相关的架构设计

现在很多企业纷纷研发大语言模型以解决业务问题。提示词在与模型交互中起到关键作用。为优化提示词模板的修改、提高渲染效率及确保安全性,架构设计注重可修改性、安全性、可靠性和性能。设计包括:将提示词存储在OSS以方便修改和版本控制;使用本地缓存提升读取性能;模板引擎增强灵活性;秘钥安全存储在加密系统中;并通过配置中心动态调整。此设计旨在提供高效、安全且可靠的AI交互体验等。

715 78
|
6月前
|
人工智能 安全 人机交互
|

我对计算机领域未来发展的期望和畅想

我期待未来计算机领域融合人性与智能,AI伙伴懂得人类情感,量子计算带来革命性变化。数字鸿沟将缩小,信息普惠全球,同时关注环保与可持续性,发展绿色计算。计算机系统将更安全,抵御网络威胁,保护用户隐私。最后,希望计算机科学教育普及,激发更多人投身科技创新,共创美好未来。

460 0
|
6月前
|
存储 缓存 算法
|

高并发架构设计三大利器:缓存、限流和降级

软件系统有三个追求:高性能、高并发、高可用,俗称三高。本篇讨论高并发,从高并发是什么到高并发应对的策略、缓存、限流、降级等。

194 1
|
6月前
|
机器学习/深度学习 缓存 自然语言处理
|

入门生成式语言模型(Generative Language Models)

入门生成式语言模型涉及理解基本概念、学习NLP基础知识、掌握相关工具和框架、训练与评估模型、实践项目和案例,以及持续学习。关键步骤包括预训练、微调(如SFT、LoRA、Prefix Tuning)、模型选择(如LLaMA、ChatGLM、Bloom等)和优化部署(量化、剪枝)。训练策略包括Pretrain、SFT、LoRA等,模型如Qwen、GPT-3、OPT等,评估数据集有SuperGLUE、CLUEbenchmark等。此外,有专门的加速和分布式框架如DeepSpeed、Megatron、FairScale等,以及部署工具vLLM、TensorRT-LLM。

230 2
|
6月前
|
人工智能 IDE 前端开发
|

首款 AI Native IDE Framework,OpenSumi 3.0 正式发布!

展望未来,开发者只需定义明确的目标,例如添加新的接口功能,而 AI Agent 则有能力在一个具备运行环境的Workspace 中,自主操控编辑器、终端和浏览器等工具,自动化完成一系列标准的软件开发任务。

670 1

通义大模型

通义千问大模型家族全面升级更大参数规模模型首次面世,全新通义千问2.0版本欢迎体验。https://tongyi.aliyun.com/

0
今日
975
内容
7
活动
629
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 自然语言处理
  • 智能语音交互
  • 视觉智能开放平台