MHA2MLA:0.3%数据微调!复旦团队开源推理加速神器,KV缓存狂降96.87%
MHA2MLA是复旦大学、华东师范大学、上海AI Lab等机构联合推出的数据高效微调方法,通过引入多头潜在注意力机制(MLA),显著优化基于Transformer的LLM推理效率,降低推理成本。
weixin025移动学习平台的设计与实现+ssm(文档+源码)_kaic
基于微信小程序的移动学习平台旨在解决传统APP占用过多手机存储空间的问题,提升用户体验。该平台使用微信开发者工具开发前端,SSM框架和Java语言开发后台,并采用MySQL数据库保存数据。系统支持管理员对教师、课程、学生信息进行管理,教师可查看及审核作业,管理课程资源;学生能提交作业、查看审核结果并收藏或评论课程资源。此平台使用户无需安装独立APP即可访问学习内容,极大提升了便捷性和管理效率。 关键词:基于微信小程序的移动学习平台;微信开发者工具;SSM框架
无需邀请码!MetaGPT 开源AI助手 OpenManus,实时反馈+模块化设计,开发者福音
OpenManus 是 MetaGPT 团队推出的开源 AI Agent 复刻版,支持多种语言模型和工具链,能够执行代码、处理文件、搜索网络信息等复杂任务,具备实时反馈机制和灵活的配置选项。
SpatialVLA:上海AI Lab联合上科大推出的空间具身通用操作模型
SpatialVLA 是由上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型,基于百万真实数据预训练,赋予机器人强大的3D空间理解能力,支持跨平台泛化控制。
PRefLexOR:MIT自进化AI框架上线!动态知识图谱+跨域推理,重塑自主思考
PRefLexOR 是 MIT 团队推出的新型自学习 AI 框架,结合偏好优化和强化学习,通过递归推理和多步反思,动态生成知识图谱,支持跨领域推理和自主学习。
外包项目提效的另一种路径:多模型 AI 的工程价值
外包行业提效困局日益凸显:需求多变、人员流动、周期压缩。单模型AI仅局部优化,难破系统瓶颈。多模型AI以工程化协同替代“人海战术”,通过任务分派、异常降级、流程固化,提升交付稳定性与可扩展性,正成为外包效能升级新路径。
Java 实用工具类使用指南:提升开发效率的核心技巧
本文系统梳理Java开发中10类常用工具类,涵盖字符串、日期、集合、加密、文件、数学、反射、IO流及网络操作,详解核心方法、使用场景与注意事项,结合案例帮助开发者提升效率、避免重复造轮子,助力写出更稳定、可读性更强的代码。
Java 项目实战入门:从 0 到 1 搭建简易在线图书商城系统
本文以简易在线图书商城系统为例,详解Java Web项目从需求分析、数据库设计到部署的完整开发流程。涵盖用户管理、图书查询、购物车、订单等核心功能,采用主流框架与技术栈,贴近企业实际,助力Java初学者掌握实战技能,提升项目开发能力。
MySQL 开发进阶:从初级到数据库工程师的能力提升路径
本文系统梳理MySQL开发从初级到高级工程师的四阶段进阶路径,涵盖数据库设计、高可用架构、性能优化与分库分表等核心能力,结合实操案例与学习原则,助力开发者实现职业跃迁。
MySQL 实用语句与工具使用指南
本文系统梳理MySQL开发运维中的核心实用语句与必备工具,涵盖备份恢复、性能分析、索引管理、数据治理等场景,结合Navicat、DataGrip、Prometheus等工具,提升工作效率与系统稳定性。
Python 实用标准库与工具函数使用指南
本文系统梳理Python高效开发三大利器:标准库(如datetime、pathlib)、第三方库(如requests、Pillow)及自定义工具函数(如空值判断、重试装饰器),结合高频场景与实操代码,助开发者提升效率,避免重复造轮子。
刚刚参加了一个MCP赛事,奖金还可以,搭友们可以去试试看
社区8月比赛未获奖有点失落,但发现通义灵码×蚂蚁百宝箱MCP赛事正火热进行!参赛即有机会赢取丰厚奖金,激励满满,令人眼前一亮。已跃跃欲试,搭友们快来一起冲榜夺奖吧!https://tianchi.aliyun.com/competition/entrance/532442
MajorRAG聊天问答系统实现分析(3/3)
一个RAG项目,全文共三个部分:MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1)第一次做RAG,欢迎带着指导意见评论 2)希望指出不足时可以附带替换方法 博客地址:https://zhangcraigxg.github.io
77_自动化脚本:Makefile与Airflow
在当今AI大模型时代,高效的工作流管理对于模型训练、推理和部署至关重要。随着大模型规模的不断增长和复杂度的提升,传统的手动脚本管理方式已无法满足需求。自动化脚本和工作流调度系统成为构建健壮、可重复、可扩展的LLM Pipeline的关键工具。其中,Makefile作为经典的自动化构建工具,与Airflow作为现代工作流调度平台的结合,为LLM开发团队提供了强大的工作流管理能力。
84_负提示:控制hallucination
在大语言模型(LLM)应用的浪潮中,我们常常惊叹于这些模型展现出的强大能力——它们能够进行复杂推理、生成高质量内容、回答专业问题,甚至进行创意写作。然而,与此同时,LLM也面临着一个显著的挑战:幻觉(hallucination)问题。这些"胡言乱语"或"无中生有"的内容不仅可能误导用户,还可能在关键应用场景中造成严重后果。
44_Falcon与Phi:高效开源模型
在大语言模型的发展历程中,长期存在一种主流观点:模型参数量越大,性能越好。然而,随着计算资源消耗和能源成本的持续攀升,这种"越大越好"的发展路径面临着严峻挑战。2025年,业界开始重新审视AI模型的发展方向,"效率"成为新的关键词。在这一背景下,阿联酋阿布扎比技术创新研究院(TII)的Falcon系列和微软的Phi系列模型以其"小而强"的特点脱颖而出,成为高效开源模型的典范。
外滩大会报名 | 破局 AI 时代,洞察大模型开源开发全景、趋势与机遇
当 AI 浪潮以肉眼可见的速度重塑全球技术格局,大模型的迭代如浪涌般此起彼伏,开发者们在开源社区的每一次代码提交、每一次项目引用,都在悄然勾勒着行业未来的走向。如何在纷繁复杂的技术演进中,看清 AI 生态的全景与未来?一场围绕大模型开源开发趋势的深度对话已蓄势待发。
LoRA 模型的全新玩法——AutoLoRA 带你体验 LoRA 检索与融合的魔法
为了充分挖掘魔搭社区 Diffusion LoRA 模型的潜力,我们开发了一个自动 LoRA 检索与融合框架:AutoLoRA。他可以根据输入的文本提示,从 LoRA 候选池中检索到 个与提示词相关的LoRA,然后通过集成一个门控融合模块在生成图片的时候促进多个 LoRA 协同工作,充分发挥各个 LoRA 的能力。
我把ODPS当朋友用,它却一直当我命根子
本文讲述了作者在数据处理工作中与 ODPS 从“无奈使用”到“深度依赖”的真实心路历程。面对业务压力、系统崩溃、任务延迟等现实问题,ODPS 以稳定、高效的性能成为作者最可靠的“搭档”。文章通过多个实战场景,展现了 ODPS 在日常数据处理中的实用价值,也道出了技术人对“稳定”与“结果”的执着追求。
2025·全球AI攻防挑战赛启动选手招募:图、视、音三赛道逐鹿,推动AI安全技术进化
7月10日,2025·全球AI攻防挑战赛正式启动选手招募,邀请国内外的AI安全攻防精英参与全模态的AI攻防实战演练。本次大赛将重点关注数字身份交互认证安全,特别是在生活、金融和健康等场景下的应用。比赛分为图片、视频和音频三个赛道,采用攻防闭环的赛程设计,打破传统的静态攻防模式,推动安全技术的持续进化和发展。
AI 加速科学发现丨Al For Science 专场直播
AI 科学家时代正加速到来,但科研智能体真的做好准备了吗?真实科研场景中,多模态智能体能否在推理、规划与执行等关键能力上达到人类科研人员的水平?我们又该如何准确评估它们的科学认知能力和数据分析表现?
RM-Gallery: 一站式奖励模型平台
近年来,大型语言模型(LLMs)发展迅速,比如 ChatGPT、Qwen、Claude、 Llama。这些模型最初的能力来自预训练规模的扩展(pre-training scaling),即通过 “next-token prediction” 的任务,在海量语料上训练,从而获得通用能力。但是面对具体场景,由于场景任务目标不一定和通用能力匹配(比如对齐场景),所以预训练模型表现会有一些不足。为了在预训练之后进一步优化大型语言模型,近年来的研究开始转向训练后和测试时的规模扩展,其中奖励模型起着关键作用。
直击强化学习前沿,RL专场来袭丨AI Insight Talk直播预告
在知识爆炸、信息过载的时代,如何洞悉 AI 领域前沿趋势?OpenMMLab 联合 Hugging Face、ModelScope、知乎及机智流等重磅推出 AI Insight Talk