Google 发布其开源模型系列最新模型 Gemma 3
Google 发布了其开源模型系列的最新成员 Gemma 3,这是一款轻量级、高性能的 AI 模型,支持多语言和复杂任务。它具备 140+ 语言支持、128K-token 上下文窗口、增强的多模态分析能力以及函数调用功能,适用于聊天 AI、代码生成等多种场景。Gemma 3 在性能上超越 Llama 3-8B 和 Mistral 7B,且仅需单 GPU 即可运行,大幅降低计算成本。提供 1B 至 27B 不同参数规模版本,满足多样化需求,并优化了量化模型以适应边缘计算和移动设备。其多模态设计整合了 SigLIP 图像编码器,扩展上下文窗口至 128k token,显著提升了视觉和文本理解能力。
Ai好记全面接入DeepSeek大模型!重塑知识管理新体验
Ai好记融合DeepSeek大模型,带来知识管理新纪元。视频秒变知识胶囊,外语资料自动转母语,一键构建思维导图。六大核心能力包括结构化笔记、AI播客、全平台解析等,全面提升学习和工作效率。立即登录aihaoji.com体验!
Qwen for Tugraph:自然语言至图查询语言翻译大模型微调最佳实践
在图数据库的应用场景中,自然语言至图查询语言的高效转换一直是行业中的重要挑战。本次实践基于阿里云 Qwen 大模型,围绕 TuGraph 图数据库的需求,探索并验证了一套高效的大模型微调方案,显著提升了模型生成 Cypher 查询语句的能力。通过数据清洗、两阶段微调方法以及两模型推理框架等一系列创新策略,我们成功解决了图查询语言翻译任务中的核心问题。本文将从背景与目标、数据准备与清洗、微调框架设计、Prompt设计与优化、模型推理、最佳实践效果以及前景展望等六个部分出发,向读者逐步介绍我们的方案。
Qwen-coder实现本地 RAG 框架能力Bootstrap
本文介绍了如何利用Qwen-coder在本地实现RAG框架能力提升,解决了企业知识库管理中的数据安全和半结构化文档处理问题。通过Qwen2.5-72b模型和多轮对话推理,成功实现了对包含图表内容的文档的高效预处理,提升了知识库检索的准确性和安全性。
通义灵码评测: 阿里云出品通义大模型AI代码编程辅助工具
通义灵码是阿里云出品的一款基于通义大模型的AI智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力,并针对阿里云 SDK/OpenAPI 的使用场景调优,助力开发者高效、流畅的编码。
会议之眼报道:助力学术成就!第六版CCF中国计算机学会推荐国际学术会议和期刊目录!
会议之眼快报:CCF中国计算机学会是全国性、学术性、非营利的学术团体,由从事计算机及相关科学技术领域的个人和单位自愿组成。作为独立社团法人,CCF是中国科学技术协会的成员之一,是全国一级学会! CCF的前身是1962年成立的中国电子学会计算机专业委员会。在文革期间的1978年1月,学会恢复了活动,并更名为中国电子学会计算机学会。1985年3月,经过国家体改委批准,正式成立了中国计算机学会。截至2022年4月,CCF下设14个工作委员会、39个专业委员会、4个“计算+行业”分会以及36个地方会员活动中心。
2023云栖大会 | 阿里云发布通义千问2.0
今天,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0多方面性能超过GPT-3.5,正在加速追赶GPT-4。 此外,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。 过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的多方面性能已经超过GPT-3.5,加速追赶GPT-4。
2023云栖大会 | Serverless化进程——阿里云发布通义千问2.0 性能超GPT-3.5 加速追赶GPT-4
云计算也能“自动驾驶”了!阿里云用大模型对云产品进行AI化改造
2023云栖大会 | 阿里云推出智能编码助手通义灵码
10月31日,杭州云栖大会上,阿里云对外展示了一款可自动编写代码的 AI 助手,在编码软件的对话窗口输入“帮我用 python 写一个飞机游戏”,短短几秒,这款名为“通义灵码”的 AI 助手就自动生成了100多行代码,点击运行后一个充满儿时回忆的“飞机大战”游戏就成功跑起来了。
通义千问7B-基于本地知识库问答
上期,我们介绍了通义千问7B模型的微调+部署方式,但在实际使用时,很多开发者还是希望能够结合特定的行业知识来增强模型效果,这时就需要通过外接知识库,让大模型能够返回更精确的结果。
如何理解AI Agent指挥官与AI调度官这两种角色
随着大模型迈向多Agent协同,AI系统进入“系统级运行”阶段。本文提出“指挥官”(负责目标分解与策略决策)与“调度官”(专注资源分配与执行编排)双角色架构,通过分层协同、闭环反馈,提升多Agent系统的可控性、可解释性与规模化能力,为AI工程化落地提供通用范式。
构建AI智能体:九十一、大模型三大适应技术详解:有监督微调、提示学习与语境学习
大模型应用并非高不可攀,有监督微调、提示学习与语境学习提供了低门槛落地路径。提示学习通过指令引导模型,零成本快速试用;语境学习借助示例让模型“即学即用”;有监督微调则通过数据训练打造专业模型,实现性能突破。三者层层递进,助力高效构建AI应用。
如何优雅地为 TensorRT-LLM 添加新模型
本指南详细介绍如何在TensorRT-LLM中优雅集成新大语言模型,涵盖模型配置、定义、权重加载与注册全流程,支持作为核心模块或独立扩展集成,助力高效推理部署。(238字)
动态规划算法深度解析:0-1背包问题
0-1背包问题是经典的组合优化问题,目标是在给定物品重量和价值及背包容量限制下,选取物品使得总价值最大化且每个物品仅能被选一次。该问题通常采用动态规划方法解决,通过构建二维状态表dp[i][j]记录前i个物品在容量j时的最大价值,利用状态转移方程避免重复计算子问题,从而高效求解最优解。
软考中级软件设计师专项-设计模式篇
备战软考中级软件设计师?本文聚焦高分设计模式模块,详解23种模式的核心意图与场景,结合UML图、Java代码实例及历年真题,覆盖创建型、结构型、行为型三大类,助你打通理论到实战。
百望股份接入千问3,首个财税垂类MCP服务上线
近日,智能财税龙头企业百望股份与阿里云签署全面战略合作协议,共同成立“数据智能联合实验室”。双方将深化云计算与数据智能融合,以大模型为创新方向,首个深度融合通义千问Qwen3的财税行业MCP服务已在阿里云百炼上线。百望股份基于高质量数据推出交易管理、经营决策等智能体,助力企业释放数据价值。此次合作旨在构建全周期服务闭环,推动交易管理从“经验驱动”迈向“数据智能驱动”。
网信办整治 AI 技术滥用,AI 企业如何合规运营
中央网信办开展为期3个月的“清朗・整治AI技术滥用”专项行动,旨在规范AI服务与应用,保障公民权益,促进行业健康发展。文章从算法备案、数据合规管理、内容审核、标识要求、重点领域风险防控、防止侵权、杜绝网络水军及保护未成年人权益八个方面,详细解析了AI企业在运营中需遵循的具体要求与措施,强调企业应主动落实合规,推动AI行业健康有序发展。
阿里云零门槛、轻松部署您的专属 DeepSeek模型体验测试
DeepSeek R1是基于Transformer架构的先进大规模深度学习模型,2025年1月20日发布并开源,遵循MIT License。它在自然语言处理等任务上表现出色,高效提取特征,缩短训练时间。阿里云推出的满血版方案解决了服务器压力问题,提供100万免费token,云端部署降低成本,用户可快速启动体验。虽然回答速度有待提升,但整体表现优异,备受关注。
不属于五种算法是否无需备案?一文读懂算法备案的真相
在数字化时代,算法成为互联网服务的核心技术。为应对算法歧视、大数据杀熟等问题,我国出台了算法备案制度,规范算法使用,保护用户权益。五种常见算法(生成合成、个性化推送、排序精选、检索过滤、调度决策)需备案,但其他类型算法在特定情况下也需备案,如涉及舆论属性或社会动员能力。未备案将面临法律责任,企业应严格遵守规定,确保合规运营。算法备案不仅是法律要求,更是企业对社会责任的体现。
基于Qwen 2.5的世界科学智能大赛冠军方案
本方案基于通义千问模型,采用多阶段的Easy-to-Hard数据合成方法,模拟人类学习的由简单到困难的思路,逐阶段构造多样化的训练数据。数据生成阶段,训练数据的标签,引入了“Chain-of-Thought”思维链模式,生成多样化的推理路径,逐步对齐推理Scaling Law。训练阶段,采用了LoRA对通义千问32B模型在合成数据集上进行参数高效微调。推理阶段,使用了4bit低精度量化,并结合vLLM框架进行推理加速,最终达到准确性、效率和显存利用率的统一。
用 Qwen2.5-Coder 开发一个网页应用,完全0基础,已部署上线,代码开源!
利用Qwen2.5-Coder成功开发了一个简洁实用的网页应用,该应用能够在浏览器Tab标题中显示北京时间,并在页面中集成了实时时间显示和番茄时钟功能。通过Qwen2.5-Coder的强大代码生成能力,从零基础开始,仅需简单提示便完成了HTML、CSS和JavaScript的编写。经过几次优化调整,最终实现了美观且功能完善的网页应用,并顺利部署至Vercel平台,满足了作者在全屏模式下查看时间的需求。
基于RAG和LLM的水利知识问答系统研究
随着全球水资源紧张加剧,我国面临严峻的水资源管理挑战。《十四五规划》提出构建智慧水利体系,通过科技手段提升水情测报和智能调度能力。基于大语言模型(LLM)的水利智能问答系统,利用自然语言处理技术,提供高效、准确的水利信息查询和决策支持,助力水资源管理智能化。该系统通过RAG技术和Agent功能,实现了对水利知识的深度理解和精准回答,适用于水利知识科普、水务治理建议及灾害应急决策等多个场景,推动了水利行业的信息化和智能化发展。
前端大模型应用笔记(五):大模型基础能力大比拼-计数篇-通义千文 vs 文心一言 vs 智谱 vs 讯飞vsGPT
本文对比测试了通义千文、文心一言、智谱和讯飞等多个国产大模型在处理基础计数问题上的表现,特别是通过链式推理(COT)提示的效果。结果显示,GPTo1-mini、文心一言3.5和讯飞4.0Ultra在首轮测试中表现优秀,而其他模型在COT提示后也能显著提升正确率,唯有讯飞4.0-Lite表现不佳。测试强调了COT在提升模型逻辑推理能力中的重要性,并指出免费版本中智谱GLM较为可靠。
Java 抽象类详解
在 Java 中,抽象类是一种特殊类,用于提供基础定义并派生具体子类,支持代码复用。它包含抽象方法(无实现)和具体方法(有实现),不能被实例化,需用 `abstract` 关键字定义。子类必须实现所有抽象方法,除非子类也是抽象类。抽象类可用于定义模板或框架,确保子类实现特定方法。通过示例展示了如何定义抽象类 `Animal` 及其子类 `Dog` 和 `Cat`,并在主类中调用相关方法。使用抽象类可以提高代码复用性和设计质量,但也可能增加维护难度和性能开销。
Github 2024-08-05 开源项目周报 Top15
根据 Github Trendings 的统计,本周(2024年8月5日统计)共有15个项目上榜。以下是根据开发语言汇总的项目数量: - Go 项目:4个 - JavaScript 项目:3个 - Python 项目:3个 - Java 项目:2个 - TypeScript 项目:2个 - C 项目:1个 - Shell 项目:1个 - Dockerfile 项目:1个 - 非开发语言项目:1个
通义大模型合作计划升级|欢迎伙伴加入
阿里云面向生态伙伴开放“阿里云百炼“大模型服务平台和“通义”系列为代表的各类大模型产品能力,与产品生态伙伴展开基于大模型应用方向的Maas(模型即服务)产品集成与被集成合作,旨在为用户提供AI领域研究成果在行业中的最新技术应用与解决方案,而共同开展的一项关于大模型应用合作的产品合作计划。
CodeFuse-MFTCoder提升Qwen-14B代码能力
Qwen(通义千问)是阿里云开源的大型语言模型集合,目前有两个参数规模的模型:Qwen-7B和Qwen-14B。Qwen官方透出的评测中,在各项能力上都超过了同等大小的开源大语言模型,包括LLaMA,LLaMA2,ChatGLM2,Baichuan2,InternLM等。
智识重塑:智能体领航员驱动的个体进化实录
智能体领航员正引领人类从信息吞噬迈向模型进化。它以苏格拉底式启发促发深度思考,构建心理韧性应对情绪波动,加速技能内化与创意协同,并坚守认知独立性。技术终为镜,照见更真实的自我。
大模型仿真进阶攻略:一文看透LoRA与QLoRA,让你的AI更懂业务
本文深入解析大模型微调三大技术:全量微调、LoRA与QLoRA,对比其原理、资源需求与适用场景,并手把手教你用低显存显卡炼出专属领域模型。结合实践代码与效果评估方法,助力开发者低成本实现AI私有化部署,打造懂业务的“私人助理”。
后大模型时代:从 Model 到 Agent,下一代企业级应用架构演进指南
摘要:当大模型(LLM)的能力逐渐同质化,基于 Agent(智能体)的应用架构正在成为新的技术护城河。本文将探讨 Agent 如何重构软件开发范式,并梳理开发者在这一转型过程中所需的关键技术栈。
Java 企业 AI 开发核心:大模型统一接入与高效落地
在AI技术深度融合的背景下,Java企业需高效接入大模型。JBoltAI提供统一大模型接入方案,兼容20+主流平台,降低适配成本,支持业务智能升级与团队快速转型,助力企业实现稳定、灵活、可持续的AI应用落地。(238字)
【专利技术】“声形合一,伪造无痕”——高维数据推出音视频实时同步合成系统,让虚拟形象“声情并茂”(第6期)
合肥高维数据专利《音视频伪造同步方法》突破传统时间戳校准局限,首创唇形-语音语义匹配机制,通过分段特征提取、智能匹配与分层对齐策略,实现伪造音视频毫秒级精准同步。该系统支持实时直播、视频会议等场景,兼顾隐私保护与表达自然,推动深度伪造技术向合规化、实用化迈进,赋能数字身份、元宇宙与无障碍传播。
商务邮件沟通效率提升85%:一套AI指令解决企业邮件痛点
本文基于3000+企业邮件案例,提供一套专业的AI商务邮件指令,通过数据驱动的方法论,帮助企业实现邮件沟通效率提升85%,客户转化率增加60%,年度ROI达400%。包含完整指令代码、实战案例和量化收益分析。
AI Compass前沿速览:Nano Bananary、MCP Registry、通义DeepResearch 、VoxCPM、InternVLA·M1具身机器人
AI Compass前沿速览:Nano Bananary、MCP Registry、通义DeepResearch 、VoxCPM、InternVLA·M1具身机器人
软考通关密钥:计算机系统核心原理全解剖——软件设计师必懂的底层逻辑
专为软考中级软件设计师打造,深入解析CPU架构、存储体系、进制转换、原码补码、浮点数、寻址方式、校验码、RISC/CISC、流水线、Cache、中断、I/O控制、总线及加密技术等核心知识点,结合真题剖析高频考点,构建计算机系统底层知识体系,提升应试与实践能力。
鸿蒙 HarmonyOS NEXT端云一体化开发-云函数篇
本文介绍基于华为AGC的端云一体化开发流程,涵盖项目创建、云函数开通、应用配置及DevEco集成。重点讲解云函数的编写、部署、调用与传参,并涉及环境变量设置、负载均衡、重试机制与熔断策略等高阶特性,助力开发者高效构建稳定云端服务。
MicroPython+ESP32 C3开发上云
本文介绍了基于MicroPython的ESP32 C3开发,涵盖GPIO控制、PWM调光、定时器、DS18B20温度采集、WiFi连接及Socket通信等内容,并详细演示了如何通过WIFI模块连接新大陆云平台,实现设备登录与心跳包维持连接。
算法备案新手攻略——2025全网最新最详细解读版
本文介绍了算法备案的背景、法规依据、备案类型及流程,涵盖生成合成、个性化推送等五大算法类型,并详细说明所需材料与备案周期,强调未备案将面临行政处罚甚至刑事追责,助力企业合规运营。
告别OOM!这款开源神器,如何为你精准预测AI模型显存?
在 AI 开发中,CUDA 显存不足常导致训练失败与资源浪费。Cloud Studio 推荐一款开源工具——AI 显存计算器,可精准预估模型训练与推理所需的显存,支持主流模型结构与优化器,助力开发者高效利用 GPU 资源。项目地址:github.com/st-lzh/vram-wuhrai
通义大模型千问3助力B站,在618期间,商单成交效率提升5倍+
B站接入通义千问Qwen3等模型打造智能体InsightAgent,提升商业平台“花火”和“必达”的效率。花火实现商单成交效率提升5倍以上,必达数据洞察效率提升3倍以上,推动分钟级投放决策。