|
3月前
|
人工智能 数据可视化 物联网
|

《显卡 4090 就能跑!小白也能炼出私有大模型》

大模型微调是AI落地的关键技术,通过定向训练让通用模型在特定领域“从会到精”。本文详解微调原理、LoRA/QLoRA等高效方法,并提供评估与实操建议,助力新手快速上手,实现低成本、高精度的模型定制。

475 4

什么是幂等

幂等性指操作执行一次或多次结果一致。读操作(如HTTP GET)不改变数据,天然幂等;写操作(如POST、PUT、DELETE)可能改变状态,需额外机制保障幂等。

264 1
|
4月前
|
安全 Java API
|

Java 实用工具类使用指南:提升开发效率的核心技巧

本文系统梳理Java开发中10类常用工具类,涵盖字符串、日期、集合、加密、文件、数学、反射、IO流及网络操作,详解核心方法、使用场景与注意事项,助力开发者提升效率、减少冗余代码,增强程序稳定性与可读性。

126 0
|
4月前
|
关系型数据库 MySQL 数据库
|

用 Python 实现 MySQL 数据库定时自动备份

本文介绍如何用Python脚本实现MySQL数据库的自动化备份。通过`subprocess`调用`mysqldump`,结合时间戳命名、文件压缩与crontab定时任务,可高效完成无人值守备份,提升数据安全性与运维效率。

180 0
|
4月前
|
传感器 网络协议 编译器
|

C 语言为何能稳居底层开发主流语言宝座

自1972年诞生以来,C语言凭借极致性能、直接操控硬件的能力及完善的生态,在嵌入式系统、操作系统等底层开发领域持续占据核心地位,成为近半个世纪技术演进中不可替代的基石。

248 0
|
5月前
|
数据采集 人工智能 算法
|

美团 LongCat 团队发布全模态一站式评测基准UNO-Bench:揭示单模态与全模态能力的组合规律

美团LongCat团队推出一站式全模态大模型评测基准UNO-Bench,首创“组合定律”揭示多模态能力协同增益,支持中文场景,以98%跨模态问题占比和创新多步开放式题型,科学评估模型真实融合能力。

639 5
|
5月前
|
存储 关系型数据库 MySQL
|

MajorRAG文件内容提取实现分析(2/3)

一个RAG项目,全文共三个部分:MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1)第一次做RAG,欢迎带着指导意见评论 2)希望指出不足时可以附带替换方法 博客地址:https://zhangcraigxg.github.io

252 1
|
6月前
|
人工智能 程序员 开发者
|

「超级开发个体」在诞生:一份白皮书带你理解AI时代开发者

10月24日程序员节,魔搭社区联合知乎发布《THE NEXT WAVE:AI时代开发者生态白皮书》,揭示AI时代开发者新画像:以“超级个体”为核心,兼具技术与商业闭环能力,工具平权让个人开发者崛起。报告涵盖年龄、学历、组织分布及认知行为特征,展现开发者如何用AI提效、实现从“写代码”到“搭系统”的跃迁。点击下载完整报告。

431 0
|
6月前
|
存储 安全 API
|

73_安全配置:LLM开发环境的全面防护指南

在2025年的AI开发环境中,大型语言模型(LLM)已成为核心技术,但伴随其广泛应用的是日益严峻的安全挑战。据统计,2025年第一季度发生的AI安全事件中,LLM环境配置不当导致的漏洞占比高达43%,造成的损失超过2.1亿美元。本文将深入探讨LLM开发环境的安全配置最佳实践,帮助开发者构建一个安全、可靠的开发环境。

727 0
|
6月前
|
存储 人工智能 自然语言处理
|

96_主动学习提示:用户反馈驱动优化

在人工智能快速发展的今天,大型语言模型(LLM)已经成为各行各业的核心工具。然而,如何让LLM能够持续学习和适应新的需求,如何从用户交互中获取有价值的信息来优化模型性能,已经成为当前研究和应用的热点。主动学习提示(Active Learning Prompts)作为一种新型的提示工程技术,通过用户反馈的闭环系统,实现了模型能力的持续优化和提升。

310 0
|
6月前
|
人工智能 自然语言处理 安全
|

43_PaLM与Gemma:谷歌LLM演进

在人工智能发展的浪潮中,谷歌一直扮演着关键的技术引领者角色。从最初的神经机器翻译到如今的通用人工智能,谷歌通过持续的技术创新推动着自然语言处理领域的边界不断拓展。2022年,谷歌推出了革命性的PaLM(Pathways Language Model),这一模型不仅在规模上达到了前所未有的5400亿参数,更重要的是其采用了创新的Pathways训练方法,为大型语言模型的发展开辟了新路径。随后,谷歌又推出了Gemma系列开源模型,将先进的AI技术普惠给更广泛的开发者社区。

373 2
|
7月前
|
机器学习/深度学习 并行计算 小程序
|

DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价

今天,我们正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性( Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制…

862 0
|
7月前
|
人工智能
|

四大公益场景,20万奖金!AI开源公益创新挑战赛邀你一起「小有可为」

四大公益场景,20万奖金!AI开源公益创新挑战赛邀你一起「小有可为」

381 8
|
7月前
|
人工智能 关系型数据库 数据库
|

公募REITs专属AI多智能体查询分析项目

公募REITs专属AI多智能体查询分析项目。本项目是基于 OpenAI Agent 框架的多智能体项目,提供二级市场数据查询分析、招募说明书内容检索、公告信息检索、政策检索等多板块查询服务。支持图标绘制、文件生成。

248 2
|
7月前
|
自然语言处理 开发者
|

拿下30个第1名的腾讯混元翻译模型,开源!

腾讯混元又带来一个在国际机器翻译比赛拿下30个第1名的翻译模型Hunyuan-MT-7B,它总参数量仅7B,支持33个语种、5种民汉语言/方言互译,是一个能力全面的轻量级翻译模型。

682 0
|
8月前
|
物联网 开发者
|

LoRA 模型的全新玩法——AutoLoRA 带你体验 LoRA 检索与融合的魔法

LoRA 模型的全新玩法——AutoLoRA 带你体验 LoRA 检索与融合的魔法

413 0
|
8月前
|
人工智能 算法 安全
|

IROS 2025 |从数字智能走向物理智能,“桃源”与真实世界机器人学习挑战赛启动,2大赛道等你来战

2025年10月,IROS (智能机器人与系统国际会议)期间,上海人工智能实验室(上海AI实验室)将举办物理世界中的多模态机器人学习研讨会,IROS 2025“桃源”与真实世界机器人学习挑战赛(机器人学习挑战赛)现已启动报名,欢迎全球创新者与挑战者参加。

821 0
|
9月前
|
小程序 Java 关系型数据库
|

圈子系统公众号app小程序系统源码圈子系统带即时通讯 多级圈子系统源码 兴趣小组系统开源 私密圈子系统代码 会员制社区系统

本圈子系统解决方案提供即时通讯、多级圈子、兴趣小组、私密社区及会员制管理功能。支持开源与商业方案,推荐ThinkSNS+、EasyClub及OpenFire等系统,并提供前后端技术选型建议,助力快速搭建社交平台。

498 0
|
9月前
|
自然语言处理 API 开发者
|

腾讯混元开源首款混合推理MoE模型Hunyuan-A13B,性能优异,激活参数仅13B

6月27日,腾讯混元宣布开源混元-A13B模型,总参数800亿,激活参数仅130亿,在效果比肩顶尖开源模型的同时,大幅降低推理延迟与计算开销。这意味着,开发者可以用更低门槛的方式获得更好的模型能力。

571 1
|
10月前
|
数据可视化 JavaScript API
|

简易Modelscope生图API可视化工具

魔搭社区大模型生图API可视化UI

265 0
|
10月前
|
机器学习/深度学习 人工智能 文字识别
|

UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究

近年来,人工智能快速发展,大语言模型(LLM)在数学、代码等领域展现出强大的推理和生成能力,正在被广泛应用于各种场景。

351 0
|
11月前
|
数据采集 人工智能 自然语言处理
|

阶跃星辰联合光影焕像开源 3D 大模型 Step1X-3D,高保真+可控!

阶跃星辰联合光影焕像开源 3D 大模型 Step1X-3D,高保真+可控!

388 4
|
12月前
|
数据可视化 搜索推荐
|

Ollama-Deep-Researcher-本地Mac结合魔搭社区模型搭建网页研究助手

Ollama Deep Researcher 是一款完全本地化的网络研究助手,可使用Ollama托管的任何 LLM 。输入一个主题,它将生成网络搜索查询,收集网络搜索结果(默认通过Tavily),总结网络搜索结果,反思总结以检查知识差距,生成新的搜索查询以解决差距,搜索并改进总结,循环次数由用户定义。它将为用户提供最终的 markdown 摘要,其中包含所有使用的来源。

509 2
|
12月前
|
机器学习/深度学习 人工智能 IDE
|

14B小模型代码成绩紧逼O3-Mini!DeepCoder-14B-Preview:基于Deepseek-R1蒸馏优化的开源代码生成模型

DeepCoder-14B-Preview是基于Deepseek-R1蒸馏优化的140亿参数模型,通过强化学习微调在LiveCodeBench达到60.6%准确率,开源训练数据与系统优化方案。

571 3
来自: 自然语言处理  版块
|
12月前
|
人工智能 语音技术
|

ACTalker:港科大联合腾讯清华推出,多模态驱动的说话人视频生成神器

ACTalker是由香港科技大学联合腾讯、清华大学研发的端到端视频扩散框架,采用并行Mamba结构和多信号控制技术,能生成高度逼真的说话人头部视频。

465 0
来自: 计算机视觉  版块
|
1月前
|
JSON API 数据库
|

如何快速对接德国股票数据 API

德国作为欧洲最大经济体,其法兰克福交易所及DAX指数是全球配置欧洲资产的关键入口。本文详解如何通过StockTV金融API,快速接入德国股票实时行情、历史K线及DAX指数数据,支持毫秒级延迟与多周期分析。

184 4
|
3月前
|
人工智能 测试技术 API
|

外包项目提效的另一种路径:多模型 AI 的工程价值

外包行业提效困局日益凸显:需求多变、人员流动、周期压缩。单模型AI仅局部优化,难破系统瓶颈。多模型AI以工程化协同替代“人海战术”,通过任务分派、异常降级、流程固化,提升交付稳定性与可扩展性,正成为外包效能升级新路径。

156 2
|
4月前
|
存储 编译器 开发工具
|

C 语言项目实战入门:从 0 到 1 搭建简易学生信息管理系统

本文以“简易学生信息管理系统”为例,系统讲解C语言项目开发全流程,涵盖需求分析、数据结构设计、模块化编码、文件操作与调试优化,帮助初学者掌握结构体、指针、动态内存管理等核心技能,实现学生信息的增删改查与持久化存储,夯实C语言实战基础。

272 0
|
4月前
|
存储 NoSQL 关系型数据库
|

Python 持久层开发:从文件到数据库的实践指南

Python持久层开发覆盖全场景需求,从轻量文件(TXT/CSV/JSON)到关系型数据库(SQLite/MySQL/PostgreSQL),再到非关系型数据库(MongoDB/Redis),结合ORM工具,按需选型可实现高效、可靠的数据存储与访问,适配从小工具到企业级系统的各类应用。

201 0
|
4月前
|
SQL 监控 机器人
|

钉钉通知

11

215 0
|
4月前
|
SQL 前端开发 数据处理
|

Python 项目实战入门:从 0 到 1 搭建简易学生信息管理系统

本文以简易学生信息管理系统为例,详解Python Web项目从需求分析、技术选型到编码部署的完整流程。采用Flask+SQLite+Bootstrap轻量栈,实现增删改查与Excel导出,助初学者快速掌握开发逻辑与实战技能。

343 0
|
4月前
|
存储 消息中间件 开发框架
|

应用架构图

11

112 0
|
4月前
|
边缘计算 分布式计算 安全
|

Linux 为何能稳居服务器领域主流操作系统宝座

自1991年诞生以来,Linux凭借开源、稳定、高效和完善的生态,成为服务器、云计算、嵌入式等领域的主导操作系统。其低成本、高安全性与极致资源利用,支撑着阿里云、特斯拉、谷歌等全球科技巨头,未来仍将是数字世界的基石。

278 0
|
4月前
|
SQL 前端开发 数据处理
|

Python 项目实战入门:从 0 到 1 搭建简易学生信息管理系统

本文以简易学生信息管理系统为例,带领Python初学者从零构建完整Web项目。涵盖需求分析、Flask+SQLAlchemy技术栈搭建、数据库设计、前后端交互实现及本地部署全流程,助你掌握增删改查、数据持久化与Excel导出等核心功能,快速入门Python项目开发。

184 0
|
4月前
|
数据采集 安全 API
|

Python 实用标准库与工具函数使用指南

本文系统梳理Python高效开发三大利器:标准库(如datetime、pathlib)、第三方库(如requests、Pillow)及自定义工具函数(如空值判断、重试装饰器),结合高频场景与实操代码,助开发者提升效率,避免重复造轮子。

149 0
|
4月前
|
存储 前端开发 Java
|

Java 项目实战入门:从 0 到 1 搭建简易在线图书商城系统

本文以简易在线图书商城系统为例,系统讲解Java Web项目从需求分析、数据库设计到编码实现、部署上线的完整流程。涵盖用户管理、图书查询、购物车、订单等核心功能,采用主流框架与技术栈,贴近企业实际开发场景,助力Java初学者掌握项目实战技能,快速提升开发能力。

112 0
|
4月前
|
敏捷开发 Dubbo Java
|

需求开发人日评估

本文介绍了敏捷开发中工时评估的关键方法,重点讲解“人日”概念及开发、自测、联调、测试、发布各阶段的参考周期。结合常见需求如Excel导入导出、增删改查、跨服务调用等,提供实用的人日评估标准,并附天机学堂案例与详细拆分模板,助力团队科学排期。

111 1
|
4月前
|
人工智能 Serverless 开发工具
|

Git提交信息全是"update"?用这条指令让AI帮你重写"代码履历"

面对杂乱无章的Git提交记录,团队协作往往陷入"代码考古"的困境。本文介绍了一套基于大模型的Git提交信息标准化指令,通过消除认知阻断、统一技术方言和提升追溯精度,帮助开发者将碎片化的变更描述转化为架构级的版本记录,让代码维护不再困难。

335 11
|
4月前
|
机器学习/深度学习 人工智能 测试技术
|

NeurIPS 2025 | 浙大、浙工大等团队提出LRMs 自适应思考:简单任务快处理,复杂任务深分析

浙大、阿里云等提出首个LRM快慢思维控制方法,发现特定词可触发思维模式,结合PCA导向与自适应策略,实现无需训练的推理速度调控,在多模型上显著提升准确率并减少耗材。

214 1
|
6月前
|
存储 Java 关系型数据库
|

Spring Boot中Spring Data JPA的常用注解

Spring Data JPA通过注解简化数据库操作,实现实体与表的映射。常用注解包括:`@Entity`、`@Table`定义表结构;`@Id`、`@GeneratedValue`配置主键策略;`@Column`、`@Transient`控制字段映射;`@OneToOne`、`@OneToMany`等处理关联关系;`@Enumerated`、`@NamedQuery`支持枚举与命名查询。合理使用可提升开发效率与代码可维护性。(238字)

574 1
|
6月前
|
机器学习/深度学习 人工智能 并行计算
|

124_数据并行扩展:Megatron框架 - 分析模型分片的独特通信开销

2025年,大型语言模型的规模已达到数千亿甚至数万亿参数,单GPU训练已成为不可能的任务。高效的分布式训练技术成为训练超大模型的关键。Megatron框架作为业界领先的分布式训练解决方案,通过创新性的并行策略,实现了对超大语言模型的高效训练。

661 3
|
6月前
|
敏捷开发 人工智能 自然语言处理
|

87_文化适配:多语言提示设计 - 分析本地化提示的适配性

在全球化日益深入的今天,大型语言模型(LLM)的多语言能力已成为其核心竞争力之一。随着企业和开发者将AI应用推广到不同语言区域,如何设计适配各文化背景的提示词,确保模型输出既准确又符合目标语言使用者的文化习惯,已成为提示工程领域的重要挑战。文化适配的多语言提示设计不仅涉及简单的语言翻译,更需要深入理解目标文化的思维模式、表达习惯、价值观和禁忌,通过精心设计的提示策略,引导LLM生成真正贴合当地文化语境的内容。

328 0
|
6月前
|
Prometheus 监控 Cloud Native
|

78_资源监控:NVIDIA-SMI进阶

在大语言模型(LLM)训练和推理过程中,GPU资源的高效监控和管理至关重要。随着模型规模的不断增长和计算需求的提升,如何精确监控GPU利用率、及时发现性能瓶颈并进行优化,成为AI研究人员和工程师面临的重要挑战。NVIDIA-SMI作为NVIDIA官方提供的GPU监控工具,提供了丰富的功能来监控和管理GPU资源。本文将深入探讨NVIDIA-SMI的进阶使用方法,以及如何利用其与其他工具结合构建高效的GPU利用率可视化监控系统。

1035 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15213
内容
6
活动
4107
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互