maoyutinga1_个人页

maoyutinga1
个人头像照片
28
0
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2026年04月

  • 04.08 15:33:57
    发表了文章 2026-04-08 15:33:57

    别再死磕SFT了!用KTO微调Qwen3-14B,数据减半效果翻倍

    传统SFT需构造问答对,RLHF需成对比较,成本高且繁琐。KTO受行为经济学启发,仅需单个回答的“好/差”标签即可实现偏好对齐,数据减半效果翻倍。本文以Qwen3-14B为例,在LlamaFactory Online平台一键完成KTO微调。微调后的模型面对复杂脑科学对比问题,展现出教材级的结构化表达:分层论述、对比表格、总结精炼,从“能回答”进化为“会讲解”。教育、咨询等内容密集型场景值得尝试。
  • 04.08 14:55:22
    发表了文章 2026-04-08 14:55:22

    告别“令牌”与“智元”之争,“词元”定名背后的140万亿经济账

    2026年3月国家数据局将Token正式定名“词元”,终结译名争议。其日均调用量达140万亿+,两年增超千倍,成为AI产业核心指标。定名推动产业标准化,大模型厂商、云厂商等受益,中国AI迈入商业化成熟期,将建统一词元市场。

2026年03月

  • 03.24 17:19:35
    发表了文章 2026-03-24 17:19:35

    让AI学会“讨人喜欢”:用PPO-RW给Qwen3-1.7B装上“审美神经”

    在大模型微调过程中,如何让模型不仅能生成正确的指令回复,还能在语气、逻辑结构和专业度上更贴近人类偏好?本文将基于LlamaFactory Online平台,详细展示如何利用 PPO-RW算法对Qwen3-1.7B进行深度微调,并以“时空聚类分析”这一复杂技术任务为例,验证微调后的效果提升。
  • 03.16 10:36:40
    发表了文章 2026-03-16 10:36:40

    把历史模型当“乐高”拼:一种新的微调加速范式

    算法工程师常闲置大量历史模型checkpoint,造成资源浪费。3月10日arXiv论文提出Mashup Learning混搭学习,通过检索、合并历史模型权重再微调,可使新模型训练耗时最高降低37%,准确率小幅提升,为大模型高效微调提供新范式。
  • 03.10 09:59:19
    发表了文章 2026-03-10 09:59:19

    港科大这个AI突破,让大模型学会“偷懒”了

    多模态大模型推理效率低?港科大最新研究MoDES,让AI学会“偷懒”——跳过88%冗余专家,保住97%性能,推理速度翻倍。这项被CVPR接收的突破,正在让大模型从“拼参数”转向“拼效率”。
  • 03.09 16:39:44
    发表了文章 2026-03-09 16:39:44

    从“脸盲”到“火眼金睛”:我用Qwen3.5教会AI看懂春晚同款机器人

    春晚人形机器人刷屏,你的 AI 能认出几个?基于 LlamaFactory Online 微调 Qwen3.5-35B-A3B,数百条数据一键训练,模型可精准识别宇树 H1 及应用场景,准确率大幅提升,彰显平台化工具垂直落地价值。
  • 03.03 11:40:48
    发表了文章 2026-03-03 11:40:48

    只有2B参数,中文能力也能打架?手把手教你调教出更懂中文的“小钢炮”模型

    本文在LlamaFactory Online平台微调Chinese Tiny LLM - 2B小模型,通过困惑度筛选高质量中文语料,并设计三组中英配比实验。结果显示:微调后模型BLEU-4从11.34跃升至30.44,ROUGE指标全面领先。证明小模型经精细数据喂养,中文能力可媲美大模型,为算力受限团队提供轻量化落地路径。
  • 03.02 10:44:30
    发表了文章 2026-03-02 10:44:30

    阿里除夕开源千问3.5:3970亿参数但只激活170亿,大模型部署成本砍半怎么做到的?

    本文探讨 AI 落地深水区的成本与效率难题,解析阿里 Qwen3.5 通过混合注意力、稀疏 MoE 等技术实现性能跃升与降本增效,并对比 Prompt、RAG 与微调的适用场景,指出企业应结合模型特性规划技术路线,借助平台实现 AI 从能用向好用进阶。

2026年02月

  • 02.02 17:49:49
    发表了文章 2026-02-02 17:49:49

    让AI听懂“宫商角徵羽”:基于Qwen2-Audio的传统音乐语义解析系统实战

    摘要:本文基于 LLaMA-Factory Online 平台,详细介绍了如何通过对 Qwen2-Audio-7B-Instruct 模型进行LoRA微调,构建一个具备传统音乐解析能力的智能音频交互系统。该系统不仅能够理解音乐调式、情感韵律,还深度融合了中国传统五声音阶特征,为音乐教育、文化传承、虚拟角色交互等场景提供了可落地的AI解决方案。
  • 02.02 10:25:05
    发表了文章 2026-02-02 10:25:05

    深度复盘:Qwen3-4B-Instruct-2507微调实战——打造“快思考、强执行”的 ReAct IoT Agent

    随着大模型与物联网的深度融合,传统“指令—执行”式的智能家居系统已难以应对真实场景中复杂、模糊的用户需求。为此,我们推出IoT Agent v3.2——一个基于ReAct(Reasoning + Acting)架构的主动式物联网智能体,旨在从“被动执行者”进化为具备主动感知、逻辑推理、动态技能调用能力的“全能管家”。本文将全面解析其设计理念、数据集构建、工程实现与训练过程,为行业提供可复用的最佳实践案例。

2026年01月

  • 01.26 17:01:39
    发表了文章 2026-01-26 17:01:39

    告别“大模型恐惧症”:如何用1/10的成本,跑出企业级AI的顶级效果?

    今天,我们将通过一场实战,展示如何将80亿参数的Qwen3-8B模型与LightLLM高效推理框架相结合,在LLaMA-Factory Online上,打造一个兼具深度理解力与高并发服务能力的“六边形战士”。
  • 01.23 17:05:54
    发表了文章 2026-01-23 17:05:54

    DeepSeek V4全网猜测汇总:四大焦点浮出水面

    DeepSeek V4因代码曝光引发热议,全网聚焦发布时间、核心技术、能力成本及生态格局四大焦点,线索源自公开爆料与实测。官方暂未回应,待其首发后可通过LLaMA-Factory Online解锁定制玩法。
  • 01.08 16:39:21
    发表了文章 2026-01-08 16:39:21

    还在做93道MBTI选择题?我们训了个AI,聊8句就能看透你

    还在为做93道MBTI选择题纠结不已吗?我们开发了一款AI,只需与你进行8轮自然聊天,就能看透你的性格底色,准确率高达99%。其核心在于我们设计了能绕开自我评估的多轮对话数据集,并通过高效微调让模型掌握了分析技巧。测试表明,AI在MBTI四个维度上的判断均表现优秀,真正实现了“对话即测评”。

2025年12月

2025年11月

  • 11.20 20:27:23
    发表了文章 2025-11-20 20:27:23

    最佳实践丨让苏东坡“复活”!我用Qwen3-8B实现了与千古文豪的跨时空对话

    随着人工智能技术的不断发展,虚拟角色不再只是冰冷的对话机器,而是能够承载历史人物的气质、知识体系乃至精神风貌的“数字化身”。今天,我们将完整揭秘如何基于Qwen3-8B大模型,借助LLaMA-Factory Online平台,打造一个沉浸式的“苏东坡数字分身”,让前沿技术为文化传承注入新的活力。
  • 11.18 19:18:28
    发表了文章 2025-11-18 19:18:28

    大模型微调有必要做吗?全参数微调、LoRA还是RAG?看完这篇你就懂了

    在人工智能时代,若想以最小成本、最高效率赋能通用大模型专业的行业能力,关键在于找到效果、成本与灵活性的黄金平衡点......
  • 11.13 19:11:44
    发表了文章 2025-11-13 19:11:44

    数据不够怎么办?新加坡国立大学揭秘扩散语言模型的“秘密武器”

    新加坡国立大学研究发现,扩散语言模型(DLM)在有限数据下表现卓越,重复训练480次性能仍不饱和,数据潜力超自回归模型3倍,为破解AI“数据饥渴”难题提供新路径。
  • 11.12 11:33:22
    发表了文章 2025-11-12 11:33:22

    别再“调教”ChatGPT了!用Qwen2.5打造24小时在线数字分身

    在AI时代,专属“数字分身”正从科幻走向现实。依托Qwen2.5-14B大模型、LoRA微调技术及LLaMA-Factory Online平台,仅需四步即可打造会说话、懂风格、能办事的个性化AI助手,让每个人拥有自己的“贾维斯”。
  • 11.06 18:08:10
    发表了文章 2025-11-06 18:08:10

    大模型微调「数据集构建」保姆级教程(超全)

    2024年是“行业大模型元年”,但超80%微调失败源于数据问题。本文揭示从数据收集、清洗到增强的全流程方法论,强调“数据优先”而非“算法崇拜”,结合实战案例与工具推荐,助你构建高质量数据集,真正释放大模型业务价值。
  • 11.04 19:35:16
    发表了文章 2025-11-04 19:35:16

    我用单张显卡跑了个“法律顾问”,靠它成功追回了加班费

    面对劳动纠纷,你是否因法律条款难懂、律师费用高昂而束手无策?本文分享如何用单张显卡本地部署Qwen3-8B模型,结合RAG技术打造专属劳动法AI顾问。相比通用模型,该系统能精准解析加班费争议、证据链构建等实战问题,提供可操作的仲裁策略。从数据处理到服务上线,全流程轻量高效,助力普通人也能“专业维权”。

2025年10月

  • 10.30 19:16:54
    发表了文章 2025-10-30 19:16:54

    国产AI封神!炒股狂赚40%碾压对手 教你微调Qwen3打造专属金融分析师

    国产AI在实盘炒股中大放异彩,DeepSeek与Qwen3收益率最高超60%,碾压国际大模型。本文教你用LLaMA Factory平台微调Qwen3-VL-30B,打造专属多模态金融分析师,实现趋势研判、财报分析等专业能力,赋能投资决策。
  • 10.28 15:52:37
    发表了文章 2025-10-28 15:52:37

    2小时打造专业医疗助手:基于CareGPT与Qwen3-8B的微调实战

    基于CareGPT和Qwen3-8B模型,采用LoRA方法在专业医疗数据集上进行微调实践,该技术方案在保持模型通用能力的同时,显著提升了医疗问答的专业性和实用性,系统性地构建一个真正“懂症状、能判断”的智能医疗助手。从技术演进角度看,微调后的模型与医疗系统深度融合将释放更大价值。这种"领域微调+系统集成"的技术路径,为AI在医疗等专业场景的落地提供了经过验证的解决方案。
  • 发表了文章 2026-04-08

    别再死磕SFT了!用KTO微调Qwen3-14B,数据减半效果翻倍

  • 发表了文章 2026-04-08

    告别“令牌”与“智元”之争,“词元”定名背后的140万亿经济账

  • 发表了文章 2026-03-24

    让AI学会“讨人喜欢”:用PPO-RW给Qwen3-1.7B装上“审美神经”

  • 发表了文章 2026-03-16

    把历史模型当“乐高”拼:一种新的微调加速范式

  • 发表了文章 2026-03-09

    从“脸盲”到“火眼金睛”:我用Qwen3.5教会AI看懂春晚同款机器人

  • 发表了文章 2026-03-03

    只有2B参数,中文能力也能打架?手把手教你调教出更懂中文的“小钢炮”模型

  • 发表了文章 2026-03-02

    阿里除夕开源千问3.5:3970亿参数但只激活170亿,大模型部署成本砍半怎么做到的?

  • 发表了文章 2026-02-02

    让AI听懂“宫商角徵羽”:基于Qwen2-Audio的传统音乐语义解析系统实战

  • 发表了文章 2026-02-02

    深度复盘:Qwen3-4B-Instruct-2507微调实战——打造“快思考、强执行”的 ReAct IoT Agent

  • 发表了文章 2025-12-17

    让智能家居“听懂人话”:我用4B模型+万条数据,教会了它理解复杂指令

  • 发表了文章 2025-12-16

    告别深夜批改:用Qwen3-VL大模型打造会“理解”的作文阅卷助手

  • 发表了文章 2025-12-02

    16k数据撬动300亿大模型!我用Qwen3-VL打造了一位“顶尖放射科医生”

  • 发表了文章 2025-12-01

    PPO最强,DPO一般?一文带你了解常见三种强化学习方法,文末推荐大模型微调神器!

  • 发表了文章 2025-11-20

    最佳实践丨让苏东坡“复活”!我用Qwen3-8B实现了与千古文豪的跨时空对话

  • 发表了文章 2025-11-18

    大模型微调有必要做吗?全参数微调、LoRA还是RAG?看完这篇你就懂了

  • 发表了文章 2025-11-13

    数据不够怎么办?新加坡国立大学揭秘扩散语言模型的“秘密武器”

  • 发表了文章 2025-11-12

    别再“调教”ChatGPT了!用Qwen2.5打造24小时在线数字分身

  • 发表了文章 2025-11-06

    大模型微调「数据集构建」保姆级教程(超全)

  • 发表了文章 2025-11-04

    我用单张显卡跑了个“法律顾问”,靠它成功追回了加班费

  • 发表了文章 2025-10-30

    国产AI封神!炒股狂赚40%碾压对手 教你微调Qwen3打造专属金融分析师

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息