机器学习/深度学习

首页 标签 机器学习/深度学习
# 机器学习/深度学习 #
关注
72967内容
大模型应用:大模型实测对比:1.8B vs 6B,本地部署的极限拉扯与真实体感.119
本文对比Qwen1.5-1.8B与ChatGLM2-6B两大中文大模型:前者轻量易部署,CPU即可运行,代码简洁,但易幻觉、指令遵循弱;后者参数量大,中文理解与逻辑更强,但需GPU、加载复杂。二者代表“小而美”与“大而全”的典型路径。
|
8小时前
|
棉花病害图像分类数据集分享(适用于YOLO系列深度学习分类检测任务)
本数据集含2320张棉花图像,涵盖病害/健康植株与叶片共4类,已划分训练/验证/测试集,专为YOLO等深度学习模型优化,支持智慧农业病害识别研究与应用。
|
10小时前
|
2026 年面向 LLM 的 RL方法总结:从 PPO 到 DPO 到 GRPO,再到多智能体 RL
本文梳理大模型对齐中强化学习的演进脉络:从PPO+RLHF起步,到DPO删去奖励模型、GRPO剔除Critic,再到MARL与智能体RL框架兴起。聚焦奖励信号变迁——由人类偏好转向可验证结果,并解析各算法适用场景、失效边界及开源技术栈(verl/TRL/Agent-R1等),揭示RL正从旁支走向LLM能力跃迁的核心引擎。
LLM 训练能不能少跑一点?Nous Research 的 TST 方法
Nous Research提出Token-Superposition Training(TST),一种不改模型架构、分词器、优化器或推理形式的预训练加速方法:训练前期将连续token平均为“叠加token”并预测下一组token,提升单位算力的数据吞吐;后期切回标准自回归训练。实验显示,在10B-A1B模型上可达2.5倍训练加速,显著降低GPU小时消耗。
用好 Codex Goal,关键就这三步
Codex 新增 /goal 命令,支持目标驱动的Agent式循环:设定可量化目标(如“运行时间降20%且测试全通过”)、构建短反馈闭环、用PLAN/EXPERIMENTS等Markdown文件持久化记忆。三要素缺一不可,方能真正释放长任务自动化潜力。
书尖 AI 借力阿里云云端算力,打造全新智慧阅读学习模式
书尖AI是依托阿里云算力、搭载自研大模型的智慧阅读平台,整合1.2亿+正版学习资源,支持智能精读、双人有声共读、个性化文稿创作与语音配音,数分钟提炼全书精华,兼顾碎片化学习与深度研读,操作简洁、安全可靠。(239字)
|
23小时前
|
谷歌域名滥用型高级钓鱼攻击机理分析与闭环防御体系研究
本文剖析2026年谷歌域名钓鱼事件,揭示SPF/DKIM/DMARC在可信云服务滥用下全面失效的严峻现实。攻击者利用Google Sites等合法子域实施多层跳转与页面仿真,绕过传统网关。研究提出“内容语义—链接行为—终端行为”三层协同防御框架,并提供重定向追踪、邮件风险分析、钓鱼页识别等可落地代码,推动防御从静态域名校验转向动态行为感知。(239字)
|
23小时前
|
Google Ads 同步错误钓鱼邮件攻击机理、识别与防御体系研究
本文剖析Google Ads“同步错误”钓鱼邮件攻击,揭示其伪装运维流程的社会工程学逻辑与技术实现,提炼多维度识别特征,构建“技术+制度+人员”三位一体防御体系,并提供可部署检测代码与应急流程,助力广告主和代理机构抵御业务化钓鱼威胁。(239字)
免费试用