机器学习/深度学习

首页 标签 机器学习/深度学习
# 机器学习/深度学习 #
关注
70968内容
|
11小时前
| |
从另一个视角看Transformer:注意力机制就是可微分的k-NN算法
注意力机制可理解为一种“软k-NN”:查询向量通过缩放点积计算与各键的相似度,softmax归一化为权重,对值向量加权平均。1/√d缩放防止高维饱和,掩码控制信息流动(如因果、填充)。不同相似度函数(点积、余弦、RBF)对应不同归纳偏置,多头则在多个子空间并行该过程。
|
11小时前
| |
来自: 物联网
Phi-3 技术报告:手机本地运行的高能力语言模型——论文阅读
Phi-3系列模型通过高质量数据训练与架构创新,实现小体积、高性能,38亿参数的phi-3-mini在手机上即可运行,性能媲美GPT-3.5,支持长上下文与多模态,推动AI普惠化。
|
11小时前
| |
来自: 物联网
Phi-4 技术报告深度解读——论文阅读
微软Phi-4技术报告揭示了140亿参数小模型如何通过高质量合成数据与创新训练方法,在数学推理、代码生成等任务上超越千亿参数大模型。核心突破在于数据质量优于规模扩张,结合关键Token搜索(PTS)算法优化DPO训练,显著提升推理能力并降低幻觉。
|
11小时前
| |
来自: 物联网
Phi-3 技术报告:手机本地运行的高能力语言模型
Phi-3系列模型通过高质量数据训练与架构创新,实现小体积、高性能。38亿参数的phi-3-mini在手机端可达GPT-3.5水平,支持长上下文、多模态与高效推理,推动AI普惠化。
|
13小时前
| |
来自: 物联网
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
EdgeMark是一个面向嵌入式AI的自动化部署与基准测试系统,支持TensorFlow Lite Micro、Edge Impulse等主流工具,通过模块化架构实现模型生成、优化、转换与部署全流程自动化,并提供跨平台性能对比,助力开发者在资源受限设备上高效选择与部署AI模型。
|
13小时前
| |
来自: 物联网
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
|
14小时前
|
数字产科平台构建方案
数字产科平台构建方案:基于云计算与国产化技术,集成AI、物联网与RPA,实现孕产妇全周期智能管理。涵盖自助建档、高危预警、远程监护、智能宣教等功能。
免费试用