DuHz_个人页

DuHz
个人头像照片
27
0
0

个人介绍

暂无个人介绍

擅长的技术

  • 算法
  • 物联网
  • 边缘计算
  • 传感器
获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2025年09月

  • 09.27 15:33:19
    发表了文章 2025-09-27 15:33:19

    汽车雷达在多径存在下的幽灵目标检测——论文阅读

    本文研究汽车雷达在多径环境下的幽灵目标检测问题,提出基于广义似然比检验(GLRT)的检测框架,结合稀疏增强压缩感知与Levenberg-Marquardt优化,实现高精度角度估计与虚警控制,有效区分直接路径与多径干扰,提升复杂场景下目标检测可靠性。
  • 09.27 15:06:44
    发表了文章 2025-09-27 15:06:44

    汽车雷达系统的干扰缓解:现状调查与未来趋势——论文阅读

    本文系统综述了汽车雷达干扰缓解技术的最新进展,提出基于物理域避免、主动避免、反应式信号重建和被动调制技术的四类划分方法,深入分析各类策略的原理、优劣及实施挑战,并强调跨学科合作与监管协同对未来发展的关键作用。
  • 09.27 14:09:06
    发表了文章 2025-09-27 14:09:06

    面向能效和低延迟的语音控制智能家居:离线语音识别与物联网集成方案——论文阅读

    本文提出一种面向能效与低延迟的离线语音控制智能家居方案,通过将关键词识别(KWS)集成至终端设备,结合去中心化Mesh网络与CoAP协议,实现本地化语音处理。相较云端方案,系统能耗降低98%,延迟减少75%以上,显著提升响应速度与能源效率,为绿色智能家居提供可行路径。(236字)
  • 09.27 13:57:57
    发表了文章 2025-09-27 13:57:57

    智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读

    本文探讨智能家居中AI决策的可解释性,提出以人为中心的XAI框架。通过SHAP、DeepLIFT等技术提升模型透明度,结合用户认知与需求,构建三层解释体系,增强信任与交互效能。
  • 09.27 13:55:19
    发表了文章 2025-09-27 13:55:19

    Sasha:使用大语言模型在智能家居中进行创造性目标导向推理——论文阅读

    Sasha利用大语言模型实现智能家居中的创造性目标导向推理,通过迭代式澄清、过滤、规划与反馈机制,有效响应模糊用户指令。系统在真实家庭环境中表现出高相关性与用户满意度,支持复杂多步任务的自然交互,显著提升智能空间的适应性与可用性。
  • 09.27 12:33:47
    发表了文章 2025-09-27 12:33:47

    边缘云系统的灵活可变速率图像特征压缩——论文阅读

    本文提出一种面向边缘云系统的灵活可变速率图像特征压缩方法,通过联合优化率-精度-复杂度三重权衡,实现单模型多比特率自适应。该方法引入速率参数嵌入与条件归一化机制,在ResNet、ConvNeXt等架构上验证了高效性,显著优于固定速率方案,兼顾低延迟与高精度,适用于资源受限的视觉任务。
  • 09.27 12:18:46
    发表了文章 2025-09-27 12:18:46

    FrankenSplit:用于移动边缘计算的浅层变分瓶颈注入高效神经特征压缩——论文阅读

    FrankenSplit提出一种面向移动边缘计算的高效神经特征压缩框架,通过浅层变分瓶颈与显著性引导失真优化,实现低带宽、低延迟的模型分割推理,支持多架构泛化,在保持高精度的同时显著降低传输开销。
  • 09.26 01:20:13
    发表了文章 2025-09-26 01:20:13

    DDMA-MIMO雷达多子带相干累积目标检测算法——论文阅读

    本文提出一种多子带相干累积(MSCA)算法,通过引入空带和子带相干处理,解决DDMA-MIMO雷达的多普勒模糊与能量分散问题。该方法在低信噪比下显著提升检测性能,实测验证可有效恢复目标速度,适用于车载雷达高精度感知。
  • 09.26 01:15:24
    发表了文章 2025-09-26 01:15:24

    下一代汽车雷达系统调制方案的统一模型与综述

    本文提出统一信号模型,系统综述下一代汽车雷达调制方案。涵盖FMCW、PMCW、OFDM、OCDM与OTFS,分析其波形特性、抗干扰能力及实现复杂度,为高阶自动驾驶感知技术发展提供理论支撑与路径指引。(238字)
  • 09.26 00:31:11
    发表了文章 2025-09-26 00:31:11

    WorldSimBench: 迈向作为世界模拟器的视频生成模型——论文阅读

    WorldSimBench提出了一种新框架,旨在将视频生成模型发展为具备物理理解与动作执行能力的世界模拟器。通过构建层次化评估体系(S0-S3)和HF-Embodied数据集,结合显式感知与隐式操作双重评估,推动具身智能体在Minecraft、自动驾驶和机器人等场景中的真实任务表现。
  • 09.26 00:28:47
    发表了文章 2025-09-26 00:28:47

    Stable Video Diffusion:将潜在视频扩散模型扩展到大规模数据集——论文阅读

    Stable Video Diffusion(SVD)是Stability AI提出的高分辨率视频生成模型,基于潜在扩散框架,通过三阶段训练与严格数据筛选,在文本到视频和图像到视频任务中实现高质量生成。论文系统研究了数据质量对模型性能的影响,提出级联切分检测、运动评分过滤、合成字幕优化等策略,并引入线性递增引导等创新技术,显著提升生成稳定性与视觉保真度。
  • 09.24 20:14:34
    发表了文章 2025-09-24 20:14:34

    Phi-4 技术报告深度解读——论文阅读

    微软Phi-4技术报告揭示了140亿参数小模型如何通过高质量合成数据与创新训练方法,在数学推理、代码生成等任务上超越千亿参数大模型。核心突破在于数据质量优于规模扩张,结合关键Token搜索(PTS)算法优化DPO训练,显著提升推理能力并降低幻觉。
  • 09.24 19:42:11
    发表了文章 2025-09-24 19:42:11

    Phi-3 技术报告:手机本地运行的高能力语言模型

    Phi-3系列模型通过高质量数据训练与架构创新,实现小体积、高性能。38亿参数的phi-3-mini在手机端可达GPT-3.5水平,支持长上下文、多模态与高效推理,推动AI普惠化。
  • 09.24 18:21:35
    发表了文章 2025-09-24 18:21:35

    EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读

    EdgeMark是一个面向嵌入式AI的自动化部署与基准测试系统,支持TensorFlow Lite Micro、Edge Impulse等主流工具,通过模块化架构实现模型生成、优化、转换与部署全流程自动化,并提供跨平台性能对比,助力开发者在资源受限设备上高效选择与部署AI模型。
  • 09.24 18:17:22
    发表了文章 2025-09-24 18:17:22

    AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读

    AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
  • 09.21 23:08:16
    发表了文章 2025-09-21 23:08:16

    隧道中毫米波MIMO信道特性的实验研究——论文阅读

    本文针对地铁隧道环境开展28 GHz毫米波MIMO信道测量,研究水平与垂直极化下的信道特性。采用高增益定向天线克服路径损耗,并结合实测与射线追踪仿真分析。结果表明,水平极化因侧壁反射更强、角度扩展更大,信道容量优于垂直极化,为隧道内毫米波通信系统设计提供依据。
  • 09.21 23:04:40
    发表了文章 2025-09-21 23:04:40

    矩形隧道中MIMO信道特性的模态理论解释——论文解读

    本文基于模态理论研究矩形隧道中MIMO信道的传播特性,分析模式正交性、有效模式数及空间相关性对信道容量的影响。结果表明,在损耗壁条件下模式仍具准正交性,有效模式数随距离衰减,收发端相关性制约系统性能。研究为隧道等封闭环境下的MIMO系统设计提供了理论依据。
  • 09.18 00:01:04
    发表了文章 2025-09-18 00:01:04

    I-ViT: 用于高效视觉Transformer推理的纯整数量化——论文阅读

    I-ViT是首个专为视觉Transformer设计的纯整数量化方案,通过Shiftmax、ShiftGELU和I-LayerNorm实现全整数推理,避免浮点运算。在保持模型精度的同时,显著提升推理效率,实现3.7倍以上加速,推动ViT在边缘设备的高效部署。
  • 09.17 23:57:31
    发表了文章 2025-09-17 23:57:31

    SparseGPT:大规模语言模型的一次性精确剪枝——论文解读

    SparseGPT提出首个可高效剪枝百亿参数大模型的一次性精确方法,通过稀疏回归与近似求解器实现高稀疏度下仍保持精度,支持半结构化稀疏与量化联合压缩,显著降低推理成本。
  • 09.16 09:01:26
    发表了文章 2025-09-16 09:01:26

    模型量化技术简要详解

    模型量化技术通过将高精度浮点数转换为低精度整数,在保持模型性能的同时显著提升计算效率并降低内存占用。其核心在于权衡精度与效率,广泛应用于大模型部署,尤其在边缘设备和移动平台中发挥重要作用。
  • 09.16 08:07:56
    发表了文章 2025-09-16 08:07:56

    NLP参数高效迁移学习:Adapter方法——论文简读

    本研究深入探讨了自然语言处理中参数高效的迁移学习方法——Adapter。通过在预训练模型中引入小型可训练模块,仅调整少量额外参数即可完成模型适配。理论分析表明,该方法在初始化时保持网络行为稳定,并通过瓶颈结构大幅压缩参数规模。实验结果显示,Adapter在GLUE基准上仅用3.6%的参数便达到接近全微调的性能,且对学习率具有更强的鲁棒性。相比传统微调和其他参数高效方法,Adapter在多任务场景下展现出更优的存储效率与泛化能力,为大规模模型的实际部署提供了高效可行的解决方案。
  • 09.15 23:38:19
    发表了文章 2025-09-15 23:38:19

    SpQR: 稀疏量化表示实现大语言模型近无损压缩——论文阅读

    SpQR是一种创新的稀疏量化方法,通过识别并高精度存储导致大量化误差的异常权重,将其他权重压缩至3-4比特,实现大语言模型的近无损压缩。该方法在LLM压缩中首次跨模型规模达到接近16位精度的性能,压缩后模型平均误差低于1%。实验表明,SpQR在推理速度与压缩率上优于现有技术,使高质量大模型可在消费级设备高效运行。
  • 09.15 23:18:32
    发表了文章 2025-09-15 23:18:32

    SEENN: 迈向时间脉冲早退神经网络——论文阅读

    SEENN提出一种时间脉冲早退神经网络,通过自适应调整每个样本的推理时间步数,有效平衡脉冲神经网络的准确率与计算效率。该方法基于置信度判断或强化学习策略,在保证高精度的同时显著降低能耗与延迟,适用于边缘计算与实时处理场景。
  • 09.14 18:27:06
    发表了文章 2025-09-14 18:27:06

    MicroNAS:面向MCU的零样本神经架构搜索——论文阅读

    MicroNAS是一种专为微控制器单元(MCU)设计的零样本神经架构搜索(NAS)框架,无需训练即可通过理论驱动的性能指标评估网络架构。相比传统NAS方法,其搜索效率提升高达1104倍,同时兼顾精度与硬件效率,适用于边缘计算场景。该框架结合神经切线核(NTK)条件数、线性区域计数及硬件感知延迟模型,实现快速、高效的架构搜索,为资源受限设备上的AI部署提供了新思路。
  • 09.14 18:09:50
    发表了文章 2025-09-14 18:09:50

    H4H:面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索——论文阅读

    H4H是一种面向AR/VR应用的混合卷积-Transformer架构,基于NPU-CIM异构系统,通过神经架构搜索实现高效模型设计。该架构结合卷积神经网络(CNN)的局部特征提取与视觉Transformer(ViT)的全局信息处理能力,提升模型性能与效率。通过两阶段增量训练策略,缓解混合模型训练中的梯度冲突问题,并利用异构计算资源优化推理延迟与能耗。实验表明,H4H在相同准确率下显著降低延迟和功耗,为AR/VR设备上的边缘AI推理提供了高效解决方案。
  • 09.14 17:21:52
    发表了文章 2025-09-14 17:21:52

    SmoothQuant: 大型语言模型的精确高效后训练量化——论文阅读

    SmoothQuant是一种高效的大型语言模型后训练量化方法,通过平滑激活值中的异常值,有效降低量化误差。该方法在保持模型精度的同时,显著减少内存占用并加速推理过程,适用于从数十亿到数千亿参数的模型,已在OPT-175B和MT-NLG 530B等超大规模模型上验证其有效性。
  • 09.14 16:22:27
    发表了文章 2025-09-14 16:22:27

    AWQ: 面向设备端大语言模型压缩与加速的激活感知权重量化——论文阅读

    AWQ是一种面向设备端大语言模型(LLM)压缩与加速的激活感知权重量化方法。与传统基于权重大小的量化策略不同,AWQ通过分析输入激活分布识别关键权重通道,并采用按通道缩放策略,在保持硬件效率的同时显著提升量化精度。实验表明,AWQ在多种LLM上实现了接近无损的低比特量化(如INT4),并在边缘设备上实现高达3倍以上的推理加速,为大模型的设备端部署提供了高效解决方案。
  • 09.13 22:16:18
    发表了文章 2025-09-13 22:16:18

    嵌入式AI领域关键技术的理论基础

    本内容系统讲解嵌入式AI领域关键技术的数学理论基础,涵盖神经网络量化、剪枝、知识蒸馏与架构搜索的核心原理。深入探讨量化中的信息论与优化方法、稀疏网络的数学建模、蒸馏中的信息传递机制,以及神经架构搜索的优化框架,为在资源受限环境下实现高效AI推理提供理论支撑。
  • 09.13 21:14:31
    发表了文章 2025-09-13 21:14:31

    用于最近邻搜索的乘积量化——论文阅读

    本文介绍了用于最近邻搜索的乘积量化方法,通过将高维向量划分为低维子空间并分别量化,实现高效近似欧氏距离计算。该方法结合非对称距离计算(ADC)与倒排文件系统(IVFADC),在保持高搜索精度的同时显著降低计算复杂度和内存占用。实验表明,乘积量化在SIFT和GIST描述符上的表现优于现有方法,适用于大规模图像检索等应用。
  • 09.13 20:42:07
    发表了文章 2025-09-13 20:42:07

    改进的激光方法与更快的矩阵乘法——论文阅读

    Josh Alman与Virginia Vassilevska Williams在2021年提出改进的激光方法,将矩阵乘法指数ω的上界从2.37287降至2.37286。虽改进微小,但标志着自1986年以来核心技术的重要突破,展示了激光方法的潜力与优化空间。
  • 09.13 20:22:01
    发表了文章 2025-09-13 20:22:01

    论文阅读——使用分区截断奇异值分解滤波的近似卷积

    本文提出了一种基于分区截断奇异值分解(PTSVD)的近似卷积方法,旨在降低大型卷积运算的计算复杂度与内存占用,适用于音频信号处理等实时应用场景。该方法通过将脉冲响应分段并进行奇异值分解,仅保留主要奇异值对应的向量进行重构,从而实现高效滤波。实验表明,该方法在保持高精度的同时显著降低了运算量和存储需求,尤其适用于长房间脉冲响应的处理。
  • 09.13 20:07:13
    发表了文章 2025-09-13 20:07:13

    无乘法器的多常数乘法——论文简读

    本文研究了无乘法器的多常数乘法(MCM)问题,旨在通过加法、减法和移位操作高效实现多个常数与变量的乘法,在降低硬件成本和功耗方面具有重要意义。
  • 09.12 00:10:11
    发表了文章 2025-09-12 00:10:11

    EdgeShard:通过协作边缘计算实现高效的大语言模型推理——论文解读

    EdgeShard是一种基于协作边缘计算的大语言模型(LLM)推理框架,旨在解决LLM在云端部署面临的延迟高、带宽压力大和隐私泄露等问题。通过将LLM分片部署在多个边缘设备上,结合云边协同与设备间协作,EdgeShard实现了高效的模型推理。其核心创新包括:联合设备选择与模型划分优化、支持流水线并行与微批处理、提出EdgeShard-No-Bubbles策略以减少设备空闲时间,从而显著提升推理吞吐量并降低延迟。实验表明,EdgeShard在异构边缘设备上可实现高达50%的延迟降低和2倍的吞吐量提升,支持全精度模型推理而无精度损失,为资源受限的边缘环境提供了高效的LLM部署方案。
  • 09.11 23:40:31
    发表了文章 2025-09-11 23:40:31

    论文阅读——Agile-Quant:面向大语言模型边缘端更快推理的激活引导量化框架

    Agile-Quant是一种针对大语言模型(LLMs)在边缘设备上高效推理的激活引导量化框架。它通过分析激活特性,提出了一种结合激活引导量化与token剪枝的优化策略,有效缓解了激活量化中的异常值问题,并提升了模型在边缘设备上的推理速度。该方法在LLaMA、OPT和BLOOM等主流LLMs上验证,实现了高达2.5倍的实际加速,同时保持了优异的模型性能。
  • 09.10 22:24:52
    发表了文章 2025-09-10 22:24:52

    Mixture of Experts架构的简要解析

    Mixture of Experts(MoE)架构起源于1991年,其核心思想是通过多个专门化的“专家”网络处理输入的不同部分,并由门控网络动态组合输出。这种架构实现了稀疏激活,仅激活部分专家,从而在模型规模与计算成本之间取得平衡。MoE的关键在于门控机制的设计,如线性门控、噪声Top-K门控等,确保模型能根据输入特征自适应选择专家。
  • 09.10 22:03:25
    发表了文章 2025-09-10 22:03:25

    Transformer架构的简要解析

    Transformer架构自2017年提出以来,彻底革新了人工智能领域,广泛应用于自然语言处理、语音识别等任务。其核心创新在于自注意力机制,通过计算序列中任意两个位置的相关性,打破了传统循环神经网络的序列依赖限制,实现了高效并行化与长距离依赖建模。该架构由编码器和解码器组成,结合多头注意力、位置编码、前馈网络等模块,大幅提升了模型表达能力与训练效率。从BERT到GPT系列,几乎所有现代大语言模型均基于Transformer构建,成为深度学习时代的关键技术突破之一。
  • 09.10 21:27:24
    发表了文章 2025-09-10 21:27:24

    大语言模型的核心算法——简要解析

    大语言模型的核心算法基于Transformer架构,以自注意力机制为核心,通过Q、K、V矩阵动态捕捉序列内部关系。多头注意力增强模型表达能力,位置编码(如RoPE)解决顺序信息问题。Flash Attention优化计算效率,GQA平衡性能与资源消耗。训练上,DPO替代RLHF提升效率,MoE架构实现参数扩展,Constitutional AI实现自监督对齐。整体技术推动模型在长序列、低资源下的性能突破。
  • 09.08 23:03:41
    发表了文章 2025-09-08 23:03:41

    ProxylessNAS:直接在目标任务和硬件上进行神经架构搜索——论文解读

    ProxylessNAS是一种直接在目标任务和硬件上进行神经架构搜索的方法,有效降低了传统NAS的计算成本。通过路径二值化和两路径采样策略,减少内存占用并提升搜索效率。相比代理任务方法,ProxylessNAS在ImageNet等大规模任务中展现出更优性能,兼顾准确率与延迟,支持针对不同硬件(如GPU、CPU、移动端)定制高效网络架构。
  • 09.07 13:12:41
    发表了文章 2025-09-07 13:12:41

    MINUN: 微控制器上的精确机器学习推理——论文阅读

    MINUN是一个专为微控制器设计的高效机器学习推理框架,能精确解决TinyML中的三大挑战:数字表示参数化、位宽分配优化和内存碎片管理。它支持如Arduino和STM32等低功耗设备,显著减少内存占用,同时保持模型精度。
  • 09.07 02:16:01
    发表了文章 2025-09-07 02:16:01

    μNAS:面向微控制器的约束神经架构搜索——论文解读

    μNAS是一种专为微控制器设计的神经架构搜索方法,旨在解决物联网设备中资源受限的挑战。通过多目标优化框架,μNAS能够在有限的内存和计算能力下,自动搜索出高效的神经网络结构。该方法结合了老化进化算法与贝叶斯优化,并引入结构化剪枝技术,实现模型压缩。实验表明,μNAS在多个数据集上均取得了优异的精度与资源使用平衡,显著优于现有方法,为边缘计算设备的智能化提供了可行路径。
  • 09.06 21:29:15
    发表了文章 2025-09-06 21:29:15

    TensorFlow Lite Micro:嵌入式TinyML系统上的机器学习推理框架——论文深度解析

    TensorFlow Lite Micro(TFLM)是专为嵌入式系统设计的轻量级机器学习推理框架,适用于仅有几十KB内存的微控制器。它通过极简架构、模块化设计和内存优化策略,在资源受限设备上高效运行TinyML模型,广泛应用于关键词检测、传感器分析、预测性维护等领域。TFLM支持跨平台部署,并允许硬件厂商提供定制优化,兼顾灵活性与性能。
  • 09.06 21:26:07
    发表了文章 2025-09-06 21:26:07

    256KB内存约束下的设备端训练:算法与系统协同设计——论文解读

    MIT与MIT-IBM Watson AI Lab团队提出一种创新方法,在仅256KB SRAM和1MB Flash的微控制器上实现深度神经网络训练。该研究通过量化感知缩放(QAS)、稀疏层/张量更新及算子重排序等技术,将内存占用降至141KB,较传统框架减少2300倍,首次突破设备端训练的内存瓶颈,推动边缘智能发展。
  • 发表了文章 2025-09-27

    汽车雷达系统的干扰缓解:现状调查与未来趋势——论文阅读

  • 发表了文章 2025-09-27

    汽车雷达在多径存在下的幽灵目标检测——论文阅读

  • 发表了文章 2025-09-27

    面向能效和低延迟的语音控制智能家居:离线语音识别与物联网集成方案——论文阅读

  • 发表了文章 2025-09-27

    智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读

  • 发表了文章 2025-09-27

    Sasha:使用大语言模型在智能家居中进行创造性目标导向推理——论文阅读

  • 发表了文章 2025-09-27

    边缘云系统的灵活可变速率图像特征压缩——论文阅读

  • 发表了文章 2025-09-27

    FrankenSplit:用于移动边缘计算的浅层变分瓶颈注入高效神经特征压缩——论文阅读

  • 发表了文章 2025-09-26

    DDMA-MIMO雷达多子带相干累积目标检测算法——论文阅读

  • 发表了文章 2025-09-26

    下一代汽车雷达系统调制方案的统一模型与综述

  • 发表了文章 2025-09-26

    WorldSimBench: 迈向作为世界模拟器的视频生成模型——论文阅读

  • 发表了文章 2025-09-26

    Stable Video Diffusion:将潜在视频扩散模型扩展到大规模数据集——论文阅读

  • 发表了文章 2025-09-24

    Phi-4 技术报告深度解读——论文阅读

  • 发表了文章 2025-09-24

    Phi-3 技术报告:手机本地运行的高能力语言模型

  • 发表了文章 2025-09-24

    EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读

  • 发表了文章 2025-09-24

    AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读

  • 发表了文章 2025-09-21

    隧道中毫米波MIMO信道特性的实验研究——论文阅读

  • 发表了文章 2025-09-21

    矩形隧道中MIMO信道特性的模态理论解释——论文解读

  • 发表了文章 2025-09-18

    I-ViT: 用于高效视觉Transformer推理的纯整数量化——论文阅读

  • 发表了文章 2025-09-18

    SparseGPT:大规模语言模型的一次性精确剪枝——论文解读

  • 发表了文章 2025-09-17

    NLP参数高效迁移学习:Adapter方法——论文简读

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息