编解码

首页 标签 编解码
# 编解码 #
关注
17360内容
这个AI能拍无限长电影!SkyReels-V2:昆仑万维开源无限时长电影生成模型!
SkyReels-V2是昆仑万维推出的突破性视频生成模型,基于扩散强迫框架和多模态大语言模型技术,支持生成理论上无限时长的连贯视频内容,在影视制作、广告创意等领域展现强大潜力。
快速生成商业级高清图!SimpleAR:复旦联合字节推出图像生成黑科技,5亿参数秒出高清大图
SimpleAR是复旦大学与字节Seed团队联合研发的自回归图像生成模型,仅用5亿参数即可生成1024×1024分辨率的高质量图像,在GenEval等基准测试中表现优异。
|
22小时前
|
SmolVLM:资源受限环境下的高效多模态模型研究
SmolVLM是一系列专为资源受限设备多模态模型,通过优化架构与训练策略,在图像和视频处理任务中表现出接近大型模型的性能。该系列包含三种变体:SmolVLM-256M、500M和2.2B,分别适用于极端边缘计算、中等资源设备及高端边缘系统。研究探索了视觉与语言组件间的参数分配、高效视觉信息传递机制、视频编码策略等关键技术,并在多个基准测试中展现出卓越性能。SmolVLM不仅在计算效率和内存占用上具有显著优势,还在设备端部署中表现出高吞吐量和广泛适用性,适用于智能手机、笔记本电脑以及专业领域如文档理解与生物医学视觉问答等场景。论文由Ritvik Rastogi发布,详细探讨了模型设计与实验结果。
|
2天前
|
《解锁图像“高清密码”:超分辨率重建之路》
图像超分辨率重建技术旨在将低分辨率图像转化为高分辨率图像,恢复更多细节与清晰度。传统方法如插值法、重建模型和稀疏编码虽有一定效果,但受限于复杂度或灵活性。深度学习兴起后,基于卷积神经网络(CNN)、递归神经网络(RNN)及生成对抗网络(GANs)的方法大幅提升了重建质量,如SRCNN、DRCN、SRGAN等模型实现更精细的纹理还原。该技术广泛应用于安防监控、医学成像、遥感领域及影视修复,为各行业提供更清晰的视觉体验。未来,随着技术发展,其潜力将进一步释放,让模糊图像焕发高清光彩。
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型,基于DiT架构和高效视频压缩VAE,能够根据首尾帧图像自动生成5秒720p高清视频,支持多种风格变换和细节复刻。
导演失业预警!Seaweed-7B:字节7B参数模型让剧本自动变电影!20秒长镜头丝滑生成
Seaweed-7B是字节跳动推出的70亿参数视频生成模型,支持从文本、图像或音频生成高质量视频内容,具备长镜头生成、实时渲染等先进特性,通过优化架构显著降低计算成本。
告别潜在空间的黑箱操作,直接在原始像素空间建模!PixelFlow:港大团队开源像素级文生图模型
香港大学与Adobe联合研发的PixelFlow模型,通过流匹配和多尺度生成技术实现像素级图像生成,在256×256分辨率任务中取得1.98的FID分数,支持端到端训练并突破传统模型对预训练VAE的依赖。
|
5天前
|
《分布式软总线极简协议:高清视频流畅传输的幕后英雄》
高清视频已成为生活与工作中的重要部分,但其庞大数据量对传输带宽、延迟和丢包率提出了严苛要求。传统网络协议因多层架构和冗余字段导致效率低下,难以满足需求。分布式软总线极简协议通过精简架构、优化报文设计及双轮驱动机制,大幅减少包头开销,提升有效带宽20%,降低卡顿率50%。它智能感知网络变化,动态调整传输策略,保障流畅播放。未来,该协议将结合AI技术持续演进,为8K及更高分辨率视频提供更优质的传输体验。
|
5天前
|
《分布式软总线赋能老旧设备高效通信》
分布式软总线技术是实现设备互联互通的关键,但在面对老旧设备时面临性能瓶颈挑战。文章探讨了硬件老化、通信模块落后及软件系统兼容性等问题,并提出极简协议优化、智能资源调度和中间适配层等解决方案。通过实际案例展示,企业在办公场景中显著提升了老旧设备的通信效率,小区智能家居改造也让老旧设备焕发新生。未来结合人工智能与硬件升级,分布式软总线将更好地推动设备间高效协同,助力数字化转型。
胶佬狂喜!一键分解和修改建模!HoloPart:港大开源神器能将3D物体分解为完整、可编辑的语义部件
香港大学与VAST团队联合推出开源3D部件生成模型HoloPart,通过两阶段扩散模型实现被遮挡部件的完整重构,支持几何超分辨率与多场景应用,在ABO等数据集上展现显著技术优势。
免费试用