编解码的搜索结果-阿里云开发者社区

鼎森电脑

|

1天前

|

博文

|

Mastercam 2025 官方电脑配置推荐

Mastercam 推荐配置：建议使用最新版 Windows Professional；推荐 Intel i7 处理器，至少 8GB 内存（建议 32GB），NVIDIA RTX 或 AMD FirePro™/Radeon Pro 专业显卡（4GB 以上内存）；双显示器设置，主显示器分辨率 1920x1080；使用 SSD 作为主驱动器；可选 3D 鼠标提升操作体验；注意杀毒软件可能影响软件运行。

# 编解码 # 固态存储 # openCL # 异构计算 # Windows

AI视界

|

2天前

|

博文

|

来自：大数据与机器学习

OpenAI的Sora模型现已正式开放使用，本文将详细介绍Sora的注册、使用方法及视频生成技巧。Sora能根据简洁文本生成长达60秒的高质量视频，具备远超以往模型的时间连续性和视觉效果。文章涵盖从零开始的准备工作、操作界面介绍、视频生成设置、编辑功能（如Re-cut、Remix、Blend、Loop）以及Storyboard故事板功能，帮助新手轻松上手世界顶级AI视频创作工具。此外，还解答了关于Sora的常见问题，包括订阅计划、视频类型和局限性等，适合全媒体创作者参考。

# 编解码 # 人工智能 # 自然语言处理 # 搜索推荐 # 机器人

阿里云运维工程师

|

2天前

|

博文

|

来自：弹性计算

阿里云GPU云服务器优惠收费标准,GPU服务器优缺点与适用场景详解

随着人工智能、大数据分析和高性能计算的发展，对计算资源的需求不断增加。GPU凭借强大的并行计算能力和高效的浮点运算性能，逐渐成为处理复杂计算任务的首选工具。阿里云提供了从入门级到旗舰级的多种GPU服务器，涵盖GN5、GN6、GN7、GN8和GN9系列，分别适用于图形渲染、视频编码、深度学习推理、训练和高性能计算等场景。本文详细介绍各系列的规格、价格和适用场景，帮助用户根据实际需求选择最合适的GPU实例。

# GPU云服务器 # 机器学习/深度学习 # 人工智能 # 编解码 # 并行计算 # 异构计算

蚝油菜花

|

3天前

|

博文

|

来自： ModelScope模型即服务

MV-Adapter：上交大、北航和 VAST 等联合开源多视图一致图像生成模型，将预训练的文生图扩散模型转为多视图生成器

MV-Adapter是由北京航空航天大学、VAST和上海交通大学联合开发的多视图一致图像生成模型。该模型能够将预训练的文本到图像扩散模型转化为多视图图像生成器，支持生成高分辨率的多视角图像。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 编解码

蚝油菜花

|

3天前

|

博文

|

来自： ModelScope模型即服务

ColorFlow：腾讯和清华大学联合推出的图像序列着色模型，通过参考图像的颜色对黑白漫画进行着色生成彩色漫画

ColorFlow是由清华大学和腾讯ARC实验室共同推出的图像序列着色模型，通过检索增强、上下文学习和超分辨率技术，确保黑白图像序列的着色与参考图像颜色一致，适用于漫画、动画制作等工业应用。

# 视觉智能开放平台 # 机器学习/深度学习 # 编解码 # 人工智能 # 物联网 # Python

petterp

|

3天前

|

博文

Happy coding，明基RD280U使用分享

最近尝试了明基的专业编程显示器 `RD280U`，28寸4K分辨率，3:2屏幕比例，适合编程。支持硬件级防蓝光、抗反射面板，接口丰富，支持KVM。自动亮度调节、编码模式和软件辅助功能，使其在编程体验上表现出色。如果你对专业编程显示器有需求，这无疑是一个不错的选择。

# 编解码 # IDE # KVM # 虚拟化 # Android开发

蚝油菜花

|

4天前

|

博文

|

来自： ModelScope模型即服务

Ruyi：图森未来推出的图生视频大模型，支持多分辨率、多时长视频生成，具备运动幅度和镜头控制等功能

Ruyi是图森未来推出的图生视频大模型，专为消费级显卡设计，支持多分辨率、多时长视频生成，具备首帧、首尾帧控制、运动幅度控制和镜头控制等特性。Ruyi基于DiT架构，能够降低动漫和游戏内容的开发周期和成本，是ACG爱好者和创作者的理想工具。

# 视觉智能开放平台 # 编解码 # 人工智能 # 自然语言处理 # Python

No-oN

|

4天前

|

博文

|

来自：阿里云百炼

神经codec模型相关论文

本文汇总了近年来在神经音频编解码器和语音语言模型领域的多项重要研究，涵盖从2020年到2024年的最新进展。这些研究包括端到端的音频编解码器、高效音频生成、高保真音频压缩、多模态表示学习等。每项研究都提供了详细的论文链接、代码和演示页面，方便读者深入了解和实验。例如，SoundStream（2021）提出了一种端到端的神经音频编解码器，而AudioLM（2022）则通过语言建模方法生成音频。此外，还有多个项目如InstructTTS、AudioDec、HiFi-Codec等，分别在表达性TTS、开源高保真音频编解码器和高保真音频压缩方面取得了显著成果。

# 编解码 # 自然语言处理 # 语音技术 # 流计算 # 知识图谱

蚝油菜花

|

5天前

|

博文

|

来自： ModelScope模型即服务

FreeScale：无需微调即可提升模型的图像生成能力，生成 8K 分辨率的高质量图像

FreeScale是一个无需微调的推理框架，旨在提升扩散模型生成高分辨率图像和视频的能力。该框架通过处理和融合不同尺度的信息，首次实现了8K分辨率图像的生成，显著提高了生成内容的质量和保真度，同时减少了推理时间。

# 视觉智能开放平台 # 编解码 # 人工智能

算AI

|

5天前

|

博文

WoodYOLO：用于木材种类鉴定的YOLO改进版

【论文解读】WoodYOLO通过木材的显微图像发现木材的特征，可用于木材种类鉴定，性能优于通用的YOLO

# 编解码 # 算法 # 数据挖掘 # BI # 计算机视觉

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

编解码