2024-05-15
204

联合XTuner,魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区(SWIFT)合作引入了一项长序列文本训练技术,该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU,从而减少每个GPU上的显存占用。通过这种方式,训练超大规模模型时可以处理更长的序列,提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术,支持多种大模型和数据集的训练。此外,SWIFT还提供了一个用户友好的界面,方便用户进行训练和部署,并且支持评估功能。

2024-05-15
9789

Llama 3开源,魔搭社区手把手带你推理,部署,微调和评估

Meta发布了 Meta Llama 3系列,是LLama系列开源大型语言模型的下一代。在接下来的几个月,Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能,并会分享 Llama 3 研究论文。

9,789
2024-05-15
253

使用智能媒体生产ICE剪辑OSS视频文件

本篇介绍智能媒体生产ICE一些常见场景,如裁剪、拼接、字幕、ASR等,通过一些时间线示例,介绍如何快速剪辑OSS上的视频文件。

253
2024-05-15
112

日志审计:多账号下VPC流日志采集与监控方案

本文主要介绍如何基于日志审计进行跨账号的VPC流日志采集与监控。

112
2024-05-15
241740

卓越工程布道:掌握条件判断的模式

本文是普适性的经验分享,并非按规范局限在 JavaScript 前端视角 做出的总结,除JavaScript外还深入结合了ActionScript 3.0、PHP、C / C++、Basic非纯粹OOP领域语言的经验。

241,740
2024-05-15
153

Logtail日志采集支持高精度时间戳

本文为您介绍在使用Logtail进行日志采集时,如何从原始日志中提取毫秒精度时间戳。

153
2024-05-15
670

云效流水线+ECS服务器,自动化部署Web页面

本文主要介绍如何通过使用ECS服务器与npm,结合云效的流水线服务以仓库代码提交为触发方式,进行了基于Vue的Web网页部署。

2024-05-15
59

我知道你想用useEffect,但你先别急

useEffect是React提供给我们的一个“逃生舱”,是React 的纯函数式世界通往命令式世界的“逃生通道”,选择合适的时机使用useEffect会让我们的代码既优雅又高效,反之会造成不必要的负担。

59
2024-05-15
353

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角,阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架(类比AI的操作系统)。

353
1
...
5
6
7
...
17
到第
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
6/17