人工智能(AI)之计算机视觉和自然语言训练文件

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: 人工智能(AI)之计算机视觉和自然语言训练文件

学习了一段时间人工智能,不能算会什么东西,但整理了和获取了一些火车(Train)文件,计算机视觉的和NLP的语料库。这2个方向再很多时候是相辅相成、相互依存、相互使用的。所以都得会。我将我这6个月获得的Train文件分享给大家,持续更新,有最新的我就放上去。免去大家苦苦度娘的辛苦。

计算机视觉

ImageAI训练我自己的设备图纸:https://pan.baidu.com/s/1H2TjLGUpfX78Yv32mdw5HQ

猫、狗、马自己整理的:https://pan.baidu.com/s/1Pk5od3KRqXs5USMBhAQisw

GAN网络动漫图片:https://pan.baidu.com/s/1EdlIKlw3_54hyknscLfmCA

GAN网络美女头像:https://pan.baidu.com/s/1H__x0BcM25kqGdF4r8mgrA

目标识别VOC2007(Train和Test已经合并):https://pan.baidu.com/s/1mSCdVA9VDu6Ic-TQqmDCKQ

目标识别VOC2012(Train和Test已经合并):https://pan.baidu.com/s/1SOMMFsMo-whk29OBU33tXQ

MNST手写体:https://pan.baidu.com/s/1WNqvRfvqUegnywUa9vI-UA

自然语言

语料库合集->包括人民日报2014、人民日报1998、唐诗300、现代文学一篇:

https://pan.baidu.com/s/1DmujCq4Yui7u0HiTxmXP1Q

人民日报2014(分词使用):https://pan.baidu.com/s/1nYwt3YBAd3yKryCjcOGjQg

人民日报1998(分词使用):https://pan.baidu.com/s/1y8XCufDNqgae79cfKToYlg

唐诗300,自动作诗:https://pan.baidu.com/s/1dd2d-nI0BIrpr_hVjvul-w

现代文学分词使用:https://pan.baidu.com/s/1EXU4w7Yfj1SWE7YnZvGwYQ

ICWB2分词使用:https://pan.baidu.com/s/1gpHMUxLayW5pRRpvORatFA

未完待续。。。

目录
相关文章
|
5天前
|
人工智能 自然语言处理 Java
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
FastExcel 是一款基于 Java 的高性能 Excel 处理工具,专注于优化大规模数据处理,提供简洁易用的 API 和流式操作能力,支持从 EasyExcel 无缝迁移。
52 9
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
|
10天前
|
数据采集 人工智能 自然语言处理
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
Midscene.js 是一款基于 AI 技术的 UI 自动化测试框架,通过自然语言交互简化测试流程,支持动作执行、数据查询和页面断言,提供可视化报告,适用于多种应用场景。
103 1
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
|
24天前
|
人工智能 自然语言处理 前端开发
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
Director 是一个构建视频智能体的 AI 框架,用户可以通过自然语言命令执行复杂的视频任务,如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施,集成了多个预构建的视频代理和 AI API,支持高度定制化,适用于开发者和创作者。
83 9
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
|
7天前
|
人工智能 安全 搜索推荐
新手指南:人工智能poe ai 怎么用?国内使用poe记住这个方法就够了!
由于国内网络限制,许多用户在尝试访问Poe AI时面临障碍。幸运的是,现在国内用户也能轻松畅玩Poe AI,告别繁琐的设置,直接开启AI创作之旅!🎉
54 13
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在自然语言处理中的突破:从理论到应用
AI在自然语言处理中的突破:从理论到应用
74 17
|
28天前
|
机器学习/深度学习 存储 人工智能
【AI系统】感知量化训练 QAT
本文介绍感知量化训练(QAT)流程,旨在减少神经网络从FP32量化至INT8时的精度损失。通过在模型中插入伪量化节点(FakeQuant)模拟量化误差,并在训练中最小化这些误差,使模型适应量化环境。文章还探讨了伪量化节点的作用、正向与反向传播处理、TensorRT中的QAT模型高效推理,以及QAT与PTQ的对比,提供了实践技巧,如从良好校准的PTQ模型开始、采用余弦退火学习率计划等。
78 2
【AI系统】感知量化训练 QAT
|
28天前
|
机器学习/深度学习 存储 人工智能
【AI系统】训练后量化与部署
本文详细介绍了训练后量化技术,涵盖动态和静态量化方法,旨在将模型权重和激活从浮点数转换为整数,以优化模型大小和推理速度。通过KL散度等校准方法和量化粒度控制,文章探讨了如何平衡模型精度与性能,同时提供了端侧量化推理部署的具体实现步骤和技术技巧。
44 1
【AI系统】训练后量化与部署
|
7天前
|
人工智能 智能硬件
SPAR:智谱 AI 推出自我博弈训练框架,基于生成者和完善者两个角色的互动,提升了执行准确度和自我完善能力
SPAR 是智谱团队推出的自我博弈训练框架,旨在提升大型语言模型在指令遵循方面的能力,通过生成者和完善者的互动以及树搜索技术优化模型响应。
21 0
SPAR:智谱 AI 推出自我博弈训练框架,基于生成者和完善者两个角色的互动,提升了执行准确度和自我完善能力
|
27天前
|
人工智能 PyTorch 测试技术
【AI系统】并行训练基本介绍
分布式训练通过将任务分配至多个节点,显著提升模型训练效率与精度。本文聚焦PyTorch2.0中的分布式训练技术,涵盖数据并行、模型并行及混合并行等策略,以及DDP、RPC等核心组件的应用,旨在帮助开发者针对不同场景选择最合适的训练方式,实现高效的大模型训练。
62 8
|
30天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术在自然语言处理中的应用
随着人工智能技术的不断发展,自然语言处理(NLP)已经成为了一个重要的应用领域。本文将介绍一些常见的NLP任务和算法,并通过代码示例来展示如何实现这些任务。我们将讨论文本分类、情感分析、命名实体识别等常见任务,并使用Python和相关库来实现这些任务。最后,我们将探讨NLP在未来的发展趋势和挑战。