人工智能(AI)之计算机视觉和自然语言训练文件

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介: 人工智能(AI)之计算机视觉和自然语言训练文件

学习了一段时间人工智能,不能算会什么东西,但整理了和获取了一些火车(Train)文件,计算机视觉的和NLP的语料库。这2个方向再很多时候是相辅相成、相互依存、相互使用的。所以都得会。我将我这6个月获得的Train文件分享给大家,持续更新,有最新的我就放上去。免去大家苦苦度娘的辛苦。

计算机视觉

ImageAI训练我自己的设备图纸:https://pan.baidu.com/s/1H2TjLGUpfX78Yv32mdw5HQ

猫、狗、马自己整理的:https://pan.baidu.com/s/1Pk5od3KRqXs5USMBhAQisw

GAN网络动漫图片:https://pan.baidu.com/s/1EdlIKlw3_54hyknscLfmCA

GAN网络美女头像:https://pan.baidu.com/s/1H__x0BcM25kqGdF4r8mgrA

目标识别VOC2007(Train和Test已经合并):https://pan.baidu.com/s/1mSCdVA9VDu6Ic-TQqmDCKQ

目标识别VOC2012(Train和Test已经合并):https://pan.baidu.com/s/1SOMMFsMo-whk29OBU33tXQ

MNST手写体:https://pan.baidu.com/s/1WNqvRfvqUegnywUa9vI-UA

自然语言

语料库合集->包括人民日报2014、人民日报1998、唐诗300、现代文学一篇:

https://pan.baidu.com/s/1DmujCq4Yui7u0HiTxmXP1Q

人民日报2014(分词使用):https://pan.baidu.com/s/1nYwt3YBAd3yKryCjcOGjQg

人民日报1998(分词使用):https://pan.baidu.com/s/1y8XCufDNqgae79cfKToYlg

唐诗300,自动作诗:https://pan.baidu.com/s/1dd2d-nI0BIrpr_hVjvul-w

现代文学分词使用:https://pan.baidu.com/s/1EXU4w7Yfj1SWE7YnZvGwYQ

ICWB2分词使用:https://pan.baidu.com/s/1gpHMUxLayW5pRRpvORatFA

未完待续。。。

目录
相关文章
|
25天前
|
机器学习/深度学习 人工智能 算法
AI 基础知识从 0.6 到 0.7—— 彻底拆解深度神经网络训练的五大核心步骤
本文以一个经典的PyTorch手写数字识别代码示例为引子,深入剖析了简洁代码背后隐藏的深度神经网络(DNN)训练全过程。
405 56
|
3月前
|
机器学习/深度学习 数据采集 人工智能
基于生成式物理引擎的AI模型训练方法论
本文探讨了基于生成式物理引擎的AI模型训练方法论,旨在解决传统数据采集高成本、低效率的问题。生成式物理引擎结合物理建模与生成模型(如GAN、Diffusion),可模拟现实世界的力学规律,生成高质量、多样化的虚拟数据。文章介绍了其关键技术,包括神经网络物理建模、扩散模型场景生成及强化学习应用,并分析了其在机器人学习、数据增强和通用智能体训练中的实践价值。未来,随着可微物理引擎、跨模态生成等技术发展,生成式物理引擎将助力AI从静态监督学习迈向动态交互式世界建模,推动通用人工智能的实现。
227 57
基于生成式物理引擎的AI模型训练方法论
|
2月前
|
机器学习/深度学习 人工智能 数据可视化
基于YOLOv8的AI虫子种类识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目基于YOLOv8与PyQt5开发,实现虫子种类识别,支持图片、视频、摄像头等多种输入方式,具备完整训练与部署流程,开箱即用,附带数据集与源码,适合快速搭建高精度昆虫识别系统。
基于YOLOv8的AI虫子种类识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
|
4月前
|
数据采集 存储 人工智能
智创 AI 新视界 -- 优化 AI 模型训练效率的策略与技巧(16 - 1)
本文深度聚焦 AI 模型训练效率优化,全面涵盖数据预处理(清洗、归一化、增强)、模型架构(轻量级应用、剪枝与量化)、训练算法与超参数调优(自适应学习率、优化算法)等核心维度。结合自动驾驶、动物图像识别、语音识别等多领域实际案例,佐以丰富且详细的代码示例,深度剖析技术原理与应用技巧,为 AI 从业者呈上极具专业性、可操作性与参考价值的技术宝典,助力高效优化模型训练效率与性能提升。
智创 AI 新视界 -- 优化 AI 模型训练效率的策略与技巧(16 - 1)
|
2月前
|
机器学习/深度学习 人工智能 API
AI-Compass LLM训练框架生态:整合ms-swift、Unsloth、Megatron-LM等核心框架,涵盖全参数/PEFT训练与分布式优化
AI-Compass LLM训练框架生态:整合ms-swift、Unsloth、Megatron-LM等核心框架,涵盖全参数/PEFT训练与分布式优化
|
2月前
|
机器学习/深度学习 人工智能 程序员
MiniMind:3小时训练26MB微型语言模型,开源项目助力AI初学者快速入门
在大型语言模型(LLaMA、GPT等)日益流行的今天,一个名为MiniMind的开源项目正在AI学习圈内引起广泛关注。项目让初学者能够在3小时内从零开始训练出一个仅26.88MB大小的微型语言模型。
154 1
|
2月前
|
机器学习/深度学习 人工智能 资源调度
AI大模型训练管理工具:千亿参数时代的指挥中枢
本内容揭示了大模型训练中三大核心挑战:实验复现难、资源利用率低、合规风险高,并提出“三维控制塔”解决方案,涵盖实验管理、资源调度与合规追踪。推荐Immuta + 板栗看板等工具组合助力不同规模团队实现高效、合规、低成本的AI训练。
|
6月前
|
人工智能 自然语言处理 监控
17.1K star!两小时就能训练出专属与自己的个性化小模型,这个开源项目让AI触手可及!
🔥「只需一张消费级显卡,2小时完成26M参数GPT训练!」 🌟「从零构建中文大模型的最佳实践指南」 🚀「兼容OpenAI API,轻松接入各类AI应用平台」
237 1
|
6月前
|
存储 人工智能 Cloud Native
小鹏汽车选用阿里云PolarDB,开启AI大模型训练新时代
PolarDB-PG云原生分布式数据库不仅提供了无限的扩展能力,还借助丰富的PostgreSQL生态系统,统一了后台技术栈,极大地简化了运维工作。这种强大的组合不仅提高了系统的稳定性和性能,还为小鹏汽车大模型训练的数据管理带来了前所未有的灵活性和效率。