备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

超长文本AI批量个性化总结内容作为大模型微调数据应该怎么做？

超长文本AI批量个性化总结内容作为大模型微调数据应该怎么做？
我现在已经把超长文本给他分割成了，是每一份3000字。
然后我尝试。用本地的gpt进行总结，结果不太行，速度不太理想，所以想问一下有没有在线的网站可以帮助我解决这个问题。

展开

收起

游客dsgb7rcwcjvqs 2024-02-28 18:31:38 338 版权

1 条回答

写回答

取消提交回答

Skyund

收集大量具有代表性的超长文本数据，这些数据应覆盖多个主题和领域。
对原始文本进行清洗和预处理，包括去除无关字符、停用词过滤、分词等。
使用现有的自动文本摘要技术（如基于抽取式或生成式的AI模型）对每篇超长文本进行个性化总结。这一步的目标是将每篇长文本转化为精炼且保留核心信息的短文本摘要。

2024-02-28 19:02:59

赞同 1 展开评论

相关问答

与 AI “对话”，多模态音视频交互能给生活提供多大便利？

1982

63

0

按照“15分钟掌握大模型自我认知微调，定制个人专属大模型”说明碰到的问题

527

0

0

大模型Lora微调的疑问

150

0

0

你定义的 AI 编码规则是什么？全网寻找通义灵码 Rules {头号玩家}！

4642

43

0

qwen模型微调上传数据集时，如何书写数据集的本地路径？

175

0

0

qwen-long微调如何上传自己的数据集？

619

1

0

关于qwen2-vl微调最佳实践

742

1

0

当AI频繁生成虚假信息，我们还能轻信大模型吗？

2614

78

0

在阿里云PAI-DSW完成微调的大模型，通过EAS部署为AI-web应用，如何开放为公网web应用

306

1

0

小白求助，跟着大模型微调教程做不太明白

1039

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

一个可用于企业开发及通用跨平台的Makefile文件

阿里云优惠券免费领取汇总：2088元代金券、学生300元无门槛、企业算力补贴领取说明

《Unity小程序开发的实战技术教程》

《Unity原生融合：体验生态构建与玩法裂变的实战指南》

别用"战术勤奋"掩盖"战略懒惰"：AI时代的降维竞品分析

热门讨论

热门文章

modelscope-funasr 热词如何设置？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

docker启动funasr-runtime-sdk-cpu-0.4.5

modelscope-funasr的sensevoice-Large有开源计划吗？

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

modelscope-funasr, WHISPER, WENET，有没有能别识江浙方言的模型？

modelscope-funasr有没有开源的语音唤醒，自定义唤醒？

modelscope-funasr目前版本支持实时多人对话语音识别吗？

modelscope-funasr的github上介绍支持多个说话人识别，请问有代码样例吗？

展开全部

中文大模型体验

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

最佳实践丨让苏东坡“复活”！我用Qwen3-8B实现了与千古文豪的跨时空对话

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

全来店×蚂蚁百宝箱：智能体开启连锁餐饮智慧化服务新时代

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型，创建个性化 AI 助手

展开全部

还有其他疑问?