开发者社区> 问答> 正文

NLP自学习平台NLP只解析处理文本内容 主要是解析什么?

NLP自学习平台NLP只解析处理文本内容 主要是解析什么?

展开
收起
青城山下庄文杰 2023-09-10 17:03:07 32 0
2 条回答
写回答
取消 提交回答
  • NLP主要解析返回的是原输入文本的内容,你这个需求是生成式的能力了此回答整理自钉群“阿里云NLP基础服务2.0 - 用户答疑群”

    2023-09-11 17:18:22
    赞同 展开评论 打赏
  • 对于文本数据而言,通常文本数据里面会含有很多跟任务无关的噪音,这时应该进行文本的预处理。

    在NLP自学习平台内置了一些预处理规则,如果您觉得有必要进行预处理,可以选择这些规则。我们内置的规则包括:

    去除 URL 链接;

    去除 emoji 表情符号;

    英文大写转小写;

    中文繁体转简体。

    可能平台目前没有您需要的预处理规则,暂时需要您自己在数据上次前进行处理,可以给我们反馈,我们会及时新增更多的预处理规则。

    预处理的原则是去除掉对于判断类别无用的信息,也就是说,如果这个信息是有用的,则不应该去掉。比如 emoji 表情对于情感的判断是有帮助的,所以在情感分类中,不应该去除掉 emoji 表情。

    2023-09-10 17:52:51
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
神龙云服务器产品及技术深度解析 立即下载
弹性创造价值:基于ECS的最佳性价比实践解析 立即下载
又快又稳:阿里云下一代虚拟交换机解析 立即下载

相关镜像