模型的价值观需重视,文本理解与文本生成能力有待提高

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介: 随着算力的不断提高,NLP成为新时代人工智能的突破点——“大模型”。大模型之大不仅在于模型的大小之大,而且所用的训练数据集之大。如今,大模型在各行各业中逐渐落地,实现多场景应用。人们比较注重于LLM模型的语言文本理解、文本生成能力。在使用了阿里云多个模型的评测当中,有一些思考与建议。

一、文本理解能力和文本生成能力有待提高

文本理解能力最重要的是能精准理解并总结用户提出的问题并根据上下文文本来回答用户的问题。

  • 首先,最重要的是如何精准理解提出的问题或要求。一个模型如果不能精准理解提出的问题,那么其回答很大概率会是答非所问。再有对问题的单个词语理解不当,可能会误导用户。比如“核污水与核废水的区别”,模型把核废水理解为核电站产生的核垃圾如固体垃圾。但是实际上核废水是用来冷却反应堆的非接触的水,并不是模型所理解那样。所以文本理解能力的高低往往影响了回答的质量与可靠性,并且影响用户的体验。
    1.png
  • 代码理解理解能力不错,但是文本分析较低,有时候会给出错误信息。比如给出同样的希尔排序算法代码,一些模型分析它的时间复杂度为O(nn),实际上希尔排序的时间复杂度为O(nlogn)。有时候,模型的代码还会理解错误,比如会把希尔排序的代码分析为冒泡排序。这是值得注意的地方。如下图所示,均提供希尔排序代码,让模型进行分析。
    4.png
    5.png
  • 即使能精准理解用户提出的问题,文本生成能力也有待提高。比如在写作创作中,让模型撰写不少于1000字的作文。但是,实际上回答的文本字数并不满足,多次要求同样也是不满足字数要求,并且其语言逻辑、价值观有时候不正常。
    3.png

    二、模型的人类价值观值得重视

    语言模型是人类知识语言库的表达者,并非知识语言的生产者。喂给模型的数据集蕴含了一定的价值观,这个价值观可能过度偏激,违背人类伦理标准与道德评判,需要模型开发者人工筛选出有害数据,避免模型成为制造社会混乱,破坏社会稳定的毒瘤。比如,在评测过程中,有些模型存在不正常的价值观。比如在对话中,模型认为把核污水排海是不负责任的危险行为,但当问其如何评价日本核污水排海的行为时,模型给出的答案却是支持,认为日本这一行为可取,认为日本热衷保护海洋生态环境。在确切的事实面前,模型仍然给出违背人类价值观的答案,值得我们反思。
    222.png
    在最后,希望中国中文模型能在正确健康的价值观引领下,为各行各业带来新的发展动力与机遇,为推动中国式现代化发展提供科技创新动力!
相关文章
|
机器学习/深度学习 人工智能 自然语言处理
挖掘文本的奇妙力量:传统与深度方法探索匹配之道
挖掘文本的奇妙力量:传统与深度方法探索匹配之道
|
25天前
|
人工智能
要求CHATGPT高质量回答的艺术:提示工程技术的完整指南—第 27 章:如何避开和绕过所有人工智能内容检测器
要求CHATGPT高质量回答的艺术:提示工程技术的完整指南—第 27 章:如何避开和绕过所有人工智能内容检测器
32 3
|
25天前
|
人工智能 数据处理
要求CHATGPT高质量回答的艺术:提示工程技术的完整指南—第 28 章:圣杯 = 专家 + ChatGPT 的协同作用
要求CHATGPT高质量回答的艺术:提示工程技术的完整指南—第 28 章:圣杯 = 专家 + ChatGPT 的协同作用
28 2
|
20天前
|
机器学习/深度学习 数据采集 人工智能
【紧跟AI浪潮】深度剖析:如何在大模型时代精准捕获用户心声——提高召回率的实战秘籍
【10月更文挑战第5天】在深度学习领域,大型模型常面临召回率不足的问题,尤其在信息检索和推荐系统中尤为关键。本文通过具体代码示例,介绍如何提升大模型召回率。首先,利用Pandas进行数据预处理,如清洗和特征工程;其次,选择合适的模型架构,如使用PyTorch构建推荐系统;再者,优化训练策略,采用合适的损失函数及正则化技术;此外,选择恰当的评估指标,如召回率和F1分数;最后,通过后处理优化结果展示。以上方法不仅提升召回率,还增强了模型整体性能。
57 0
|
3月前
|
机器学习/深度学习 人工智能 搜索推荐
【颠覆传统】解锁记忆新姿势:多模态AI单词助记神器——让单词学习变得生动有趣,打造个性化学习新体验!
【8月更文挑战第21天】多模态AI单词助记模型融合文本、语音与图像,增强英语单词记忆效果。设计上利用多感官刺激提升信息处理与记忆效率。技术栈包括React.js前端、Node.js后端、PyTorch深度学习框架等。实现过程涵盖数据准备、前端开发、后端服务搭建、深度学习模型构建及用户反馈循环。应用显示该模型显著提高学习兴趣与记忆效率,尤其对视觉和听觉学习者有益,个性化推荐系统进一步优化学习体验。
81 0
|
4月前
|
人工智能
AI Undetect:精心打造的人工智能,编写出无限接近人类质量的文本
【AI Undetect & AI Humanize】工具组合助力保持文本原创性与真实性,避过AI检测。AI Undetect专为绕过检测系统设计,而AI Humanize提供检测与改写功能。检测文本是否由AI生成,或用其快速高质量改写。改写后内容同样可检验证明效果。尝试链接:[AI Humanizer](https://aiundetect.com/)。
AI Undetect:精心打造的人工智能,编写出无限接近人类质量的文本
|
4月前
|
机器学习/深度学习 自然语言处理
大模型概念问题之大模型在生成文本方面有哪些革命性突破
大模型概念问题之大模型在生成文本方面有哪些革命性突破
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC是什么?对艺术设计学、视觉传达设计、数字媒体艺术等专业的影响
AIGC,人工智能生成内容,融合AI与内容创作,使用GAN、CLIP等技术自动生成图像、文本等,影响艺术设计、视觉传达、数字媒体领域。它提升创作效率,增加多样性,促进创新,改变教育方式,并与Adobe国际认证结合,为设计师提供竞争优势,引领行业变革。
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
【大模型】如何向非技术受众解释LLM的概念及其能力?
【5月更文挑战第7天】【大模型】如何向非技术受众解释LLM的概念及其能力?
|
6月前
|
机器学习/深度学习 人工智能 搜索推荐
内容挖掘——AIGC实现从“伪智慧”到“真智能”的跃迁
【1月更文挑战第7天】内容挖掘——AIGC实现从“伪智慧”到“真智能”的跃迁
79 1
内容挖掘——AIGC实现从“伪智慧”到“真智能”的跃迁

热门文章

最新文章