人工智能平台PAI产品使用合集之创建特征视图时遇到报错,该如何排查

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

问题一:机器学习PAI服务运行中了,但不可用,调用时报错,如何解决?

机器学习PAI服务运行中了,但不可用,调用时报错?

[2024-03-06 11:38:11] ERROR: Exception in ASGI application

[2024-03-06 11:38:11] Traceback (most recent call last):

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/uvicorn/protocols/http/httptools_impl.py", line 419, in run_asgi

[2024-03-06 11:38:11] result = await app( # type: ignore[func-returns-value]

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/uvicorn/middleware/proxy_headers.py", line 84, in call

[2024-03-06 11:38:11] return await self.app(scope, receive, send)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/fastapi/applications.py", line 1054, in call

[2024-03-06 11:38:11] await super().call(scope, receive, send)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/applications.py", line 123, in call

[2024-03-06 11:38:11] await self.middleware_stack(scope, receive, send)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/middleware/errors.py", line 186, in call

[2024-03-06 11:38:11] raise exc

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/middleware/errors.py", line 164, in call

[2024-03-06 11:38:11] await self.app(scope, receive, _send)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/middleware/cors.py", line 83, in call

[2024-03-06 11:38:11] await self.app(scope, receive, send)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/middleware/cors.py", line 83, in call

[2024-03-06 11:38:11] await self.app(scope, receive, send)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/middleware/exceptions.py", line 62, in call

[2024-03-06 11:38:11] await wrap_app_handling_exceptions(self.app, conn)(scope, receive, send)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/_exception_handler.py", line 64, in wrapped_app

[2024-03-06 11:38:11] raise exc

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/_exception_handler.py", line 53, in wrapped_app

[2024-03-06 11:38:11] await app(scope, receive, sender)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/routing.py", line 758, in call

[2024-03-06 11:38:11] await self.middleware_stack(scope, receive, send)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/routing.py", line 778, in app

[2024-03-06 11:38:11] await route.handle(scope, receive, send)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/routing.py", line 299, in handle

[2024-03-06 11:38:11] await self.app(scope, receive, send)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/routing.py", line 79, in app

[2024-03-06 11:38:11] await wrap_app_handling_exceptions(app, request)(scope, receive, send)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/_exception_handler.py", line 64, in wrapped_app

[2024-03-06 11:38:11] raise exc

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/_exception_handler.py", line 53, in wrapped_app

[2024-03-06 11:38:11] await app(scope, receive, sender)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/starlette/routing.py", line 74, in app

[2024-03-06 11:38:11] response = await func(request)

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/fastapi/routing.py", line 299, in app

[2024-03-06 11:38:11] raise e

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/fastapi/routing.py", line 294, in app

[2024-03-06 11:38:11] raw_response = await run_endpoint_function(

[2024-03-06 11:38:11] File "/usr/local/lib/python3.10/dist-packages/fastapi/routing.py", line 191, in run_endpoint_function

[2024-03-06 11:38:11] return await dependant.call(**values)

[2024-03-06 11:38:11] File "/code/ChatLLM-webui/webui/entrypoints/api_server.py", line 242, in chat_api

[2024-03-06 11:38:11] if cmd_opts.enable_lora:

[2024-03-06 11:38:11] AttributeError: 'Namespace' object has no attribute 'enable_lora'

我加了这个 现在起来了



参考答案:

看着像是vllm在分配显存池的时候没有拿到足够的空间,试试设置下--gpu-memory-utilization,比如0.98 还有 --max-model-len,比如4096



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/602707



问题二:通义千问 HTTP请求多轮对话的方式是什么格式的,文档里的没法实现,需要帮助,谢谢

{"model":"qwen-max","input":{"messages":[{"role": "system","content":"You are a helpful assistant."},{"role":"user","content":"入参"}]},"parameters":{}}

这样能正确返回。

{"model":"qwen-max","input":{"messages":[{"role": "system","content":"You are a helpful assistant."},{"role":"user","content":"入参"},{"role": "system","content":"首次返回的文本"},{"role":"user","content":"继续"}]},"parameters":{}}

这样写提示错误信息,message的大概意思是body格式错误。

{"model":"qwen-max","input":{"messages":[{"role":"user","content":"继续"}]},"parameters":{}}

这样写,会回复 有什么问题需要帮忙什么的...。



参考答案:

通义千问的 HTTP 请求多轮对话是通过 JSON 格式的数据传输来实现的。根据你提供的例子,可以按照以下方式构建 JSON 数据:

{

"model": "qwen-max",

"input": {

"messages": [

{

"role": "system",

"content": "You are a helpful assistant."

},

{

"role": "user",

"content": "入参"

}

]

},

"parameters": {}

}

需要注意的是,在上述示例中,“model”字段指定了所使用的模型名称,“input”字段包含了多轮对话的消息列表,每个消息都有一个“role”字段表示角色(系统或用户),以及一个“content”字段表示消息内容。最后,“parameters”字段可以包含其他参数,根据你的需求进行设置。

请确保将以上 JSON 数据作为 HTTP 请求的主体发送给通义千问的 API 接口,并设置适当的请求头和 URL。具体的请求方式和 URL 取决于你所使用的编程语言和库,可以参考相关文档或示例代码来执行 HTTP 请求。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/602363



问题三:机器学习PAI创建特征视图时报错,怎么处理?

机器学习PAI创建特征视图时报错,怎么处理?



参考答案:

要正常使用的话,必须要有离线数据源和在线数据源,因为上线的时候取特征需要在线数据源,我们也需要保证离在线一致性。现在只使用离线部分的话可以考虑使用TableStore在线数据源,这个是按量计费的。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/602296



问题四:在机器学习PAI按照官方给的最佳实践手册,走到上述步骤「数据同步Hologres」报错,怎么解决?

在机器学习PAI按照官方给的最佳实践手册,走到上述步骤「数据同步Hologres」报错,怎么解决?



参考答案:

楼主你好,看了你的问题,遇到了“数据同步Hologres”报错,你可以检查配置是否正确,确保你按照手册中的指引正确配置了Hologres的连接信息,包括数据库地址、用户名、密码等,一定要确保这些信息正确无误。

还有就是确保你的账号有足够的权限来执行数据同步的操作,检查你的账号是否有在Hologres数据库中读取、写入的权限。以及检查Hologres数据库状态,确认Hologres数据库的状态是否正常运行,可以尝试重新启动或者重建数据库。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/602295



问题五:机器学习PAI webui文件导入导出本地执行没问题,页面运行报错为什么?

机器学习PAI webui文件导入导出本地执行没问题,remote模式下, flink1.13.0集群,执行页面运行报错为什么?




参考答案:

楼主你好,看了你的问题,可能是由于集群版本不匹配引起的,也就是由于使用的Flink集群版本与页面运行环境不兼容导致的,所以请确保页面运行环境和集群版本匹配。

报错信息中提到了Failed to deserialize JobGraph,可能是由于序列化问题导致的,请检查代码中的序列化操作,确保对象能够正确地被序列化和反序列化。

报错信息中incompatible types for field cpuCores,可能是由于字段类型不匹配导致的。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/600926

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
2月前
|
机器学习/深度学习 人工智能 物联网
通义灵码在人工智能与机器学习领域的应用
通义灵码不仅在物联网领域表现出色,还在人工智能、机器学习、金融、医疗和教育等领域展现出广泛应用前景。本文探讨了其在这些领域的具体应用,如模型训练、风险评估、医疗影像诊断等,并总结了其提高开发效率、降低门槛、促进合作和推动创新的优势。
通义灵码在人工智能与机器学习领域的应用
|
3月前
|
机器学习/深度学习 人工智能 监控
揭秘人工智能:机器学习的魔法
【10月更文挑战第6天】本文将带你走进人工智能的世界,了解机器学习如何改变我们的生活。我们将深入探讨机器学习的原理,以及它在各个领域的应用。同时,我们也会分享一些实用的代码示例,帮助你更好地理解和应用机器学习。无论你是初学者还是专业人士,这篇文章都将为你提供有价值的信息和启示。让我们一起探索这个神奇的领域吧!
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与机器学习:探索未来的技术边界
【10月更文挑战第18天】 在这篇文章中,我们将深入探讨人工智能(AI)和机器学习(ML)的基础知识、应用领域以及未来趋势。通过对比分析,我们将揭示这些技术如何改变我们的生活和工作方式,并预测它们在未来可能带来的影响。文章旨在为读者提供一个全面而深入的理解,帮助他们更好地把握这一领域的发展趋势。
|
3月前
|
机器学习/深度学习 测试技术
阿里云入选Gartner数据科学和机器学习平台挑战者象限
Gartner® 正式发布了《数据科学与机器学习平台魔力象限》报告(Magic Quadrant™ for Data Science and Machine Learning Platforms),阿里云成为唯一一家入选该报告的中国厂商,被评为“挑战者”(Challengers)。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
探索人工智能的未来:机器学习与深度学习的融合之旅
【9月更文挑战第35天】在这篇文章中,我们将深入探讨人工智能的两大支柱——机器学习和深度学习。我们将通过代码示例和实际应用案例,揭示它们如何相互补充,共同推动AI技术的发展。无论你是初学者还是有经验的开发者,这篇文章都将为你提供宝贵的见解和启示。
77 0
|
20天前
|
机器学习/深度学习 传感器 人工智能
人工智能与机器学习:改变未来的力量####
【10月更文挑战第21天】 在本文中,我们将深入探讨人工智能(AI)和机器学习(ML)的基本概念、发展历程及其在未来可能带来的革命性变化。通过分析当前最前沿的技术和应用案例,揭示AI和ML如何正在重塑各行各业,并展望它们在未来十年的潜在影响。 ####
84 27
|
2月前
|
机器学习/深度学习 人工智能 监控
AutoTrain:Hugging Face 开源的无代码模型训练平台
AutoTrain 是 Hugging Face 推出的开源无代码模型训练平台,旨在简化最先进模型的训练过程。用户无需编写代码,只需上传数据即可创建、微调和部署自己的 AI 模型。AutoTrain 支持多种机器学习任务,并提供自动化最佳实践,包括超参数调整、模型验证和分布式训练。
152 4
AutoTrain:Hugging Face 开源的无代码模型训练平台
|
1月前
|
机器学习/深度学习 人工智能 算法
人工智能浪潮下的编程实践:构建你的第一个机器学习模型
在人工智能的巨浪中,每个人都有机会成为弄潮儿。本文将带你一探究竟,从零基础开始,用最易懂的语言和步骤,教你如何构建属于自己的第一个机器学习模型。不需要复杂的数学公式,也不必担心编程难题,只需跟随我们的步伐,一起探索这个充满魔力的AI世界。
49 12
|
2天前
|
存储 人工智能 大数据
AI开发新范式,PAI模型构建平台升级发布
本次分享由阿里云智能集团产品专家高慧玲主讲,聚焦AI开发新范式及PAI模型构建平台的升级。分享分为四个部分,围绕“人人可用”和“面向生产”两大核心理念展开。通过降低AI工程化门槛、提供一站式全链路服务,PAI平台致力于帮助企业和开发者更高效地实现AI应用。案例展示中,介绍了多模态模型微调在文旅场景的应用,展示了如何快速复现并利用AI解决实际问题。最终目标是让AI技术更普及,赋能各行业,推动社会进步。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与机器学习在医疗诊断中的应用
【9月更文挑战第32天】随着科技的不断发展,人工智能和机器学习已经在许多领域得到了广泛应用。在医疗领域,它们正在改变着医生和患者的生活。通过分析大量的医疗数据,AI可以帮助医生更准确地诊断疾病,预测患者的病情发展,并提供个性化的治疗方案。本文将探讨人工智能和机器学习在医疗诊断中的具体应用,包括图像识别、自然语言处理和预测分析等方面。我们还将讨论AI技术面临的挑战和未来的发展趋势。

相关产品

  • 人工智能平台 PAI