魔搭社区与函数计算:高效部署开源大模型的文本生成服务体验

本文涉及的产品
函数计算FC,每月15万CU 3个月
.cn 域名,1个 12个月
简介: 在数字化时代,人工智能技术迅速发展,开源大模型成为重要成果。魔搭社区(ModelScope)作为开源大模型的聚集地,结合阿里云函数计算,提供了一种高效、便捷的部署方式。通过按需付费和弹性伸缩,开发者可以快速部署和使用大模型,享受云计算的便利。本文介绍了魔搭社区与函数计算的结合使用体验,包括环境准备、部署应用、体验使用和资源清理等步骤,并提出了改进建议。

在当今数字化时代,人工智能(AI)技术正以前所未有的速度改变着我们的生活方式和工作模式。其中,开源大模型作为AI领域的重要成果,为各行各业提供了强大的技术支持。魔搭社区(ModelScope)作为开源大模型的聚集地,为广大开发者提供了一个便捷的平台。通过结合函数计算,我们不仅能够快速部署这些大模型,还能利用函数计算的诸多优势,如按使量付费和弹性伸缩,高效地为用户提供文本生成服务。以下是我对魔搭社区与函数计算结合使用的测评体验。

一、初识魔搭社区与函数计算

魔搭社区(ModelScope)是一个开放的AI模型共享平台,汇聚了众多优质的开源大模型。这些模型涵盖了自然语言处理、计算机视觉、语音识别等多个领域,为开发者提供了丰富的选择。无论是想要进行文本生成、图像识别还是语音识别,都能在这里找到合适的模型。
image.png

函数计算则是一种无服务器计算服务,它允许开发者在不管理服务器的情况下运行代码。函数计算会根据实际请求量自动伸缩计算资源,并按实际使用量收费,极大地降低了运维成本和时间成本。可以将更多的精力投入到算法优化和业务逻辑上,而无需担心底层资源的配置和管理。
image.png

二、基于函数计算快速部署开源大模型

1、 方案概览

只需10分钟就可以将开源大模型轻松部署到阿里云函数计算上,畅享大模型的强大功能。无需拥有或维护昂贵的GPU资源,按需付费的模式更能帮助您节省成本,尽情体验云计算带来的便利与灵活性。
image.png

2、 环境准备

1)注册阿里云账号 2)开通函数计算 3)开通文件存储NAS服务 4) 注册ModelScope账号,并绑定阿里云账号。

在魔搭访问(https://www.modelscope.cn/my/myaccesstoken) 按照下图绑定阿里云账号。
image.png
image.png
image.png

3、 部署应用

1)在魔搭访问(https://www.modelscope.cn/my/myaccesstoken) 获取令牌。
image.png

2)访问函数计算应用模板

  • 参考图片模型来源选择ModelScope;
  • 模型ID填入ZhipuAI/chatglm3-6b;
  • 模型版本填入v1.0.2;
  • 地域目前仅支持华东1(杭州)或华东2(上海),选择华东2(上海);
  • 模型任务类型填入chat;
  • Access Token 填入ModelScope 的访问令牌。
  • 其余配置项保持默认值即可,单击创建应用。
    image.png

创建中, 创建时间2024年11月2日 20:30:31,完成时间2024年11月2日 20:38:37 耗时为8分钟。
image.png

3)创建成功后,为应用开启闲置预留模式。配置预留实例,可以有效避免因实例冷启动导致的请求延迟问题。同时,可以配置预留实例的弹性伸缩规则如定时伸缩和水位伸缩,提高实例使用率,解决资源浪费问题。

  • 应用部署完成后,在资源信息区域单击后缀为model-app-func的函数名称跳转至函数详情页。
    image.png
    image.png

  • 在函数详情页,选择配置页签,在左侧导航栏,选择预留实例,然后单击创建预留实例数策略。
    image.png

  • 在创建预留实例数策略页面,版本和别名选择为LATEST,预留实例数设置为1,启用闲置模式,然后单击确定。
    image.png

  • 等待容器实例成功启动后,可以看到当前预留实例数为1,且显示已开启闲置模式字样,表示闲置预留实例已成功启动
    image.png

整个部署过程非常顺畅耗时8分钟,只需要关注模型的选择、版本和任务类型,无需担心底层资源的配置和管理。函数计算平台会根据实际请求量自动伸缩计算资源,确保服务的稳定性和高效性。

三、体验使用LLM应用

部署完成后,可以使用函数计算应用提供的域名访问服务,与模型进行对话。

1、在环境详情页面,点击访问域名右侧的域名,使用LLM应用。
image.png
image.png

2、输入文本信息,然后单击Submit,您可以看到模型的回答结果。
image.png
image.png

image.png

初次的处理结果每次交互大概1分钟左右。

四、资源清理

1、删除ModelScope使用的函数

登录函数计算控制台,在左侧导航栏,单击应用。在应用页面,找到目标应用,单击右侧操作列的删除应用。
image.png

image.png

删除应用提示失败
image.png

需要手动删除函数和域名

image.png

image.png

image.png
image.png

2、登录NAS文件存储控制台,在左侧导航栏选择文件系统 > 文件系统列表。在文件系统列表,找到目标文件系统,在其右侧操作列,然后单击删除。
image.png
image.png
image.png

五、总结

通过本次对魔搭社区与函数计算结合使用的体验,深刻感受到了开源大模型和无服务器计算技术的强大魅力。这些技术不仅为开发者提供了丰富的选择和便捷的工具,还极大地提高了服务的稳定性和高效性。

关于本次实践体验的反馈和建议如下:

1、本次实践中配置了预留实例,但没有很好体现出预留实例的功能及作用,可以增加下配置预留实例和不配置预留实例的使用对比。

2、在部署过程中函数应用创建时在日志里有报错,但可以部署成功,暂时也没有影响使用,可以看下是否需要优化。


Duration: 342752.33 ms, Billed Duration: 342753 ms, Memory Size: 16384 MB, Max Memory Used: 11980.74 MB
========= FC invoke Logs end =========

Invoke instanceId: c-67261bcd-1663628b-aa8652a176d2
Code Checksum: 13447116201843826969
Qualifier: LATEST
RequestId: 1-67261bcd-169f5165-95f2f369919d
Error Type: InvocationError

Invoke Result:
{
    "errorMessage": "File pytorch_model.bin.index.json download incomplete, content_length: None but the                     file downloaded length: 20437, please download again",
    "errorType": "FileDownloadError",
    "stackTrace": [
        [
            "File \"/code/index.py\"",
            "line 13",
            "in handler",
            "snapshot_download (model_id =model_id,"
        ],
        [
            "File \"/code/modelscope/hub/snapshot_download.py\"",
            "line 153",
            "in snapshot_download",
            "http_get_file("
        ],
        [
            "File \"/code/modelscope/hub/file_download.py\"",
            "line 319",
            "in http_get_file",
            "raise FileDownloadError(msg)"
        ]
    ]
}

image.png

3、在清理函数资源的时候,发生了报错。需要手动删除函数和域名。针对这部分可以补充在清理资源部分——删除失败如何处理。

image.png

image.png

image.png

4、整个体验的场景中没有展现出函数计算的弹性伸缩优势,可以增加这部分的场景验证。比如模拟对话量请求量增加时,平台会自动增加计算资源以满足需求;当请求量减少时,平台会自动释放多余的计算资源以降低成本。

5、在实际生产中会使用多个大模型,如果需要在不同的模型之间切换,是否可以在当前的部署函数应用实现,还是每一个模型都需要部署一个函数应用。

6、若自己来选择大模型的配置,函数计算页面提示中模型ID、模型版本、模型任务类型获取方式不够详细,希望可以增加这个参数的获取魔搭具体页面截图。

image.png

image.png

7、什么情况下需要自己修改显存大小和内存大小?
image.png

8、访问模型的时候,在处理对话的期间,右上角的数字一直在增长,这是处理的时间吗?还是什么值,作用是什么?

image.png

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
7天前
|
人工智能 弹性计算 Serverless
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
本文介绍了零售业中“人—货—场”三要素的变化,指出传统营销方式已难以吸引消费者。现代消费者更注重个性化体验,因此需要提供超出预期的内容。文章还介绍了阿里云基于函数计算的AI大模型,特别是Stable Diffusion WebUI,帮助非专业人士轻松制作高质量的促销海报。通过详细的部署步骤和实践经验,展示了该方案在实际生产环境中的应用价值。
38 6
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
|
19天前
|
人工智能 自然语言处理 监控
函数计算玩转 AI 大模型
本文总结了对一个基于函数计算和AI大模型的解决方案的理解和实践体验。整体而言,方案描述详细、逻辑清晰,易于理解。但在技术细节和部署引导方面还有提升空间,如增加示例代码和常见错误解决方案。函数计算的优势在部署过程中得到了有效体现,特别是在弹性扩展和按需计费方面。然而,针对高并发场景的优化建议仍需进一步补充。总体评价认为,该解决方案框架良好,但需在文档和细节方面继续优化。
|
21天前
|
人工智能 弹性计算 监控
触手可及,函数计算玩转 AI 大模型解决方案
阿里云推出的“触手可及,函数计算玩转 AI 大模型”解决方案,利用无服务器架构,实现AI大模型的高效部署和弹性伸缩。本文从实践原理、部署体验、优势展现及应用场景等方面全面评估该方案,指出其在快速部署、成本优化和运维简化方面的显著优势,同时也提出在性能监控、资源管理和安全性等方面的改进建议。
50 5
|
22天前
|
机器学习/深度学习 监控 物联网
函数即服务(FaaS)
函数即服务(FaaS)
|
22天前
|
缓存 前端开发 JavaScript
前端serverless探索之组件单独部署时,利用rxjs实现业务状态与vue-react-angular等框架的响应式状态映射
本文深入探讨了如何将RxJS与Vue、React、Angular三大前端框架进行集成,通过抽象出辅助方法`useRx`和`pushPipe`,实现跨框架的状态管理。具体介绍了各框架的响应式机制,展示了如何将RxJS的Observable对象转化为框架的响应式数据,并通过示例代码演示了使用方法。此外,还讨论了全局状态源与WebComponent的部署优化,以及一些实践中的改进点。这些方法不仅简化了异步编程,还提升了代码的可读性和可维护性。
|
24天前
|
Serverless 数据安全/隐私保护 前端开发
大模型代码能力体验报告之贪吃蛇小游戏《一》:Claude.ai篇 - 生成、预览和快速部署的serverless一条龙
本文介绍了通过Claude.ai生成并优化Web版贪吃蛇游戏的过程,展示了其强大的代码生成功能及用户友好的界面设计。从初始版本的快速生成到根据用户反馈调整游戏速度,再到提供多种实用工具如文件管理、版本控制和一键部署,Claude.ai不仅是一个代码助手,更像是一个全面的serverless开发平台。文中还呼吁国内厂商关注此类技术的发展。
|
22天前
|
人工智能 弹性计算 运维
触手可及,函数计算玩转 AI 大模型
《触手可及,函数计算玩转 AI 大模型》解决方案通过函数计算(Function Compute)实现AI大模型的高效部署和管理,利用云服务的弹性伸缩和按需付费特性,降低了部署和运维的复杂度。整体描述较为清晰,但在模型加载与推理、性能指标、示例代码等方面可进一步优化。部署过程中提供了详细文档,但仍需细化步骤、增加FAQ和报错处理。解决方案展示了函数计算的优势,但在性能对比、案例研究和成本分析方面有待加强。该方案基本符合实际生产环境需求,但在高可用性、监控与日志、安全性和扩展性方面仍有提升空间。
|
2月前
|
人工智能 自然语言处理 Serverless
阿里云函数计算 x NVIDIA 加速企业 AI 应用落地
阿里云函数计算与 NVIDIA TensorRT/TensorRT-LLM 展开合作,通过结合阿里云的无缝计算体验和 NVIDIA 的高性能推理库,开发者能够以更低的成本、更高的效率完成复杂的 AI 任务,加速技术落地和应用创新。
149 13
|
3月前
|
Serverless API 异构计算
函数计算产品使用问题之修改SD模版应用的运行环境
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。
|
3月前
|
运维 Serverless 网络安全
函数计算产品使用问题之通过仓库导入应用时无法配置域名外网访问,该如何排查
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。