奕晓凡_个人页

个人头像照片 奕晓凡
个人头像照片 个人头像照片
3
1
0

个人介绍

暂无个人介绍

擅长的技术

  • 容器
获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

阿里云技能认证

详细说明
暂无更多信息

2024年11月

  • 11.04 11:09:38
    发表了文章 2024-11-04 11:09:38

    基于NVIDIA A30 加速卡推理部署通义千问-72B-Chat测试过程

    本文介绍了基于阿里云通义千问72B大模型(Qwen-72B-Chat)的性能基准测试,包括测试环境准备、模型部署、API测试等内容。测试环境配置为32核128G内存的ECS云主机,配备8块NVIDIA A30 GPU加速卡。软件环境包括Ubuntu 22.04、CUDA 12.4.0、PyTorch 2.4.0等。详细介绍了模型下载、部署命令及常见问题解决方法,并展示了API测试结果和性能分析。
  • 11.01 15:07:05
    发表了文章 2024-11-01 15:07:05

    基于《文档智能 & RAG让AI大模型更懂业务》解决方案实践体验后的想法

    通过实践《文档智能 & RAG让AI大模型更懂业务》实验,掌握了构建强大LLM知识库的方法,处理企业级文档问答需求。部署文档和引导充分,但需增加资源选型指导。文档智能与RAG结合提升了文档利用效率,但在答案质量和内容精确度上有提升空间。解决方案适用于法律文档查阅、技术支持等场景,但需加强数据安全和隐私保护。建议增加基于容量需求的资源配置指导。

2024年10月

  • 10.30 21:03:35
    发表了文章 2024-10-30 21:03:35

    RAG让AI大模型更懂业务解决方案部署使用体验

    根据指导文档,部署过程得到了详细步骤说明的支持,包括环境配置、依赖安装及代码示例,确保了部署顺利进行。建议优化知识库问题汇总,增加部署失败案例参考,以提升用户体验。整体解决方案阅读与部署体验良好,有助于大型语言模型在特定业务场景的应用,未来可加强行业适应性和用户隐私保护。

2023年02月

  • 发表了文章 2024-11-04

    基于NVIDIA A30 加速卡推理部署通义千问-72B-Chat测试过程

  • 发表了文章 2024-11-01

    基于《文档智能 & RAG让AI大模型更懂业务》解决方案实践体验后的想法

  • 发表了文章 2024-10-30

    RAG让AI大模型更懂业务解决方案部署使用体验

正在加载, 请稍后...
滑动查看更多
  • 回答了问题 2023-02-01

    问答最高荣誉,乘风问答官招募中!每周积分活动、每月排位赛等权益专享!

    我要成为乘风问答官
    踩0 评论0
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息