智保未来:国泰产险的 AI 网关革新之旅
通过阿里云云原生 API 网关在国泰落地,目前国泰所有访问大模型的流量均通过阿里云云原生 API 网关进行代理,在日均消耗近亿 Token 的同时,做到了对每个请求都进行敏感信息过滤,不论是输入大模型的内容还是由大模型产生的内容都进行了全面审计,大大降低使用大模型的数据安全风险。通过网关的 AI 插件,国泰产险做到了每个 Token 都知道是谁在用,用在哪个场景,给后续分析和成本管控提供了坚实的数据支撑。
OpenAI发布sCM提升50倍效率,扩散模型重大技术突破!
OpenAI近期发布了Simplified Consistency Models (sCM) 技术,这是在扩散模型基础上的重大改进,实现了50倍效率提升。sCM通过简化和稳定连续时间一致性模型的训练过程,解决了传统模型中的离散化误差和训练不稳定性问题,显著提升了生成模型的性能和效率。在多个数据集上的测试结果表明,sCM不仅超越了现有模型,还在生成模型的实际应用中展现了巨大潜力。论文地址:https://arxiv.org/abs/2410.11081
阿里云百炼产品月刊【2024年11月】
11月,阿里云百炼平台迎来一系列重大更新,包括推出QwQ、qwen-turbo、qwen-Plus等多个新模型及快照版本,强化AI推理、文本生成、视觉理解等能力。此外,还优化了模型管理、数据处理等功能,提升了用户体验。
【大模型入门系列4】使用通义千问实现Agent ReAct
本文介绍了LLM Agent的概念及其核心技术ReAct。ReAct框架通过协同推理和行动,使大语言模型在执行任务时能生成推理轨迹和操作计划,增强模型的自主性和可解释性。文中展示了如何使用LangChain框架结合通义千问模型实现ReAct Agent,通过具体示例演示了其在解决数学和时间问题上的应用。
【大模型入门系列1】大模型RAG基础
本文介绍了RAG(检索增强生成)技术,包括其背景、向量介绍、RAG常见架构及示例代码。RAG结合了搜索和大语言模型的功能,通过从特定数据源检索信息,解决大模型的幻觉问题、实时交互问题、数据安全及知识动态性问题。文章还详细讲解了文本向量化、向量相似度计算、向量检索等概念,以及RAG应用中的索引、检索和生成步骤。最后,通过一个简单的RAG应用示例,演示了从数据加载、分割、存储到检索和生成的完整流程。
【大模型入门系列6】Qwen模型微调实战
本文介绍了使用开源框架LLaMA Factory进行大模型微调的技术学习过程,包括环境搭建、数据准备、模型选择、微调、评估及最终的模型导出与测试。通过阿里云PAI提供的DSW环境,以Qwen1.5-0.5B模型为例,展示了如何利用Web UI界面零代码完成模型微调,并通过对比微调前后模型的性能,验证了微调效果。
智能化AI工具-语言翻译与本地化
在全球化发展的背景下,语言翻译与本地化需求日益增长。无论是跨境电商、国际合作,还是本地化应用开发,都需要高效、准确的翻译解决方案。阿里云通义千问作为一款强大的大语言模型,不仅具备出色的自然语言理解能力,还能够在多语言翻译和本地化场景中发挥重要作用。本博客将详细介绍如何基于阿里云通义千问开发语言翻译与本地化工具,包括产品介绍、程序代码以及阿里云相关产品的具体使用流程。