OCR是RPA机器人的眼睛
OCR就如同RPA的眼睛,RPA机器人的运行离不开它。
OCR ( Optical Character Recognition ) 光学字符识别,是指电子设备(扫描仪、数码相机等)将手写或印刷的字符转换为计算机可识别的数字字符代码技术。
RPA:企业信息孤岛的“克星”
为了降本增效,近来世界范围内掀起一股流程智能优化的热潮,转型升级成为众多企业时刻挂在嘴边的热词。不过在企业智能化转型的过程中,信息孤岛的出现,往往成为了企业升级的绊脚石。
RPA之眼:AI-OCR,Fax-OCR概述
文丨马磊
OCR是一种与RPA机器人协作的一项重要技术,相当于机器人的眼睛。
OCR是英文“Optical Character Recognition/Reader”的简称,光学字符识别。从名字我们不难看出,OCR就是读取手写和印刷文字,并把读取的信息转换成可以在电脑的Excel,World等软件上使用的文字信息处理技术。
深入浅出智能工作流(Agentic Workflow)|技术干货
著名AI学者、斯坦福大学教授吴恩达提出AI Agent的四种设计方式后,Agentic Workflow(智能体工作流)在全球范围内迅速走红,多个行业纷纷实践其应用,并推动了新的Agentic AI探索热潮。吴恩达总结了Agent设计的四种模式:自我反思、工具调用、规划设计及多智能体协作。前两者较普及,后两者则为智能体使用模式从单一大模型向多智能体协同配合完成业务流程的转变奠定了基础。
基于阿里云通义星尘实现多智能体(Multi-agent)协同工作的构想与尝试
近年来,大规模预训练模型(大模型)快速发展,其能力显著增强,尤其是在语言理解和生成方面取得了突破。然而,尽管大模型强大,但仍需被动响应指令,为此,研究转向了更具自主性的新范式——智能体(AI agent)。不同于仅执行命令的大模型,智能体不仅能理解复杂指令,还能规划行动步骤并在特定领域自我学习与改进。为进一步提高处理复杂任务的能力,多智能体(Multi-Agent)系统应运而生,多个智能体通过协作、交流信息和共享资源,共同完成更为复杂精细的任务。本文探讨了如何利用阿里云的通义星尘实现基础的多智能体协同工作,介绍了智能体的概念、优势及局限性,并通过具体案例展示了如何构建协作型多智能体系统。