文字识别

首页 标签 文字识别
# 文字识别 #
关注
5981内容
|
25天前
|
阿里云Tokens如何收费?免费千万Tokens领取及亿万AI大模型扶持计划申请入口
2026年阿里云Tokens计费实行输入/输出分离、阶梯定价:Qwen-Max为2.4/9.6元/百万,Qwen-Plus按Token量分档计费。新用户开通百炼平台:https://t.aliyun.com/U/fPVHqY 即赠7000万免费Tokens(每模型各100万,有效期90天),企业还可申请万亿Tokens扶持。
|
26天前
|
一文看懂什么是Token?阿里云怎么领免费Tokens、怎么用、能省多少钱?
阿里云百炼新用户开通即赠超7000万免费Tokens(每模型各100万,含输入/输出),开通百炼:https://t.aliyun.com/U/fPVHqY 有效期90天;支持Qwen-Max/Plus/Turbo等全系模型。另有万亿Tokens企业扶持、4.5折节省计划及Coding Plan订阅优惠。
|
27天前
|
图像内容理解-图像智能分析-图片内容理解API接口介绍
图像内容理解服务基于视觉大模型,支持人、物、行为、场景、文字等多维度识别,可生成一句话描述、分类标签及OCR文字信息。提供“提交请求”和“获取结果”两个API接口,适用于看图问答、视觉推理等场景。
|
1月前
| |
来自: 云存储
Vector 构建原始文件和向量数据之间的映射关系
OSS 向量 Bucket 的检索结果返回的是向量 Key 和 Metadata,而非原始文件本身。要将检索结果关联回原始文件(如图片、文档、视频),需要在写入向量时构建映射关系。
|
1月前
|
《别再把QClaw当聊天AI用了!Skills才是它真正的灵魂》
本文从真实使用体验出发,深度解析QClaw中Skills技能的本质价值,指出其并非普通插件,而是与核心引擎深度融合的执行单元,是让AI从“聊天”走向“实干”的关键。文章详细说明第三方技能的安装、导入、启用与管理方法,强调安全筛选、合理精简、按需配置的重要性,并结合办公、文档处理、自动化工作流等真实场景,讲解技能自动调用、指定调用与组合串联的实用思路。全文侧重技术思考与高效实践,帮助读者真正用好技能生态,大幅提升AI执行效率与工作生产力。
玄语言《东方字经》:一种基于十进制笔画的立体方块文字系统
《东方字经》是为玄语言设计的十进制人工文字系统:以10个基础笔画(对应数字0–9)为构件,按“从上到下、从左到右”规则组合成二维方块字符;每个字符唯一对应一串十进制数,进而严格映射音素与语义。兼具汉字形态美学与数字编码逻辑性,支持跨文字系统(蒙、藏、梵等)适配,信息密度高、易学易用。(239字)
|
1月前
|
多模态 AI 集成能力:让 AI 真正贴合企业业务
向量空间人工智能基于JBoltAI框架,提供文本理解/抽取/总结、图像OCR/视觉识别、语音转写/对话交互三大多模态AI定制服务,精准适配企业合同、图纸、录音等实际业务场景,让AI真正读懂文本、看懂图像、听懂语音,深度赋能数智化升级。(239字)
|
1月前
| |
一行命令,让你的 Code Agent 会读PDF
一行命令 `npx skills add tanis90/pdf-converter-mineru`,即可为Claude Code、Cursor等主流Code Agent注入PDF阅读能力。基于上海AI Lab开源的MinerU引擎,支持扫描件OCR、表格/公式识别、中英混排,自动选择快读或高精模式,开箱即用,无需部署MCP服务。(239字)
|
1月前
| |
大模型应用:多模态图文精准识别:基于本地化OCR模型应用实践.78
Qwen2-VL-OCR-2B是仅2B参数的轻量多模态OCR智能体,深度融合视觉感知与语言理解,可精准识别倾斜文字、复杂排版及多语言混合内容。支持CPU/GPU自动适配、指令式调用与全格式图片,本地部署安全高效,适用于文档、合同、海报等场景。
免费试用