魔搭多模态AI单词助记&通义APP即时口语练习,你从未体验过的全新版本!

简介: 首次接触魔搭多模态AI单词助记工具让我颇感惊喜。传统背单词方式枯燥低效,而该工具通过生成关联图像、短语或故事,让记忆变得生动有趣。访问[Word-wizard](https://modelscope.cn/studios/makabakaing/Word-wizard)体验其图文记忆和视觉学习功能。目前图文记忆功能似乎存在问题,但视觉学习功能仍可正常使用,能识别图片特征并生成释义和例句,辅助学习效果不错。此外,可通过通义APP实现即时口语练习,尽管缺乏上下文记忆功能,但仍是一个优秀的练习工具。

前言

笔者第一次看到这个工具时也是震惊的,真的没有想到过还能用这种方式来帮助记忆单词。从我小时候开始,通常都是依赖重复背诵或是使用卡片等手段来加深对单词的印象,这种传统的方式往往有两个弊端:一是枯燥乏味且效率不高;另一个是抛开了场景谈单词,导致即便记住了拼写和发音,却难以在实际交流中运用自如。

今天体验了一下魔搭多模态AI单词助记,他能够根据单词生成意义生成相关的图像、短语甚至是小故事,使得单词的记忆变得更加生动有趣。

在接下来的文章中,我将会详细介绍这款工具的功能和使用方法,并分享一些个人的使用体验。如果你也对探索新颖的学习方法感兴趣,那么请跟随我一起走进这个神奇的工具吧!

魔搭多模态AI单词助记

地址如下:https://modelscope.cn/studios/makabakaing/Word-wizard

image.png

Word-wizard是一个多模态ai单词助记应用,旨在于通过荒谬而反直觉的故事和助记图片,帮助用户记忆单词。 生成的图片还挺有意思,大家可以点击链接体验一下。 更新计划:后续试着加入本地单词库上传和选择预设单词库功能,还有克隆音色朗读功能等等。

目前可以体验以下两种功能:图文记忆视觉学习

图文记忆

这一块目前似乎接口有问题,图片无法正常生成!!!

使用流程如下:

  • 如需查看demo,点击“生成故事demo”,无需其他操作,等待20s生成即可。
  • 如需自定义操作,输入单词后,点击“生成故事”,每一步生成完毕后,依次进行后续操作。

image.png
image.png

我查看了一下图片内容,报错内容如下:

image.png

应该是服务器权限进行了限制或者文件路径发生了变化。

视觉学习

点击此处切换到【视觉学习】

image.png

我们选择一张示例图片放入,然后点击【识别图片】

image.png

此时他会识别到图片中角色的一些特征,如下:

image.png

我们再让其生成释义和例句,等待约30s后,生成完毕如下:

image.png

总的来说效果还是不错的,一定程度上起到了辅助学习的作用,缺点就是目前不支持口语练习。为了克服这一局限性,下面介绍一下利用通义APP来进行口语练习。

基于通义千问APP的即时口语练习助手

下载安装通义APP,进入对话界面,直接点击下面的通话:

image.png

此时会进入一个对话模式,直接告知她:

现在请作为我的英语口语陪练老师/请帮我纠正音标发音/模拟一段机场的场景 等等

接下来开始练习就行了~~注意,这里的对话是真的可以做到及时对话的,好好利用会是一个很棒的私教,可惜的就是不存在上下文记忆。

相关文章
|
1月前
|
应用服务中间件 Linux nginx
【Azure App Service】基于Linux创建的App Service是否可以主动升级内置的Nginx版本呢?
基于Linux创建的App Service是否可以主动升级内置的Nginx版本呢?Web App Linux 默认使用的 Nginx 版本是由平台预定义的,无法更改这个版本。
137 77
|
1天前
|
数据采集 人工智能 文字识别
OmniAlign-V:20万高质量多模态数据集开源,让AI模型真正对齐人类偏好
OmniAlign-V 是由上海交通大学、上海AI Lab等机构联合推出的高质量多模态数据集,旨在提升多模态大语言模型与人类偏好的对齐能力。该数据集包含约20万个多模态训练样本,涵盖自然图像和信息图表,结合开放式问答对,支持知识问答、推理任务和创造性任务。
37 10
OmniAlign-V:20万高质量多模态数据集开源,让AI模型真正对齐人类偏好
|
1月前
|
机器学习/深度学习 人工智能 计算机视觉
MILS:无需对LLM进行额外训练就能处理多模态任务,Meta AI提出零样本生成多模态描述方法
MILS 是 Meta AI 推出的零样本生成高质量多模态描述方法,支持图像、视频和音频的描述生成,无需额外训练。
127 34
MILS:无需对LLM进行额外训练就能处理多模态任务,Meta AI提出零样本生成多模态描述方法
|
15天前
|
XML 机器学习/深度学习 人工智能
CLaMP 3:音乐搜索AI革命!多模态AI能听懂乐谱/MIDI/音频,用27国语言搜索全球音乐
CLaMP 3是由清华大学团队开发的多模态、多语言音乐信息检索框架,支持27种语言,能够进行跨模态音乐检索、零样本分类和音乐推荐等任务。
45 1
CLaMP 3:音乐搜索AI革命!多模态AI能听懂乐谱/MIDI/音频,用27国语言搜索全球音乐
|
1月前
|
前端开发 Java Shell
【08】flutter完成屏幕适配-重建Android,增加GetX路由,屏幕适配,基础导航栏-多版本SDK以及gradle造成的关于fvm的使用(flutter version manage)-卓伊凡换人优雅草Alex-开发完整的社交APP-前端客户端开发+数据联调|以优雅草商业项目为例做开发-flutter开发-全流程-商业应用级实战开发-优雅草Alex
【08】flutter完成屏幕适配-重建Android,增加GetX路由,屏幕适配,基础导航栏-多版本SDK以及gradle造成的关于fvm的使用(flutter version manage)-卓伊凡换人优雅草Alex-开发完整的社交APP-前端客户端开发+数据联调|以优雅草商业项目为例做开发-flutter开发-全流程-商业应用级实战开发-优雅草Alex
171 20
【08】flutter完成屏幕适配-重建Android,增加GetX路由,屏幕适配,基础导航栏-多版本SDK以及gradle造成的关于fvm的使用(flutter version manage)-卓伊凡换人优雅草Alex-开发完整的社交APP-前端客户端开发+数据联调|以优雅草商业项目为例做开发-flutter开发-全流程-商业应用级实战开发-优雅草Alex
|
21天前
|
人工智能 Rust 安全
DeepClaude:结合 DeepSeek R1 和 Claude AI 各自优势开发的 AI 应用平台,支持 API 调用和零延迟的即时响应
DeepClaude 是一个开源的 AI 应用开发平台,结合了 DeepSeek R1 和 Claude 模型的优势,提供即时响应、端到端加密和高度可配置的功能。
271 4
DeepClaude:结合 DeepSeek R1 和 Claude AI 各自优势开发的 AI 应用平台,支持 API 调用和零延迟的即时响应
|
7天前
|
数据采集 人工智能 编解码
算法系统协同优化,vivo与港中文推出BlueLM-V-3B,手机秒变多模态AI专家
BlueLM-V-3B是由vivo与香港中文大学共同研发的多模态大型语言模型,专为移动设备优化。它通过算法和系统协同优化,实现了高效部署和快速生成速度(24.4 token/s),并在OpenCompass基准测试中取得优异成绩(66.1分)。模型小巧,语言部分含27亿参数,视觉编码器含4000万参数,适合移动设备使用。尽管如此,低端设备可能仍面临资源压力,实际应用效果需进一步验证。论文链接:https://arxiv.org/abs/2411.10640。
29 9
|
19天前
|
人工智能 IDE 测试技术
通义灵码 AI 程序员(版本2.0)测评文档
《通义灵码 2.0 测评文档》概述了该工具在AI程序员交互、多文件代码修改、单元测试生成、多轮对话及快照管理等方面的核心功能评估。通过实际测试,验证其提高开发效率、减少重复劳动和提升代码质量的效果。测评涵盖Windows系统与JetBrains IDE环境,针对插件版本2.0.0进行详细的功能测试,包括需求解析准确性、跨文件修改稳定性、单元测试自动生成及用户界面设计等。总结指出,通义灵码 2.0 在多文件修改、单元测试生成和用户体验方面表现出色,但在复杂需求解析和大规模项目性能上仍有改进空间。
115 19
|
8天前
|
人工智能 数据可视化 数据处理
PySpur:零代码构建AI工作流!开源可视化拖拽平台,支持多模态与RAG技术
PySpur 是一款开源的轻量级可视化 AI 智能体工作流构建器,支持拖拽式界面,帮助用户快速构建、测试和迭代 AI 工作流,无需编写复杂代码。它支持多模态数据处理、RAG 技术、文件上传、结构化输出等功能,适合非技术背景的用户和开发者快速上手。
113 5
|
5天前
|
人工智能 编解码 测试技术
阿里云通义千问发布多款AI大模型 多模态、长文本能力全面升级!
阿里云通义千问发布多款AI大模型 多模态、长文本能力全面升级!

热门文章

最新文章