魔搭多模态AI单词助记&通义APP即时口语练习,你从未体验过的全新版本!

简介: 首次接触魔搭多模态AI单词助记工具让我颇感惊喜。传统背单词方式枯燥低效,而该工具通过生成关联图像、短语或故事,让记忆变得生动有趣。访问[Word-wizard](https://modelscope.cn/studios/makabakaing/Word-wizard)体验其图文记忆和视觉学习功能。目前图文记忆功能似乎存在问题,但视觉学习功能仍可正常使用,能识别图片特征并生成释义和例句,辅助学习效果不错。此外,可通过通义APP实现即时口语练习,尽管缺乏上下文记忆功能,但仍是一个优秀的练习工具。

前言

笔者第一次看到这个工具时也是震惊的,真的没有想到过还能用这种方式来帮助记忆单词。从我小时候开始,通常都是依赖重复背诵或是使用卡片等手段来加深对单词的印象,这种传统的方式往往有两个弊端:一是枯燥乏味且效率不高;另一个是抛开了场景谈单词,导致即便记住了拼写和发音,却难以在实际交流中运用自如。

今天体验了一下魔搭多模态AI单词助记,他能够根据单词生成意义生成相关的图像、短语甚至是小故事,使得单词的记忆变得更加生动有趣。

在接下来的文章中,我将会详细介绍这款工具的功能和使用方法,并分享一些个人的使用体验。如果你也对探索新颖的学习方法感兴趣,那么请跟随我一起走进这个神奇的工具吧!

魔搭多模态AI单词助记

地址如下:https://modelscope.cn/studios/makabakaing/Word-wizard

image.png

Word-wizard是一个多模态ai单词助记应用,旨在于通过荒谬而反直觉的故事和助记图片,帮助用户记忆单词。 生成的图片还挺有意思,大家可以点击链接体验一下。 更新计划:后续试着加入本地单词库上传和选择预设单词库功能,还有克隆音色朗读功能等等。

目前可以体验以下两种功能:图文记忆视觉学习

图文记忆

这一块目前似乎接口有问题,图片无法正常生成!!!

使用流程如下:

  • 如需查看demo,点击“生成故事demo”,无需其他操作,等待20s生成即可。
  • 如需自定义操作,输入单词后,点击“生成故事”,每一步生成完毕后,依次进行后续操作。

image.png
image.png

我查看了一下图片内容,报错内容如下:

image.png

应该是服务器权限进行了限制或者文件路径发生了变化。

视觉学习

点击此处切换到【视觉学习】

image.png

我们选择一张示例图片放入,然后点击【识别图片】

image.png

此时他会识别到图片中角色的一些特征,如下:

image.png

我们再让其生成释义和例句,等待约30s后,生成完毕如下:

image.png

总的来说效果还是不错的,一定程度上起到了辅助学习的作用,缺点就是目前不支持口语练习。为了克服这一局限性,下面介绍一下利用通义APP来进行口语练习。

基于通义千问APP的即时口语练习助手

下载安装通义APP,进入对话界面,直接点击下面的通话:

image.png

此时会进入一个对话模式,直接告知她:

现在请作为我的英语口语陪练老师/请帮我纠正音标发音/模拟一段机场的场景 等等

接下来开始练习就行了~~注意,这里的对话是真的可以做到及时对话的,好好利用会是一个很棒的私教,可惜的就是不存在上下文记忆。

相关文章
|
15天前
|
Java 应用服务中间件 Windows
【应用服务 App Service】App Service 中部署Java项目,查看Tomcat配置及上传自定义版本
【应用服务 App Service】App Service 中部署Java项目,查看Tomcat配置及上传自定义版本
|
11天前
|
人工智能 文字识别 算法
打造全场景、跨领域、多模态的AI工作流 | 开源图像标注工具 X-AnyLabeling v2.4.0 正式发布!
X-AnyLabeling是一款强大的辅助标注工具,集成了AI推理引擎和丰富功能,为图像数据工程师提供一站式解决方案。它支持图像和视频文件的自动标注,提供了包括矩形框、多边形在内的七种标注样式,适应多样化的训练场景需求。X-AnyLabeling内置了多种SOTA级AI模型,如YOLO、SAM系列等,并支持GPU加速和多种数据集格式的导入导出,确保高效的数据处理。此外,它还具备良好的跨平台兼容性,可在多种操作系统上运行,并提供详尽的帮助文档和社区支持,帮助用户轻松上手并解决使用过程中遇到的问题。
68 2
打造全场景、跨领域、多模态的AI工作流 | 开源图像标注工具 X-AnyLabeling v2.4.0 正式发布!
|
1天前
|
人工智能 自然语言处理 安全
【通义】AI视界|谷歌推出AI搜索功能“问照片”,照片一问即得……
本文汇总了AI领域的最新动态,包括谷歌推出的“问照片”功能,使用户能用自然语言检索Google Photos;OpenAI的商业用户激增及ChatGPT的广泛应用;Anthropic发布的企业级AI助手Claude Enterprise;美英欧盟首个人工智能法律约束条约;OpenAI前首席科学家新公司获巨额融资;以及比尔·盖茨对AI前景的乐观展望与安全建议。
|
3天前
|
人工智能 芯片 计算机视觉
【通义】AI视界·每日速递
本文介绍了六项最新科技动态,包括OpenAI首款自研芯片、ComfyUI 0.2.0版本、图像生成模型FLUX.1-dev-LoRA、Reddit的AI数据授权业务、MiniMax多模态模型abab7以及SparkLabs设立的5000万美元基金,涵盖AI硬件、设计工具、图像生成、社交平台、大模型交互和初创企业投资等多个领域。
|
2天前
|
Web App开发 人工智能 搜索推荐
【通义】AI视界·每日速递
本文汇总了24小时内的重要科技新闻,包括马斯克的xAI推出超级计算机“Colossus”、谷歌在Chrome地址栏集成Gemini AI、英伟达因反垄断调查股价暴跌、百度文心一言App升级为“文小言”、智谱与荣耀签署AI战略合作协议,以及Clearview AI因违法数据库被荷兰罚款3050万欧元。更多内容请访问通义官网体验。
|
24天前
|
人工智能 数据处理 语音技术
通义语音AI技术问题之查看KAN-TTS在ModelScope上的模型列表如何解决
通义语音AI技术问题之查看KAN-TTS在ModelScope上的模型列表如何解决
30 10
|
24天前
|
人工智能 语音技术
通义语音AI技术问题之semantic 的 residualquantizer 模块的作用如何解决
通义语音AI技术问题之semantic 的 residualquantizer 模块的作用如何解决
27 9
|
24天前
|
人工智能 语音技术
通义语音AI技术问题之服务端对于音频数据如何解决
通义语音AI技术问题之服务端对于音频数据如何解决
26 7
|
20天前
|
人工智能
多模态AI单词助记模型体验
一文带你了解多模态AI单词助记模型的优与劣
167 1
|
24天前
|
人工智能 数据挖掘 语音技术
通义语音AI技术问题之JPCP方法的工作原理如何解决
通义语音AI技术问题之JPCP方法的工作原理如何解决
21 5

热门文章

最新文章

下一篇
DDNS