文本美学:text-image打造视觉吸引力

简介: 在 GitHub 上发现了一个有趣的项目 [text-image](https://github.com/Sunny-117/text-image),能将文字、图片和视频转化为文本样式。使用简单,支持配置。项目虽小众,但潜力不小。提供了示例代码展示如何将内容文本化,包括文字、图片和视频。有兴趣的可以访问作者的 [web demo](http://h5.xiuji.mynatapp.cc/text-image/) 或自行尝试。

当我最近浏览 GitHub 时,偶然发现了一个项目,它能够将文字、图片和视频转化为文本,我觉得非常有趣。于是我就花了一些时间了解了一下,发现它的使用也非常简单方便。今天我打算和家人们分享这个发现。

项目介绍

话不多说,我们先看下作者的demo效果:

_20240420194201.jpg

text-image可以将文字、图片、视频进行「文本化」

只需要通过简单的配置即可使用。

虽然这个项目star数很少,但确实是一个很有意思的项目,使用起来很简单的项目。

_20240420194537.jpg

github地址:https://github.com/Sunny-117/text-image

我也是使用这个项目做了一个简单的web页面,感兴趣的家人可以使用看下效果:

web地址:http://h5.xiuji.mynatapp.cc/text-image/

_20240420211509.jpg

项目使用

这个项目使用起来相对简单,只需按作者的文档使用即可,虽然我前端属于小白的水平,但还是在ai的帮助下做了一个简单的html页面,如果有家人需要的话可以私信我,我发下文件。下边我们就介绍下:

  • 文字「文本化」

先看效果:

_20240420195701.jpg

我们在这儿是将配置的一些参数在页面上做了一个可配置的表单,方便我们配置。

家人们想自己尝试的话可以试下以下这个demo。

demo.html

<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="UTF-8" />
  <title>Document</title>
</head>

<body>
  <canvas id="demo"></canvas>
  <script src="http://h5.xiuji.mynatapp.cc/text-image/text-image.iife.js"></script>
  <script>
    textImage.createTextImage({
    
      canvas: document.getElementById('demo'),
      replaceText: '123',
      source: {
    
        text: '修己xj',
      },
    });
  </script>
</body>
</html>
  • 图片「文本化」

_20240420200651.jpg

demo.html

<!DOCTYPE html>
<html lang="en">

<head>
  <meta charset="UTF-8" />
  <title>Document</title>
</head>

<body>
  <canvas id="demo"></canvas>
  <script src="http://h5.xiuji.mynatapp.cc/text-image/text-image.iife.js"></script>
  <script>
    textImage.createTextImage({
    
      canvas: document.getElementById('demo'),
      raduis: 7,
      isGray: true,
      source: {
    
        img: './assets/1.png',
      },
    });
  </script>
</body>

</html>
  • 视频「文本化」

1.gif

demo.html

<!DOCTYPE html>
<html lang="en">

<head>
  <meta charset="UTF-8" />
  <title>Document</title>
</head>

<body>
  <canvas id="demo"></canvas>
  <script src="http://h5.xiuji.mynatapp.cc/text-image/text-image.iife.js"></script>

  <script>
    textImage.createTextImage({
    
      canvas: document.getElementById('demo'),
      raduis: 8,
      isGray: true,
      source: {
    
        video: './assets/1.mp4',
        height: 700,
      },
    });
  </script>
</body>

</html>

需要注意的是:作者在项目中提供的视频的demo这个属性值有错误,我们需要改正后方可正常显示:

_20240420211124.jpg

总结

text-image 是一个强大的前端工具,可以帮助用户快速、轻松地将文本、图片、视频转换成文本化的图片,增强文本内容的表现力和吸引力。

目录
相关文章
|
8月前
|
图形学 计算机视觉
CVPR 2024:仅需文本或图像提示,新框架CustomNeRF精准编辑3D场景
【4月更文挑战第22天】CustomNeRF是CVPR 2024会议上的一项创新框架,它利用文本描述或参考图像实现3D场景的精准编辑。通过局部-全局迭代编辑(LGIE)训练和类别先验正则化,该框架能精确编辑前景区域同时保持背景一致性。尽管依赖预训练模型且局限于文本和图像输入,CustomNeRF在实验中展现了高效编辑能力,为3D场景编辑开辟新路径。[链接](https://arxiv.org/abs/2312.01663)
101 2
|
机器学习/深度学习 自然语言处理 文字识别
【计算机视觉】CLIP:连接文本和图像(关于CLIP的一些补充说明)
我们推出了一个名为CLIP的神经网络,它可以有效地从自然语言监督中学习视觉概念。CLIP可以应用于任何视觉分类基准,只需提供要识别的视觉类别名称,类似于GPT-2和GPT-3的“零样本”功能。
|
XML Web App开发 人工智能
SVG图像——为 PPT 增添视觉趣味/03/O365智能系列(二)
SVG图像——为 PPT 增添视觉趣味/03/O365智能系列(二)
1535 0
SVG图像——为 PPT 增添视觉趣味/03/O365智能系列(二)
|
28天前
|
机器学习/深度学习 人工智能 自然语言处理
Manga Image Translator:开源的漫画文字翻译工具,支持多语言翻译并嵌入原图,保持漫画的原始风格和布局
Manga Image Translator 是一款开源的漫画图片文字翻译工具,支持多语言翻译并能将翻译后的文本无缝嵌入原图,保持漫画的原始风格和布局。该工具基于OCR技术和深度学习模型,提供批量处理和在线/离线翻译功能。
88 14
Manga Image Translator:开源的漫画文字翻译工具,支持多语言翻译并嵌入原图,保持漫画的原始风格和布局
|
29天前
|
机器学习/深度学习 人工智能
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
Leffa 是 Meta 开源的图像生成框架,通过引入流场学习在注意力机制中精确控制人物的外观和姿势。该框架不增加额外参数和推理成本,适用于多种扩散模型,展现了良好的模型无关性和泛化能力。
74 11
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
|
24天前
|
人工智能 自然语言处理 计算机视觉
StyleStudio:支持图像风格迁移的文生图模型,能将融合参考图像的风格和文本提示内容生成风格一致的图像
StyleStudio 是一种文本驱动的风格迁移模型,能够将参考图像的风格与文本提示内容融合。通过跨模态 AdaIN 机制、基于风格的分类器自由引导等技术,解决了风格过拟合、控制限制和文本错位等问题,提升了风格迁移的质量和文本对齐的准确性。
72 8
StyleStudio:支持图像风格迁移的文生图模型,能将融合参考图像的风格和文本提示内容生成风格一致的图像
|
2月前
|
人工智能
LongAlign:港大推出的提升文本到图像扩散模型处理长文本对齐方法
LongAlign是由香港大学研究团队推出的文本到图像扩散模型的改进方法,旨在提升长文本输入的对齐精度。通过段级编码技术和分解偏好优化,LongAlign显著提高了模型在长文本对齐任务上的性能,超越了现有的先进模型。
45 1
LongAlign:港大推出的提升文本到图像扩散模型处理长文本对齐方法
|
2月前
|
人工智能 自然语言处理 网络性能优化
Kandinsky-3:开源的文本到图像生成框架,适应多种图像生成任务
Kandinsky-3 是一个开源的文本到图像生成框架,基于潜在扩散模型,能够适应多种图像生成任务。该框架支持高质量和逼真的图像合成,包括文本引导的修复/扩展、图像融合、文本-图像融合及视频生成等功能。Kandinsky-3 通过简化模型架构,提高了推理速度,同时保持了图像质量。
67 2
Kandinsky-3:开源的文本到图像生成框架,适应多种图像生成任务
|
人工智能 数据挖掘 PyTorch
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
|
Web App开发 自然语言处理 图形学
自然语言融入NeRF,给点文字就生成3D图的LERF来了
自然语言融入NeRF,给点文字就生成3D图的LERF来了
154 0