这个社区可以互相交流学习AI相关的开发技术吗?自学开发AI图像算法插件一段时间,和大家分享一下经历吧,也不知道自己目前在折腾的东西有没有用。

本文涉及的产品
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,视频资源包5000点
简介: 接触AI相关快一年的时间,期间自学了一些AI图像相关的算法,然后用掌握的一些知识整了一些土枪土炮的花样,给大家献个丑,希望能在这里找到一个可以交流学习的环境。

去年开始接触AI绘画,3月开始自学开发stable diffusion的图像算法功能插件,主要是受到controlnet的启发,所以我也开始着手学习算法插件开发,对于我一个十几年前学药剂出身的工科生来说,这几乎是不太可能的事情。唯一的编程基础是大学时候学习的国家2级C语言。

好在那时候有GPT这样各种大模型,于是起手先把吴恩达等好几个知名老师关于深度学习和算法的课程先啃了一遍,看不懂的就问AI,然后就是看各种论文和文献,看不懂同样喂给AI,让AI嚼烂了辅助我理解,整体感觉最难的部分其实就是理解算法的部分,这个部分依靠AI的解释和举例来辅助学习会有比较大的帮助。期间辅助学习了Python。

补充一句,这几个月以来我全天候每天超过12小时,除了吃饭睡觉带娃,剩下的时间几乎都在学习和研究AI算法和基础,不懂的地方也会去海外开发者社区请教开发者问题。
就这样反复到了6月,基本上确定了一些想做的插件的方向,于是开始动手设计算法的功能框架。

因为当时SD用于服装电商领域比较热门,AI圈内也有一些SD的效果问题一直没有解决,所以我就主攻真实图像效果方面的算法功能开发。

我这里就简单的放一些效果说明和展示吧。
算法功能类型以“零样本训练采样的形式实现样本固定和样本嵌入”为主:

-7Q8w37-6o1rZ12T3cSvf-hq.png
-7Q8w37-iet9Z10T3cSxx-gn.png
-7Q8w37-9i84Z1dT3cSzv-c3.png
-7Q8w37-i7fyZ1dT3cSwf-hk.png

以上是这段时间研究和开发出来的插件和效果。
演示视频地址:https://www.bilibili.com/video/BV1Yh4y157AY/?share_source=copy_web&vd_source=186bcd344fd3e1d45d77dc00f5cf07ce

这次的云栖大会也去观摩学习了业内的AI技术展示,也和AI图像产品领域各个大佬交流了一番,受益良多。

说说看我这段时间研究开发算法插件的感受和经历吧,感觉国内没有专门AI技术交流的社区,导致我这种野生的小开发者没有一个可以交流问题和技术的圈子,被迫在闭门造车,有时候遇到问题找不到排除办法,我只能跑外网用翻译器翻蹩脚外语请教老外开发者问题,真的太难受了。

现在我也不知道我做的这些东西有没有实际意义,现在这些东西还不算完善,所以还没打算开源,怕开源了丢人。

不知道有没有这个领域的大佬能一起交流下,目前我在固定样本多角度推理的功能实现上,也遇到了一些问题,还没想到怎么解决的办法。希望能有AI图像算法插件开发的同道能一起探讨,没准就能找到解决的灵感。

相关文章
|
13天前
|
人工智能 JSON Rust
用 Rust 实现敏感信息拦截插件,提升 AI 网关安全防护能力
本⽂对敏感信息拦截插件的使用方式和实现原理进行了简单介绍,它能够自动检测并处理请求和响应中的敏感词,有效防止敏感信息泄露。通过对不同数据范围的支持和灵活的配置选项,该插件能够适应各种应用场景,确保数据的安全性和合规性。
|
18天前
|
机器学习/深度学习 存储 人工智能
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
【9月更文挑战第1天】AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
|
3天前
|
人工智能 开发框架 Java
重磅发布!AI 驱动的 Java 开发框架:Spring AI Alibaba
随着生成式 AI 的快速发展,基于 AI 开发框架构建 AI 应用的诉求迅速增长,涌现出了包括 LangChain、LlamaIndex 等开发框架,但大部分框架只提供了 Python 语言的实现。但这些开发框架对于国内习惯了 Spring 开发范式的 Java 开发者而言,并非十分友好和丝滑。因此,我们基于 Spring AI 发布并快速演进 Spring AI Alibaba,通过提供一种方便的 API 抽象,帮助 Java 开发者简化 AI 应用的开发。同时,提供了完整的开源配套,包括可观测、网关、消息队列、配置中心等。
346 5
|
2天前
|
人工智能
AI助手伴学习,通义灵码开启新学期第一课​
AI助手伴学习,通义灵码开启新学期第一课​
14 3
|
4天前
|
人工智能 IDE 程序员
期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
在云栖大会上,阿里云云原生应用平台负责人丁宇宣布,「通义灵码」完成全面升级,并正式发布 AI 程序员。
|
13天前
|
人工智能 Cloud Native Serverless
来云栖大会!探展云上开发,沉浸式体验云原生 + AI 新奇玩法
计算馆将展示中国最先进的云计算产业链全景,从底层硬件到数据创新,从云计算基础设施到数据管理服务、人工智能平台和模型服务,全景式呈现 AI 时代云计算最新技术形态和产品进展。计算馆有哪些推荐?往下看!
|
8天前
|
人工智能 运维 安全
专访浪潮信息:AI 原生时代,浪潮信息引领服务器操作系统创新 全面贡献龙蜥社区
分享了关于 AI 原生化趋势下服务器操作系统进化的思考,以及浪潮信息在龙蜥社区开源贡献的思路、成果与未来技术发展规划。
专访浪潮信息:AI 原生时代,浪潮信息引领服务器操作系统创新 全面贡献龙蜥社区
|
14天前
|
人工智能 C++ 开发者
verilog vscode 与AI 插件
【9月更文挑战第11天】在Verilog开发中,使用Visual Studio Code(VS Code)结合AI插件能显著提升效率。VS Code提供强大的编辑功能,如语法高亮、自动补全和代码格式化;便捷的调试功能,支持多种调试器;以及丰富的插件生态。AI插件则可自动生成代码、优化现有代码、检测并修复错误,还能自动生成文档。常用插件包括Verilog AI Assistant和Verilog Language Server,可根据需求选择合适的工具组合,提高开发效率和代码质量。
|
23天前
|
人工智能 安全 Linux
龙蜥社区首推 AI 原生操作系统路线,三大重磅计划协同生态布局未来
第二届龙蜥大会圆满落幕,龙蜥操作系统装机量突破800万。