这个社区可以互相交流学习AI相关的开发技术吗?自学开发AI图像算法插件一段时间,和大家分享一下经历吧,也不知道自己目前在折腾的东西有没有用。

本文涉及的产品
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,分割抠图1万点
简介: 接触AI相关快一年的时间,期间自学了一些AI图像相关的算法,然后用掌握的一些知识整了一些土枪土炮的花样,给大家献个丑,希望能在这里找到一个可以交流学习的环境。

去年开始接触AI绘画,3月开始自学开发stable diffusion的图像算法功能插件,主要是受到controlnet的启发,所以我也开始着手学习算法插件开发,对于我一个十几年前学药剂出身的工科生来说,这几乎是不太可能的事情。唯一的编程基础是大学时候学习的国家2级C语言。

好在那时候有GPT这样各种大模型,于是起手先把吴恩达等好几个知名老师关于深度学习和算法的课程先啃了一遍,看不懂的就问AI,然后就是看各种论文和文献,看不懂同样喂给AI,让AI嚼烂了辅助我理解,整体感觉最难的部分其实就是理解算法的部分,这个部分依靠AI的解释和举例来辅助学习会有比较大的帮助。期间辅助学习了Python。

补充一句,这几个月以来我全天候每天超过12小时,除了吃饭睡觉带娃,剩下的时间几乎都在学习和研究AI算法和基础,不懂的地方也会去海外开发者社区请教开发者问题。
就这样反复到了6月,基本上确定了一些想做的插件的方向,于是开始动手设计算法的功能框架。

因为当时SD用于服装电商领域比较热门,AI圈内也有一些SD的效果问题一直没有解决,所以我就主攻真实图像效果方面的算法功能开发。

我这里就简单的放一些效果说明和展示吧。
算法功能类型以“零样本训练采样的形式实现样本固定和样本嵌入”为主:

-7Q8w37-6o1rZ12T3cSvf-hq.png
-7Q8w37-iet9Z10T3cSxx-gn.png
-7Q8w37-9i84Z1dT3cSzv-c3.png
-7Q8w37-i7fyZ1dT3cSwf-hk.png

以上是这段时间研究和开发出来的插件和效果。
演示视频地址:https://www.bilibili.com/video/BV1Yh4y157AY/?share_source=copy_web&vd_source=186bcd344fd3e1d45d77dc00f5cf07ce

这次的云栖大会也去观摩学习了业内的AI技术展示,也和AI图像产品领域各个大佬交流了一番,受益良多。

说说看我这段时间研究开发算法插件的感受和经历吧,感觉国内没有专门AI技术交流的社区,导致我这种野生的小开发者没有一个可以交流问题和技术的圈子,被迫在闭门造车,有时候遇到问题找不到排除办法,我只能跑外网用翻译器翻蹩脚外语请教老外开发者问题,真的太难受了。

现在我也不知道我做的这些东西有没有实际意义,现在这些东西还不算完善,所以还没打算开源,怕开源了丢人。

不知道有没有这个领域的大佬能一起交流下,目前我在固定样本多角度推理的功能实现上,也遇到了一些问题,还没想到怎么解决的办法。希望能有AI图像算法插件开发的同道能一起探讨,没准就能找到解决的灵感。

相关文章
|
1天前
|
存储 人工智能 自然语言处理
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
|
2天前
|
人工智能 编解码 小程序
【一步步开发AI运动小程序】四、小程序如何抽帧
随着AI技术的发展,阿里体育等公司推出的“乐动力”、“天天跳绳”等APP使云上运动会、线上健身等概念备受关注。本文将引导您从零开始开发一个AI运动小程序,利用“云智AI运动识别小程序插件”。文中详细介绍了微信小程序抽帧的相关API、设置及注意事项,帮助开发者更好地实现AI运动功能。下篇将介绍人体识别技术,敬请期待。
|
2天前
|
人工智能 自然语言处理 数据挖掘
Claude 3.5:一场AI技术的惊艳飞跃 | AIGC
在这个科技日新月异的时代,人工智能(AI)的进步令人惊叹。博主体验了Claude 3.5 Sonnet的最新功能,对其卓越的性能、强大的内容创作与理解能力、创新的Artifacts功能、视觉理解与文本转录能力、革命性的“computeruse”功能、广泛的应用场景与兼容性以及成本效益和易用性深感震撼。这篇介绍将带你一窥其技术前沿的魅力。【10月更文挑战第12天】
10 1
|
4天前
|
机器学习/深度学习 人工智能 监控
利用AI进行代码审查:提升代码质量和开发效率
【10月更文挑战第12天】本文探讨了AI在代码审查中的应用及其优势,介绍了AI辅助代码审查工具如何通过自动化和持续学习提升代码质量和开发效率。文章还提供了实施AI辅助代码审查的具体步骤和实战技巧,帮助团队更好地利用这些工具。
|
2天前
|
人工智能 关系型数据库 数据中心
2024 OCP全球峰会:阿里云为代表的中国企业,引领全球AI网络合作和技术创新
今年的OCP(Open Compute Project)峰会于2024年10月14日至17日在美国加州圣何塞举行,在这场全球瞩目的盛会上,以阿里云为代表的中国企业,展示了他们在AI网络架构、液冷技术、SRv6和广域网等前沿领域的强大创新能力,持续引领全球合作与技术创新。
|
4天前
|
机器学习/深度学习 人工智能 监控
探索AI技术在医疗健康领域的应用与挑战
【10月更文挑战第13天】 本文探讨了人工智能(AI)在医疗健康领域的多种创新应用,包括疾病诊断、个性化治疗、患者监护和药物研发等方面。同时,文章也分析了当前AI技术在实际应用中面临的挑战,如数据隐私、算法透明度、监管问题等,并提出了一些可能的解决思路。通过综合分析,本文旨在为读者提供一个关于AI在医疗领域应用现状及未来的全面视角。
27 3
|
4天前
|
人工智能
添加一个Stable Difussion图像生成应用,通过向AI助手简单的提问,即可快速搭建Stable Diffusion应用至自己的网站中,大幅提升开发效率。
添加一个Stable Difussion图像生成应用,通过向AI助手简单的提问,即可快速搭建Stable Diffusion应用至自己的网站中,大幅提升开发效率。
|
3天前
|
机器学习/深度学习 人工智能 小程序
【一步步开发AI运动小程序】三、运动识别处理流程
随着人工智能技术的发展,阿里体育等公司推出的“乐动力”、“天天跳绳”等AI运动APP备受关注。本文将引导您从零开始开发一个AI运动小程序,使用“云智AI运动识别小程序插件”。文章介绍了视频帧、帧率FPS、抽帧和人体识别等基本概念,并详细说明了处理流程,包括抽帧、人体识别检测、骨骼图绘制和运动分析等步骤。下篇将介绍如何在小程序中实现抽帧。
|
6天前
|
人工智能 Serverless
AI助理精准匹配------助力快速搭建Stable Difussion图像生成应用
【10月更文挑战第7天】过去在阿里云社区搭建Stable Diffusion图像生成应用需查阅在线实验室或官方文档,耗时且不便。现阿里云AI助理提供精准匹配服务,直接在首页询问AI助理即可获取详细部署步骤,简化了操作流程,提高了效率。用户可按AI助理提供的步骤快速完成应用创建、参数设置、应用部署及资源释放等操作,轻松体验Stable Diffusion图像生成功能。
|
7天前
|
传感器 机器学习/深度学习 人工智能
AI在智能制造中的革新应用与未来展望
【10月更文挑战第10天】AI在智能制造中的革新应用与未来展望