中杯可乐多加冰_社区达人页

个人头像照片
中杯可乐多加冰
已加入开发者社区552
勋章 更多
个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
江湖新秀
江湖新秀
成就
已发布78篇文章
1条评论
已回答0个问题
0条评论
已发布0个视频
github地址
我关注的人 更多
技术能力
兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

暂无个人介绍
暂无精选文章
暂无更多信息

2024年01月

  • 01.05 13:48:42
    发表了文章 2024-01-05 13:48:42

    【2023 CSIG垂直领域大模型】大模型时代,如何完成IDP智能文档处理领域的OCR大一统?

    2023年12月28-31日,由中国图象图形学学会主办的第十九届CSIG青年科学家会议在中国广州隆重召开,会议吸引了学术界和企业界专家与青年学者,会议面向国际学术前沿与国家战略需求,聚焦最新前沿技术和热点领域,共同探讨图象图形学领域的前沿问题,分享最新的研究成果和创新观点,在垂直领域大模型专场,合合信息智能技术平台事业部副总经理、高级工程师丁凯博士为我们带来了《文档图像大模型的思考与探索》主题报告。

2023年08月

  • 08.18 20:15:37
    发表了文章 2023-08-18 20:15:37

    【新知测评实验室】解谜扫描全能王——“智能高清滤镜”黑科技

    扫描技术已经被广泛应用于如办公(文件、名片、发票)、学习(笔记、试卷)、个人生活(证件、照片)、商务(收据、发票)、法律(合同、证据)等等各个领域。然而,现实图像中常常会出现一系列模糊、阴暗、褶皱、污渍、光线、透字等问题,如下面是一张很常见的笔记照片,照片中的褶皱和版面弯曲严重影响了图像质量和可读性,经过传统扫描工具如打印机、扫描仪扫描后仍然难以到达实用性和可用性。近期,合合信息旗下扫描全能王全新上线了一款“智能高清滤镜”黑科技,。本篇文章将对此一探究竟,从深层原理和测试对比来揭开其神秘面纱。
  • 08.03 21:45:54
    发表了文章 2023-08-03 21:45:54

    大模型时代下,算法工程师该何去何从?

    大模型时代的到来,将算法工程师的职业发展带入了全新的境地。在这个浩瀚的数据海洋中,算法工程师们面临着前所未有的挑战和机遇。不久前,合合信息举办了一场《》的直播活动,智能技术平台事业部副总经理、高级工程师丁凯博士分享了。这段深度探讨不仅让我对算法工程师的未来有了更清晰的认识,也启发了我对自身职业发展的思考。接下来,我将分享这次讨论的精彩内容,希望能够为同学们提供一些有益的启示与思考。

2023年07月

  • 07.15 10:42:18
    发表了文章 2023-07-15 10:42:18

    WAIC2023| AIGC究竟在向善还是向恶而行?

    随着数字图像处理技术的发展和以ChatGPTMidjourney等为代表的AIGC产品的爆火,各种数字图像编辑处理软件和生成式模型正在变得越来越强大,普通用户已经可以方便地对图像进行绘制、编辑和篡改,这些技术和软件在带来便利的同时,也使得用户更容易伪造或篡改数字图像而不留痕迹,人工智能生成内容以假乱真、数据泄露以及侵权的风险被进一步放大。

2023年06月

  • 06.17 10:54:14
    发表了文章 2023-06-17 10:54:14

    【技术新趋势】面向图像文档的版面智能分析与理解

    在OCR系统中,纸质文档被相机拍摄成文档图像后,首先要进行版面分析、版面理解,之后才能正式数字化为电子文档。本篇文章将关注面向文档图像的版面分析与理解方向,并讨论这些任务的目前的优秀技术和方法。

2023年05月

  • 05.18 14:49:44
    发表了文章 2023-05-18 14:49:44

    CCIG 2023 从视觉-语言模型到智能文档图像处理

    最近,中国图像图形大会(CCIG 2023)在苏州成功结束。本次大会以“图像图形·向未来”为主题,由中国科学技术协会指导,中国图像图形学学会主办,苏州科技大学承办。
  • 05.10 14:28:43
    发表了文章 2023-05-10 14:28:43

    从模式识别到图像文档分析——浅析场景文本识别研究

    文本检测领域经历了从水平文字检测到多方向文字检测再到任意形状文字检测这样越来越有挑战性的应用场景转变。 在复杂场景下,由于光照、遮挡等因素的影响,图像中的文本经常会出现模糊、失真、变形等问题;其次,文本与背景之间偶尔存在相似度较高的情况,文字颜色和背景颜色相近或者噪点过多等情况会严重干扰文本的准确识别;此外,在某些场景下(如手写体、印章、二维码等),不同于常规字体的字形特征也会增加识别难度。复杂场景下的文本识别依然是目前难以解决的问题。

2023年04月

  • 04.13 11:34:12
    发表了文章 2023-04-13 11:34:12

    Stable Diffusion复现——基于 Amazon SageMaker 搭建文本生成图像模型

    众所周知,Stable Diffusion扩散模型的训练和推理非常消耗显卡资源,我之前也是因为资源原因一直没有复现成功。 而最近我在网上搜索发现,亚马逊云科技最近推出了一个【云上探索实验室】刚好有复现Stable Diffusion的活动,其使用亚马逊AWS提供的Amazon SageMaker机器学习平台,为快速构建、训练和部署机器学习模型提供了许多便利的工具和服务,我也是深入体验了一番。

2023年03月

  • 03.29 10:14:05
    发表了文章 2023-03-29 10:14:05

    探寻人工智能前沿 迎接AIGC时代——CSIG企业行(附一些好玩的创新点)

    上周我有幸参加了由中国图像图形学会和合合信息共同举办的CSIG企业行活动。 这次活动邀请了多位来自图像描述与视觉问答、图文公式识别、自然语言处理、生成式视觉等领域的学者,他们分享了各自的研究成果和经验,并与现场观众进行了深入的交流和探讨。干货多多,感悟多多,在这里分享此次的收获给大家。
  • 03.14 20:33:33
    发表了文章 2023-03-14 20:33:33

    ChatGPT背后的技术和多模态异构数据处理的未来展望——我与一位资深工程师的走心探讨

    上周,我和一位从业三十余年的工程师聊到ChatGPT。 作为一名人工智能领域研究者,我也一直对对话式大型语言模型非常感兴趣,在讨论中,我向他解释这个技术时,他瞬间被其中惊人之处所吸引🙌,我们深入探讨了ChatGPT的关键技术,他对我所说的内容产生了浓厚的兴趣,我们开始交流并分享了各自的经验。我发现,与这位资深工程师的讨论不仅加深了我的理解,也让我更加了解了这项技术的前沿发展🌱。 后续我也下面我将分享一些我在与工程师的讨论中和自己学习中所了解的ChatGPT的关键技术,希望对您有所帮助。

2022年08月

  • 发表了文章 2024-01-05

    【2023 CSIG垂直领域大模型】大模型时代,如何完成IDP智能文档处理领域的OCR大一统?

  • 发表了文章 2023-08-18

    【新知测评实验室】解谜扫描全能王——“智能高清滤镜”黑科技

  • 发表了文章 2023-08-03

    大模型时代下,算法工程师该何去何从?

  • 发表了文章 2023-07-15

    WAIC2023| AIGC究竟在向善还是向恶而行?

  • 发表了文章 2023-06-17

    【技术新趋势】面向图像文档的版面智能分析与理解

  • 发表了文章 2023-05-18

    CCIG 2023 从视觉-语言模型到智能文档图像处理

  • 发表了文章 2023-05-10

    从模式识别到图像文档分析——浅析场景文本识别研究

  • 发表了文章 2023-04-13

    Stable Diffusion复现——基于 Amazon SageMaker 搭建文本生成图像模型

  • 发表了文章 2023-03-29

    探寻人工智能前沿 迎接AIGC时代——CSIG企业行(附一些好玩的创新点)

  • 发表了文章 2023-03-14

    ChatGPT背后的技术和多模态异构数据处理的未来展望——我与一位资深工程师的走心探讨

  • 发表了文章 2022-08-23

    解决方案:炼丹师养成计划 Pytorch+DeepLearning遇见的各种报错与踩坑避坑记录(二)

  • 发表了文章 2022-08-23

    【数据挖掘】使用移动平均预测道琼斯、纳斯达克、标准普尔指数——Python中的基本数据操作和可视化

  • 发表了文章 2022-08-23

    ViTGAN:用视觉Transformer训练生成性对抗网络 Training GANs with Vision Transformers

  • 发表了文章 2022-08-23

    Text to image论文精读SSA-GAN:基于语义空间感知的文本图像生成 Text to Image Generation with Semantic-Spatial Aware GAN

  • 发表了文章 2022-08-23

    三种能有效融合文本和图像信息的方法——特征拼接、跨模态注意、条件批量归一化

  • 发表了文章 2022-08-23

    2022年最新文本生成图像研究 开源工作速览(Papers with code)

  • 发表了文章 2022-08-23

    Text to image论文精读DF-GAN:A Simple and Effective Baseline for Text-to-Image Synthesis一种简单有效的文本生成图像基准模型

  • 发表了文章 2022-08-23

    解决方案:炼丹师养成计划 Pytorch+DeepLearning遇见的各种报错与踩坑避坑记录(一)

  • 发表了文章 2022-08-23

    解决方案:Springboot+Vue3+Mybatis+Axios 前后端分离项目中 遇见的若干报错和踩坑避坑(二)

  • 发表了文章 2022-08-23

    Text to Image 文本生成图像定量评价指标分析笔记 Metric Value总结 IS、FID、R-prec等

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息