信息无障碍

首页 标签 信息无障碍
# 信息无障碍 #
关注
369内容
你的公益还停在捐款箱?看看开发者如何改变世界(二)
【新智元导读】代码虽冰冷,开发者有热情。多年来,AI的力量已经渗透到社会公益之中,这是一片无利益竞争的净土,以BAT等为主的互联网科技企业都已深耕良久,纷纷发起公益计划,依托企业提供的前沿AI技术,开发者们可以化想法为程序,履行时代缔造者的重任。
直播源码搭建平台技术知识:实时语音识别字幕呈现功能
回到我们的直播源码平台开发上来,对于直播源码平台来说实时语音识别字幕呈现功能也是重要的功能之一,好了,正式进入我们今天的主题内容:直播源码搭建平台技术知识:实时语音识别字幕呈现功能!
视觉语言模型导论:这篇论文能成为你进军VLM的第一步
【6月更文挑战第20天】探索AI如何理解与生成图像和文本,VLM结合图像与文本映射,涉及图像描述、问答等任务。论文由多所名校和机构研究人员共创,介绍VLM历史、类型(对比学习、掩码、生成、预训练)及应用,如图像生成和问答。同时,讨论数据质量、计算资源和模型可解释性的挑战。[阅读更多](https://arxiv.org/pdf/2405.17247)
深度学习之图像描述生成
基于深度学习的图像描述生成(Image Captioning)是一种将计算机视觉与自然语言处理结合的任务,其目标是通过自动生成自然语言来描述输入的图像。该技术能够理解图像中的视觉内容,并生成相应的文本描述,广泛应用于视觉问答、辅助盲人、自动视频字幕生成等领域。
归一化还是标准化?如何为你的数据选择最佳缩放方法
当你的特征们身高不一、体重各异时,如何让它们在机器学习的舞台上公平竞争?本文用轻松幽默的方式带你掌握特征缩放中的归一化和标准化技巧,让你的模型表现更上一层楼!
请把注意力放到百度AI上:技术、芯片和无人车更值得被关注
今天的 AI 开发者大会上,百度又一款语音 AI 芯片「鸿鹄」亮相,宣布百度飞桨与华为麒麟芯片达成深度合作,首次亮相了无人驾驶出租车项目「Apollo Go」。一手技术新进展,一手 AI 商业落地,这届百度开发者大会的亮点全在此文。
免费试用