谷歌推出新机器学习 API,可识别、搜索视频中物体

简介:

据国外媒体 TechCrunch 报道,谷歌今天在旧金山举行的 Cloud Next 大会上宣布推出新的机器学习 API,该 API 支持自动识别视频中的物体,使它们变得可以被搜索。


a6973f0c301ad1c0b3b0e80783fce80ee9676da9

该名为视频智能(Video Intelligence)的 API 将可以让开发者开发能够自动识别视频中的物体的应用程序。到目前为止,多数类似的在云端提供的图像识别 API 都只专注于静态图像中的物体识别,而有了该新 API 的帮助,开发者将能够开发出支持搜索和发现视频中的信息的应用程序。举例来说,那意味着你可以搜索视频中的 “小狗” 或者 “花朵”。

除了提取元数据之外,该 API 还能帮助标记视频中的场景变化。

那些视频必须要存储在谷歌的云存储服务当中。谷歌已经就此提供了演示,目前开发者可以申请获得内测版。


7de7b35b99aceb806b798c632d4b32f403b14bf9

谷歌云 AI 与机器学习首席科学家李飞飞(Fei-Fei Li)在今天的主旨演讲中指出,像素的世界已经延伸到图像以外。视频对于机器学习研究人员来说一直以来都是个挑战。但现在的该项新服务能够使得从视频中提取信息变得跟从图像中提取信息一样简单。

此外,该公司的云机器学习引擎(Cloud Machine Learning Engine)现已向外界开放。通过该项工具,开发者可利用 TensorFlow 框架打造定制的机器学习模型。


441492861fd83e9dd7dbc043158ddd76f282aa5c

正如李飞飞在今天的主旨演讲中所指出的,谷歌想要普及内部研发出来的机器学习技术。视频智能 API 便是又一例证。

本文来自开源中国社区 [http://www.oschina.net]

目录
相关文章
|
10月前
|
人工智能 缓存 API
谷歌发布MediaPipe LLM Inference API,28亿参数模型本地跑
【2月更文挑战第24天】谷歌发布MediaPipe LLM Inference API,28亿参数模型本地跑
337 3
谷歌发布MediaPipe LLM Inference API,28亿参数模型本地跑
|
24天前
|
人工智能 物联网 API
又又又上新啦!魔搭免费模型推理API支持DeepSeek-R1,Qwen2.5-VL,Flux.1 dev及Lora等
又又又上新啦!魔搭免费模型推理API支持DeepSeek-R1,Qwen2.5-VL,Flux.1 dev及Lora等
114 7
|
3月前
|
人工智能 自然语言处理 API
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动
谷歌推出的Multimodal Live API是一个支持多模态交互、低延迟实时互动的AI接口,能够处理文本、音频和视频输入,提供自然流畅的对话体验,适用于多种应用场景。
164 3
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动
|
3月前
|
人工智能 API 语音技术
开发者福利,魔搭推出免费模型推理API,注册就送每日2000次调用!
今天,魔搭社区开放了免费的开源模型推理API,仅需使用魔搭的SDK Token,就可以通过简单的API请求探索各种强大的开源模型的使用。
245 9
|
5月前
|
人工智能 机器人 API
【通义】AI视界|谷歌Q3财报:Gemini API六个月增长14倍,公司超25%的新代码由AI生成
本文内容由通义自动生成,涵盖谷歌Q3财报、马斯克xAI融资、九巨头联盟挑战英伟达、Meta加大AI投入及麻省理工研究LLM与人脑相似性等热点资讯。更多精彩内容,请访问通通知道。
|
5月前
|
机器学习/深度学习 算法 API
机器学习入门(五):KNN概述 | K 近邻算法 API,K值选择问题
机器学习入门(五):KNN概述 | K 近邻算法 API,K值选择问题
|
5月前
|
机器学习/深度学习 算法 数据可视化
【机器学习】决策树------迅速了解其基本思想,Sklearn的决策树API及构建决策树的步骤!!!
【机器学习】决策树------迅速了解其基本思想,Sklearn的决策树API及构建决策树的步骤!!!
|
8月前
|
JSON Shell API
阿里云PAI-Stable Diffusion开源代码浅析之(一)所有api的入参如何看
阿里云PAI-Stable Diffusion开源代码浅析之所有api的入参如何看
|
8月前
|
机器学习/深度学习 人工智能 文字识别
文本,文字扫描01,OCR文本识别技术展示,一个安卓App,一个简单的设计,文字识别可以应用于人工智能,机器学习,车牌识别,身份证识别,银行卡识别,PaddleOCR+SpringBoot+Andr
文本,文字扫描01,OCR文本识别技术展示,一个安卓App,一个简单的设计,文字识别可以应用于人工智能,机器学习,车牌识别,身份证识别,银行卡识别,PaddleOCR+SpringBoot+Andr
|
8月前
|
文字识别 API
印刷文字识别使用问题之API将全角括号识别为半角括号,该如何解决
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。