暂时未有相关云产品技术能力~
『为AI硬核资料库(cool)而生!』构建AI解决方案,用知识加速每一次技术成长!网站:https://www.showmeai.tech/ 公众号:ShowMeAI研究中心
图像检索任务指的是,给定查询图像,从图像数据库中找到包含相同或相似实例的图像。典型应用之一就是电商商品检索,如淘宝拍立淘,只需要用户随手拍照即可精准检索,提高了电商购物的体验。本篇我们来看看淘宝拍立淘背后的实现方案和依托的计算机视觉技术。
知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的技术方法。本文研究的是爱奇艺奇搜知识图谱的构建流程与应用场景,了解这一文娱行业知识图谱是如何帮助用户精确找到想要的内容、回答用户问题、以及理解用户搜索意图的。
知识图谱(Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现更智能的搜索引擎,并且于2013年以后开始在学术界和业界普及。目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐、情报分析、反欺诈等领域。本篇是『知识图谱构建与落地实践』的起始篇,我们与来自百度的NLP工程师路遥,一起研究知识图谱的构建流程与技术细节。
双塔模型是推荐、搜索、广告等多个领域的算法实现中最常用和经典的结构,实际各公司应用时,双塔结构中的每个塔会做结构升级,用CTR预估中的新网络结构替代全连接DNN,本期看到的是腾讯浏览器团队的推荐场景下,巧妙并联CTR模型应用于双塔的方案。
短视频是当前互联网最热门的业务之一,聚集了巨大的互联网用户流量,也是各大公司争相发展的业务领域。作为主要营收业务方向,短视频方向的推荐算法也日新月异并驱动业务增长,本期我们看到的是爱奇艺的短视频频道下,推荐多任务算法应用实践路径与落地方案。
推荐,搜索,计算广告是互联网公司最普及最容易商业变现的方向,也是算法发挥作用最大的一些方向,前沿算法的突破和应用可以极大程度驱动业务增长,这个系列咱们就聊聊这些业务方向的技术和企业实践。本期主题为多目标学习优化落地(附『实现代码』和『微信数据集』)
ShowMeAI按照不同的技术线与应用领域,以最专业和直观的方式讲解字节、阿里、腾讯、美团、百度等头部企业的核心业务技术解决方案,覆盖推荐&广告、NLP、CV、金融科技等领域。
在Python的开发过程中,经常要处理时间类型的数据。Python内置了 time、datetime 等标准库,帮助我们对时间型进行处理。
命名空间与作用域是程序设计中的基础概念,深入理解有助于理解变量的生命周期,减少代码中的莫名其妙bug。
面向对象编程是一种程序设计思想,即把对象作为程序的基本单元。一个对象包含了数据和操作数据的函数,而Python是一个纯天然面向对象的编程语言。
在实际编程过程中,经常会看到一些报错信息,在python中也有专门的方式去处理错误和异常,保证全局流程顺畅。
在实际开发中,经常需要对文件夹、文件等进行创建、修改、查询、读取、删除等操作。Python 通过标准内置OS模块,能够以简洁高效的方式完成这些操作。
读写文件是最常见的操作之一,Python内置了open()函数,用于对文件进行读写操作。每当我们用open方法打开一个文件时,将返回一个文件对象。
在Python中,一个.py文件就称为一个模块(Module),包含很多不同功能编写成的函数。包是用来管理Python模块命名空间的形式,经常以「包.模块」的形式来导入模块。
Python中有大量的数据结构与容器供编程使用,在本节内容中我们汇总前面所学的知识点,并拓展一些新知识,来介绍Python数据结构。
迭代器(iterator)是一个带状态的对象,在调用next()方法时返回容器中的下一个值。生成器(generator)是使用 yield 的函数,函数被调用时会返回一个生成器对象。生成器其实是一种特殊的迭代器,不过这种迭代器更加优雅。
在Python中,函数(Function)是组织好的、可重复使用的、用来实现单一,或相关联功能的代码段。内建函数和用户自定义函数提高了应用的模块性和代码的重复利用率。
在 Python 中,集合(Set)是一个无序的不重复元素的集,基本功能包括关系测试和消除重复元素。本文讲解集合的创建和元素的添加、移除、清空等操作。
在 Python 中,字典(Dictionary)是另一种可变容器模型,且可存储任意类型对象。作为Python唯一的标准mapping type,字典支持增、删、查、整体更新等操作。
在Python中,元组(Tuple)是另一个重要的序列结构,由一系列按特定顺序排序的元素组成。本文讲解元组的创建、访问、修改、删除、运算、内置函数等知识。
在Python中,列表(List)是最常用的Python数据类型之一,可以作为一个方括号内的逗号分隔值出现。本文详细讲解列表的创建、访问、更新、删除、截取和列表函数等知识。
在Python中,字符串(String)是若干个字符的集合,是最常用的数据类型。就是一个字符串。本文详细讲解字符串的创建、访问、连接、运算、格式化、Unicode字符串和内建函数等知识。
在Python中,有时候程序需要占一个位置或放一条语句,但又不希望这条语句做任何事情,此时就可以通过 pass 来优雅地实现。
在 Python中,continue 语句用来告诉Python跳过当前循环的剩余语句,然后继续进行下一轮循环(而break是跳出整个循环)。
在 Python中,break语句打破了最小封闭的for或while循环,将停止执行最深层的循环,并开始执行下一行代码。
在 Python 中,可以使用 if 语句对条件进行判断,然后根据不同的结果(True或者False)执行不同的代码。Python 中的 if 语句可以细分为三种形式: if 语句、if else 语句和 if elif else 语句。
本文讲解Python语言支持的以下类型的运算符:算术运算符、比较(关系)运算符、赋值运算符、逻辑运算符、位运算符、成员运算符、身份运算符、 运算符优先级等。
在 python中,for 循环常用于遍历字符串、列表、元组、字典、集合等序列类型,逐个获取序列中的各个元素。
Python 编程中while 语句用于循环执行程序,即在某条件下,循环执行某段程序,以处理需要重复处理的相同任务。
程序一般情况按顺序执行,,但Python提供了各种控制结构,允许更改语句执行的顺序:for循环、while循环,以及break语句、continue语句和pass语句等。
Python基本数据类型一般分为6种:数值(Numbers)、字符串(String)、列表(List)、元组(Tuple)、字典(Dictionary)、集合(Set)。本文详细讲解Python中变量赋值、数据类型以及数据类型的转换。
本系列教程讲解Python编程语言,我们首先了解一些Python的基础知识:Python 编程模式、Python 标识符与关键字、Python 缩进与代码块、Python 简单输入输出、Python 基本代码结构等。
本文介绍Python的集成开发环境Anaconda的安装、配置及使用,大家在后续的Python及数据科学知识学习过程中会经常用到这套环境工具。
本系列教程讲解Python编程语言,我们首先了解一些Python的基础知识:Python 编程模式、Python 标识符与关键字、Python 缩进与代码块、Python 简单输入输出、Python 基本代码结构等。
Python 是一门开源免费、通用型的脚本编程语言,它上手简单,功能强大,它也是互联网最热门的编程语言之一。这套Python基础教程不同于其他文字版教程,我们以最直挂的「图示」对每个内容和关键点「可视化」,配以最精准精简的代码,让大家尽快入门。
对于使用Python快捷地进行数据分析可视化而言,Seaborn是一个简单易用的选择。Seaborn 核心库进行了更高阶的 API 封装,可以轻松地画出配色更加舒服、图形元素的样式更加细腻的图形。
本文我们介绍pandas可视化及绘制各种图形的方法,大部分基础图像(条形图、直方图、箱型图、面积图、散点图、饼形图等)绘制只要一行代码就能实现,大大加速了我们的分析效率。
数据可视化是以图示或图形格式表示的数据,以更直观方式理解与分析数据。本篇内容,我们给大家介绍数据分析中关于可视化的一些核心知识,包括:各类图形及特点,不同图形选择方法。
Pandas中可以借助groupby操作对Dataframe分组操作,本文介绍groupby的基本原理及对应的agg、transform和apply方法与操作。
本篇为『图解Pandas数据变换高级函数』,讲解3个函数是map、apply和applymap,更高效地完成数据处理过程中对DataFrame进行逐行、逐列和逐元素的操作。
本篇为pandas系列的导语,对『Pandas核心操作函数』进行介绍,讲解Pandas进行数据操作和处理的核心数据结构:Series、DataFrame和Index。
Pandas是Python中最常用到的数据操作和分析工具包,它构建在Numpy之上,具备简洁的使用接口和高效的处理效率。数据科学、机器学习AI应用过程,涉及数据清洗和分析的操作也频繁使用Pandas。
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与3维、更高维数组的操作。
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与2维数组操作——向量初始化、矩阵操作等。
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法。本篇讲解Numpy与1维数组操作——向量初始化、索引、操作等。
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇为系列导入文章,讲解数组的特点、与列表的对比等。
基于数据分析目前良好的发展前景,各界也出现了许多好用的功能种类丰富的数据分析工具。本文列举其中的一些常用工具:Python、R、SQL、SAS、Tableau、Excel等。
数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第三个步骤:业务认知与数据探索,包括常见业务分析模型,如AB测试、RFM、AARRR、对比分析、来源分析、细分分析、用户分析、聚类分析等。
数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第二个步骤:数据预处理,包括数据调整(量纲、数据标准化)、数据异常值检测与分析、缺失值的处理等。
数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第一个步骤:业务认知与数据探索,包括常见业务目标和业务指标,并结合典型案例讲解指标体系的设计与使用。