• 干货解析|深度学习文本分类在支付宝投诉文本模型上的...

    但在实际中文的语料库中,文本结构丰富,单词的位置信息、语义信息、语法结构等,对于CNN这种空间不敏感的方法不可避免会出现问题。BiGRUs在文本分类上有明显的效果,但是在可解释性以及关注文本整体重要性上有明显...
    文章 2018-08-16 3941浏览量
  • FastText的内部机制

    我个人已经通过使用这个库取得了很多成功,并强烈推荐你用它去解决你的问题。在下一篇文章中,我将讨论我为fastText添加的一些可以泛化它的能力的附加功能。敬请继续关注。(译自:...
    文章 2018-07-17 3987浏览量
  • 高维向量检索技术在PG中的设计与实践 ——杨文(缁尘...

    超大规模向量数据集&xff08;千万级别&xff09;xff0c;且对查询延时有严格要求(10ms级别)的场景。ANN算法库ANN算法库典型有Faiss、SPTAG、proxima、vearch。Faiss&xff1a;Facebook开源向量检索库&xff0c;现在比较有名。优点...
    文章 2021-03-25 463浏览量
  • NAACL 2019最佳论文:量子概率驱动的神经网络(附代码...

    有一个波函数来描述出现的不同地方的概率,但是义原是离散的,所以它实际上是一个离散的概率分布来描述),被认为是嵌入在希尔伯特空间的一个状态,也就是一个复数的单位状态向量,一个在基本语义单元空间的复值...
    文章 2019-08-26 916浏览量
  • 【重新发现PG之美】-系列视频

    研发、软硬件成本增加、系统问题增多(同步延迟问题、同步异常问题、同步一致性问题)、开发灵活性下降(无法同时过滤模糊查询条件与表的其他条件,需要业务层交换数据)不支持同时过滤like与其他条件PG 解决方案:倒排...
    文章 2021-10-09 21浏览量
  • 《云数据管理:挑战与机遇》分布式数据管理

    针对分布式互斥问题的一种简单的集中式解决方案可以设计如下:指定一个进程为协调者,当进程需要访问资源时,发送一个请求消息给协调者。协调者维护一个等待请求队列。当协调者接收一个请求消息时,检查该队列是否为...
    文章 2017-05-19 1794浏览量
  • 实时数仓入门训练营:基于Hologres的实时数仓新架构

    T+1数据接入多种数据源接入定时数据开发与应用1)数据提取/数据转换/数据加载2)ODS数据处理3)DWD标准数据场景4)MDM元数据5)数据集市应用核心痛点1)ETL计算/存储/时间成本过高2)数据处理链路过长3)无法支持...
    文章 2021-07-14 1559浏览量
  • 如何为智能投顾打造对话系统?这有一份指南可供参考

    因为原始语义空间相对小,所以在使用同样大小的语义向量进行描述的时候损失的语义信息会更小,因此生成的回答可能会相对更接近期望语义。如果只做单一领域,我们可以跳过意图识别这一层,并且所有模型系统可以只对...
    文章 2018-01-08 865浏览量
  • 如何用Python和机器学习训练中文文本情感分类模型?

    但是自然语言的处理,是一个重要问题,也需要自动化的支持。因此人就得想办法,让机器能尽量理解和表示人类的语言。假如这里有两句话: I love the game. I hate the game. 那么我们就可以简单粗暴地抽取出以下特征...
    文章 2018-03-12 1523浏览量
  • 带你读《深入理解AutoML和AutoDL:构建自动化机器 ...

    机器学习的参数求解通常都会转化为最优化问题,例如支持向量机实质上就是求解凸二次规划问题。3.2 机器学习的实现方法 机器学习的核心是“使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测”。这...
    文章 2019-11-01 1499浏览量
  • Hadoop专业解决方案-第3章:MapReduce处理数据

    MapReduce已经解决很多实际问题(从日志分析,到数据排序,到文本操作,到基于模式的搜索,到图像处理,到机器学习等等)。似乎每周都会出现有关MapReduce新应用的出现。在本章,你将要学习MapReduce的今本原理,...
    文章 2016-04-19 3719浏览量
  • 带你读《Greenplum:从大数据战略到实现》之三:数据...

    为了解决这些问题,人们开始研究能进行更高效、安全、快捷的数据处理的系统,于是造就了一个历经半个多世纪仍然极具活力的领域—数据库和数据库管理。1964年前后,计算机领域的文献中出现了一个新词—Data Base。这...
    文章 2019-11-14 1656浏览量
  • 基于深度学习的智能问答

    譬如,问句分类过程中常用的基于支持向量机(SVM)的分类模型[24],答案抽取使用的基于条件随机场(CRF)的序列标注模型[25],以及候选答案验证过程中使用的基于逻辑回归(LR)的问答匹配模型[26]等。这种基于浅层...
    文章 2016-08-03 31123浏览量
  • 如何用Python和深度神经网络寻找近似图片?

    解决了系统兼容性问题,下面我们在TuriCreate支持的系统中,安装Python集成运行环境Anaconda。请到这个网址 下载最新版的Anaconda。下拉页面,找到下载位置。根据你目前使用的系统,网站会自动推荐给你适合的版本...
    文章 2018-01-13 1279浏览量
  • 图像搜索与识别背后的故事

    但是用户所拍的上传的图像会出现很多低质量的图片,所以说识别图像匹配是一个需要解决的关键性问题。Deep ranking 为了解决图像匹配的问题,采用了深度学习中的Deep ranking方法。若想要将一个识别搜索或者其它AI...
    文章 2019-10-14 5049浏览量
  • Hologres+MaxCompute数据仓库服务化详解

    客户收益包括:支持2000万日活用户快速向量检索,千万级u2u,i2i均可以20ms返回 通过SQL描述业务逻辑,无需手工编码 加工逻辑简化,无需额外集群。这是一个很典型的把数据作为服务的场景。而且数据并没有离开我们的...
    文章 2020-11-26 9839浏览量
  • 数据挖掘:实用案例分析》——3.2 数据挖掘建模过程

    聚类分群效果可以通过向量数据之间的相似度来衡量,向量数据之间的相似度定义为两个向量之间的距离(实时向量数据与聚类中心向量数据),距离越近则相似度越大,即该实时向量数据归为某个聚类。常用的相似度计算方法...
    文章 2017-08-01 3933浏览量
  • 深度学习要多深,才能了解你的心?...

    大规模id特征实时深度神经网络模型,可以处理上亿维度的id类输入特征,并通过复杂神经网络结构对不同域的特征(用户,宝贝,query)进行特征组合,解决了单一线性模型无法处理特征交叉的问题,同时也避免了人工构造高...
    文章 2017-06-21 3647浏览量
  • 三角兽首席科学家分享实录:基于对抗学习的生成式对话...

    怎么解决呢?我们可以考虑在判别器和生成器之间做一个桥接,最直观的方法是强化学习。这里补充说一个做paper 的idea的时候idea的选择问题。我们要看这个idea是不是大家第一反应想到的,实际的效果怎样和创新点是否...
    文章 2018-01-15 931浏览量
  • 自然语言处理领军人刘兵:没有终身学习,机器不可能...

    我感觉“intelligence”还不是这样的算法,[深度学习]里面有太多的参数,但怎么将知识真正充实在算法里,将来稍微做小的变化就[能解决新的问题],我不知道深度学习能不能做到这一点,我现在感觉目前的深度学习...
    文章 2017-08-01 911浏览量
  • 8种常见机器学习算法比较

    另外,随机森林经常是很多分类问题的赢家(通常比支持向量机好上那么一丁点),它训练快速并且可调,同时你无须担心要像支持向量机那样调一大堆参数,所以在以前都一直很受欢迎。决策树中很重要的一点就是选择一个...
    文章 2017-08-01 3079浏览量
  • 数据库选型十八摸 之 PostgreSQL-致 架构师、开发者

    数据越来越多,怎么处理好这些数据怎么数据发挥价值,已经变成了对IT行业,对数据库的挑战。对于互联网行业来说,可能对传统行业的业务并不熟悉,或者说互联网那一套技术虽然在互联网中能很好的运转,但是到了...
    文章 2017-02-10 11347浏览量
  • 2017 知乎看山杯从入门到第二

    比赛提供的数据是 300 万问题和话题的标题(下称 title)及描述(下称 desc),分别有对应的字序列(下称 char)和词序列(下称 word),全部是以 id 的形式给出。这意味着我们是看不到原始文本的,所以对于 badcase...
    文章 2017-10-24 1454浏览量
  • 怎么搞个大数据平台?

    它也通过存储数学库和Java 手机的方式提供有效包,比如向量矩阵或者其他NoSQL数据库作为数据资源的功能。以上我们通过对大数据的存储、处理以及分析三个方面来了解大数据平台技术,我们希望大数据最终在处理技术上...
    文章 2017-07-05 1093浏览量
  • 面对数据缺失,如何选择合适的机器学习模型?

    因为涉及到“距离”这个概念,那么缺失值处理不当就会导致效果很差,如K近邻算法(KNN)和支持向量机(SVM)。线性模型的代价函数(loss function)往往涉及到距离(distance)的计算,计算预测值和真实值之间的差别,这容易...
    文章 2018-01-08 2752浏览量
  • 氪信资深数据科学家主讲:如何构建基于AI的金融风控...

    对于数据库某一个数据结构的依赖就不是那么强,我们只要优化金融知识图谱的知识结构,工作中的相关问题都可以得到解决。基于知识图谱的社交网络分析 金融知识图谱的第二个优点从上图中就可以看出来,知识图谱比较...
    文章 2017-07-03 1608浏览量
  • BAT资深算法工程师「Deep Learning」读书系列分享(一...

    这张图说的是,深度学习是怎么通过深度结构解决问题的。底层的是一些像素,这里是三个像素,只取了三种颜色。当然这张图有点误导,看起来好像就只用这三种颜色,就能完成图像分类;实际上不是的。底层对应的是整张...
    文章 2017-08-01 844浏览量
  • 4大案例告诉你,如何用机器学习玩转企业大数据|...

    机器学习中一个非常经典的问题支持向量问题,简称SVM问题。这个问题的背景是这样的:我有很多数据点,我知道一些数据属于某种类别,另一些不属于,我需要找到方法区分这两类数据点,如果有新数据点进来,我就...
    文章 2017-07-03 1143浏览量
  • 分布式系统架构,回顾2020年常见面试知识点梳理(每次...

    问:怎么解决缓存穿透?问:什么是缓存与数据库双写一致问题?问:如何保证缓存与数据库的一致性?读的时候,先读缓存,缓存没有的话,就读数据库,然后取出数据后放入缓存,同时返回响应。先删除缓存,再更新数据库...
    文章 2020-12-30 229浏览量
  • 如何高效入门数据科学?

    不过日期数据如果与样例有出入,可能会出现问题。这时候,不要慌,请参考《Python编程遇问题,文科生怎么办?的第二部分,其中有详细的错误原因分析与对策展示。看过后,分析结果图也会迭代成这个样子: 到这里,你...
    文章 2018-02-20 1806浏览量
1 2 3 4 5 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化