• 关于

    检索文本

    的搜索结果
  • windows文本文件格式?

    今天下午想在下windows使用的检索功能查找包含特定字符的文本文件,居然没有找到对应的文件(在这个目录下,一定存在匹配的文件),打开文件,选择一个肯定包含的字符串,查找字符串居然还是没有找到,这才想起来我要检索的文件都是unix的文本文件格式。 windows的文本文件格式结尾是0d0a(十...

    文章 lfreeali 2007-05-02 503浏览量

  • 《R语言数据挖掘》----1.5 文本挖掘

    本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.5节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.5 文本挖掘 文本挖掘基于文本数据,关注从大型自然语言文本中提取相关信息,...

    文章 华章计算机 2017-05-02 1255浏览量

  • CVPR论文 | 所见所想所找:基于生成模型的跨模态检索

    〔小叽导读〕:视觉-文本跨模态检索已经成为计算机视觉和自然语言处理领域结合的一个热点。对于跨模态检索而言,如何学到合适的特征表达非常关键。本文提出了一种基于生成模型的跨模态检索方法,该方法可以学习跨模态数据的高层次特征相似性,以及目标模态上的局部相似性。本文通过大量的实验证明了所提出的方法可以准确...

    文章 技术小能手 2019-02-20 2337浏览量

  • 阿里云爆款特惠专场,精选爆款产品低至0.95折!

    爆款ECS云服务器8.1元/月起,云数据库低至1.5折,限时抢购!

    广告

  • 地图检索 – 与众不同

    前言: 半年前,和师弟在一起吃饭时,他忽然抬头,很好奇地问我:“为什么有了百度的大检索,百度地图还要自己做检索呢?”这个问题也一直伴随着我,后来有幸转入检索方向,不断摸索,也才有了这篇文章。 正文: 地图检索,顾名思义,是在地图里的检索。它与大检索大同小异,虽然在切词粒度、专名识别、拉链归并和ra...

    文章 技术小美 2017-11-13 808浏览量

  • Lucene

    Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。 Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。

    文章 宁静_夏天 2015-12-21 591浏览量

  • CVPR论文 | 所见所想所找:基于生成模型的跨模态检索

    〔小叽导读〕:视觉-文本跨模态检索已经成为计算机视觉和自然语言处理领域结合的一个热点。对于跨模态检索而言,如何学到合适的特征表达非常关键。本文提出了一种基于生成模型的跨模态检索方法,该方法可以学习跨模态数据的高层次特征相似性,以及目标模态上的局部相似性。本文通过大量的实验证明了所提出的方法可以准确...

    文章 初商 2019-08-14 387浏览量

  • 数据库必知词汇:全文检索

    全文检索(Full-Text Search)是20世纪末产生的一种新的信息检索技术。经过几十年的发展,特别是以计算机技术为代表的新一代信息技术应用,使全文检索从最初的字符串匹配和简单的布尔逻辑检索技术演进到能对超大文本、语音、图像、活动影像等非结构化数据进行综合管理的复合技术。由于内涵和外延的深刻...

    文章 萌萌怪兽 2020-02-23 99浏览量

  • JavaScript的正则表达式

       JavaScript的正则表达式 1   正则表达式对象的方法    test用于测试字符串参数中是否存在匹配正则表达式模式的字符串,如果存在返回true,不存在返回false    exec使用正则表达式模式对字符串执行搜索,并将更新全局RegExp对象的属性以反映匹配结果 2   如果没...

    文章 科技小能手 2017-11-12 651浏览量

  • 中国人工智能学会通讯——互联网搜索技术的前沿探索 0 引 言

    摘要: 互联网搜索系统旨在解决用户需求与网络数据之间的信息鸿沟,为用户提供高效的信息获取服务。然而,互联网搜索引擎在组织、刻画海量网络数据内容,理解、匹配复杂多样的用户信息需求等方面面临着一系列技术挑战。针对这些挑战性问题,我们从对用户需求、网络数据与匹配关系的深入理解与建模入手,在查询理解与处理...

    文章 行者武松 2017-09-01 1041浏览量

  • Lucene介绍

    1. Lucene是什么 Lucene 是一个开源的、成熟的全文索引与信息检索(IR)库,采用Java实现。信息检索式指文档搜索、文档内信息搜索或者文档相关的元数据搜索等操作。Lucene是apache软件基金会项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的搜索应用程...

    文章 雨客 2016-04-08 1552浏览量

  • 每秒20W次并发分词检索,架构如何设计?

    继续回答星球水友提问。==沈哥,我们有个业务,类似于“标题分词检索”,并发量非常大,大概20W次每秒,数据量不是很大,大概500W级别,而且数据不会频繁更新,平均每天更新一次,请问有什么好的方案么?==这是一个典型的,短文本分词搜索的问题,简单聊聊自己的经验。 常见的文本检索方案有哪些?(1)数据...

    文章 云起君 2020-02-07 260浏览量

  • CSS-多列布局1-概述

    1、多列布局概述 通过 CSS3,您能够创建多个列来对文本进行布局 - 就像报纸那样! 2、常用属性 属性 版本 描述 columns CSS3 设置或检索对象的列数和每列的宽度。复合属性 column-width CSS3 设置或检索对象每列的宽度 column-count C...

    文章 java小工匠 2017-08-18 612浏览量

  • js中match的用法

    match() 方法将检索字符串 stringObject,以找到一个或多个与 regexp 匹配的文本。这个方法的行为在很大程度上有赖于 regexp 是否具有标志 g。 一、如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有...

    文章 ke_ry 2017-07-03 617浏览量

  • dom的常见属性和方法

    牢记:js脚本应该只用来充实文档内容 要避免使用DOM技术创建核心内容 需要对文档现有信息进行检索的时候下面DOM方法最有用: getElementById getElementByTagName getAttribute 元素.firstChild.nodeValue 元素的第一个节点...

    文章 codingcoge 2018-02-07 579浏览量

  • 《大规模元搜索引擎技(1)》一1.2 文本检索概述

    本节书摘来自华章出版社《大规模元搜索引擎技(1)》一书中的第1章,第1.2节,作者[美]孟卫一(Weiyi Meng)纽约州立大学宾汉姆顿分校於德(Clement T.Yu)伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看 1.2 文本检索概述 对于给定的查询,文本(信...

    文章 华章计算机 2017-05-02 658浏览量

  • 《大规模元搜索引擎技》——1.2 文本检索概述

    本节书摘来自华章出版社《大规模元搜索引擎技》一书中的第1章,第1.2节,作者 [美]孟卫一(Weiyi Meng), 纽约州立大学, 宾汉姆顿分校於德(Clement T.Yu),伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2 文本检索概述 对于给定的查询,...

    文章 华章计算机 2017-05-02 1484浏览量

  • Vim 快捷键速查表

    Vim 编辑器是一个基于命令行的工具,是传奇编辑器 vi 的增强版。尽管图形界面的富文本编辑有很多,但是熟悉 Vim 对于每一位 Linux 的使用者都能有所帮助——无论你是经验丰富的系统管理员,还是刚上手树莓派的新手用户。 这个轻量级的编辑器是个非常强大的工具。在有经验的使用者手中,它能完成不可...

    文章 知与谁同 2017-05-27 1315浏览量

  • lucene全文检索基础

    全文检索是一种将文件中所有文本与检索项匹配的文字资料检索方法.比如用户在n个小说文档中检索某个关键词,那么所有包含该关键词的文档都返回给用户。那么应该从哪里入手去实现一个全文检索系统?相信大家都听说过apache的开源项目lucene,下面就从零开始揭开全文检索的面纱。 1.信息检索整体流程...

    文章 姚攀 2015-12-15 514浏览量

  • 「最有用」的特殊大数据:一文看懂文本信息系统的概念框架及功能

    导读:作为一种特殊的大数据,文本数据泛指各种以自然语言形式存在的数据。 目前,我们正处在一个以大数据与人工智能技术为核心的新的工业革命时代,其主要特征是大量各种可利用的数据可以视为一种特殊的生产资料,经过高效的智能数据分析与挖掘以及机器学习等人工智能技术处理后,这些数据可以产生巨大价值,创造智能。...

    文章 初商 2019-09-21 1431浏览量

  • 阿里云开发者社区 x 达摩院 x计算平台事业部 大数据 + AI向量检索专场Meetup回顾(内含讲师PPT领取)

    ​数据形态的衍生和数据规模的磅礴增长,让向量检索成为了 AI 技术链路中重要一环;数据本身是没有意义的,唯有发现、检索、匹配与运用才能赋予它们生机。2021年3月20日,由达摩院领航,阿里云开发者社区及阿里云计算平台事业部支持的 大数据+AI meetup 向量检索专场,在北京重磅启航,开启了20...

    文章 安妮Annie 2021-03-24 44浏览量

  • 网页中的CSS换行控制

    在进行DivCSS布局时,需要对文本进行控制,向大家介绍一下,CSS中控制换行的四种属性。一、white-space  可以实现HTML中PRE标签的效果,以及单元格的noWrap效果。语法: white-space : normal | pre | nowrap  取值:  normal: 默认...

    文章 candy-yun 2014-11-05 665浏览量

  • 《中国人工智能学会通讯》——7.8 什么是机器阅读理解

    7.8 什么是机器阅读理解 阅读理解对大部分人来说都不陌生。我们大都参加过高考,在大学里可能也都参加过四 / 六级英语考试,在语文、历史、地理等考试中阅读理解的题型经常出现。维基百科对于阅读理解的定义是:阅读理解是一种阅读一段文本并且对其进行分析,并能理解其中的意思的能力。而机器阅读理解顾名思义就...

    文章 知与谁同 2017-09-04 1261浏览量

  • Python 正则表达式(字符)详解

     Python正则表达式 — 简介   ​     其实正则表达式这种技术,源于一个很简单的问题:      如何通过变成使得计算机具有在文本中检索某种模式的能力?   ​     而正则表达式为通过编程实现高级的文本模式匹配、抽取、与/或文本形式的搜索和替换提供了基础。 1、正则表达式    正...

    文章 jamesjoshuasss 2017-03-01 1038浏览量

  • 档案大数据来袭

    据统计,我国“十一五”末馆藏档案已达到39264万卷(件)。随着社会活动快速加强、网络信息化日益普遍,移动互联、社交网络、电子商务大大拓展了网络的疆界和应用领域,悄无声息,大数据时代已经来临。我国的档案数据广泛存在于政府、企业的各行各业。我们正走向我国的档案大数据时代。 档案大数据的产生 过去,...

    文章 小旋风柴进 2017-05-02 2322浏览量

  • 淘宝推荐、视频搜索背后的检索技术竟是它!深度揭秘达摩院向量检索引擎Proxima

    作者 | 大沙,鹤冲,阿里巴巴达摩院机器智能实验室 资深技术专家 来源 | 阿里技术公众号人工智能,简称 AI,是计算机发明时就存在的一个技术领域。它的一大核心特点就是可以类人脑地辅助人类工作。其通过一系列数学的方法,如概率论、统计、线性代数等,分析和设计出能让计算机自动学习的算法。如下图所示,...

    文章 开发者小助手_LS 2021-03-05 1037浏览量

  • 阿里巴巴淘系开源首个多模态直播服饰检索数据集

    阿里巴巴淘系技术部与北京大学前沿计算研究中心CVDA实验室、英国爱丁堡大学等合作,正式开源业界首个大规模的多模态直播服饰检索数据集(Watch and Buy),以推动视频多模态检索技术的研究。此前,依托该数据集举办的第一届淘宝直播商品识别大赛完美落幕,近2000支队伍参加了比赛,涌现了一批检索创...

    文章 淘系技术 2020-09-16 448浏览量

  • Lucene 定义

      lucene     (1)是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构.     (2)它提供了完整的查询引擎和索引引擎,部分文本分析引擎。              本文转自大数据躺过的坑博客园博客,原文链接:http://www.cn...

    文章 技术小哥哥 2017-11-05 823浏览量

  • 比Faiss更胜一筹?达摩院自主研发的向量检索引擎Proxima首次公开!

    【作者】王绍翾(大沙) 阿里达摩院机器智能实验室 资深技术专家肖允锋(鹤冲) 阿里达摩院机器智能实验室 资深技术专家人工智能,简称 AI,是计算机发明时就存在的一个技术领域。它的一大核心特点就是可以类人脑地辅助人类工作。其通过一系列数学的方法,如概率论、统计、线性代数等,分析和设计出能让计算机自动...

    文章 安妮Annie 2021-03-04 171浏览量

  • 文本聚类(1)——概念

    什么是文本聚类 文本聚类是搜索引擎和语义web的基本技术,本文简单的文本聚类算法,对于想学搜索技 术的初学者有一定入门作用的。这里会用到TF/IDF权重,用余弦夹角计算文本相似度, 用方差计算两个数据间欧式距离,用k-means进行数据聚类等数学和统计知识. 文本聚类(Text clusteri...

    文章 skyme 2016-05-04 2871浏览量

  • 赋能阿里多业务场景,达摩院自研向量检索引擎 Proxima 公开

      人工智能,简称 AI,是计算机发明时就存在的一个技术领域。它的一大核心特点就是可以类人脑地辅助人类工作。其通过一系列数学的方法,如概率论、统计、线性代数等,分析和设计出能让计算机自动学习的算法。  如下图所示,人工智能算法可以对物理世界的人/物/场景所产生各种非结构化数据(如语音、图片、视频,...

    文章 是王大大呀 2021-03-25 115浏览量

1 2 3 4 ... 61 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT