「首席架构师推荐」文本挖掘软件列表

简介: 「首席架构师推荐」文本挖掘软件列表

文本挖掘,也称为文本数据挖掘,大致相当于文本分析,是指从文本中获取高质量信息的过程。高质量的信息通常是通过设计模式和趋势通过统计模式学习等手段获得的。

文本挖掘计算机程序可从许多商业和开放源码公司和源代码获得。



Commercial

  • Amenity Analytics——开发基于云的文本分析解决方案,使用自然语言处理和机器学习,从任何非结构化数据的来源获取大规模的见解。
  • Angoss文本分析通过嵌入式提供实体和主题提取、主题分类、情感分析和文档摘要功能
  • AUTINDEX -是Saarbrucken应用信息科学研究所开发的一个基于复杂语言学的商业文本挖掘软件包。
  • Autonomy -文本挖掘,聚类和分类软件
  • Averbis 提供文本分析,聚类和分类软件,以及术语管理和企业搜索
  • Basis Technology 提供一套文本分析模块来识别语言,支持在20多种语言中搜索,提取实体,并有效地搜索和翻译实体。
  • Clarabridge文本分析(文本挖掘)软件,包括自然语言(NLP),机器学习,集群和分类。提供SaaS,托管和现场文本和情感分析,使公司能够收集,听取,分析,并采取行动,对客户的声音(VOC)从外部(Twitter, Facebook, Yelp!内部资源(呼叫中心notes、CRM、企业数据仓库、BI、调查、邮件等)。
  • DigitalMR -社会媒体听力和文本+图像分析工具的市场研究
  • Endeca技术-提供分析和集群非结构化文本的软件。
  • FICO评分-领先的分析供应商。
  • General Sentiment -社交智能平台,利用自然语言处理,发现品牌粉丝与传统电视节目粉丝在社交媒体上的亲密关系。独立的文本分析,以获取社会知识库的数十亿主题存储到2004年。
  • IBM语言软件——用于文本分析的IBM套件(工具和运行时)。
  • IBM SPSS—Modeler Premium(以前称为IBM SPSS Modeler和IBM SPSS文本分析)的提供者,它包含高级基于nlp的文本分析功能(多语言情感、事件和事实提取),可以与预测建模结合使用。调查文本分析提供了使用基于nlp的功能对调查响应进行分类的能力,以便进行进一步的分析或报告。
  • Inxight -提供文本分析、搜索和非结构化可视化技术。(Inxight被SAP AG于2008年收购的Business Objects收购)。
  • 语言计算机公司-文本提取和分析工具,可在多种语言。
  • Lexalytics -提供一个文本分析引擎,用于社交媒体监控、客户语音、调查分析和其他应用。突出引擎。该软件提供了将非结构化、基于文本的分析输出与结构化数据合并的独特功能,从而为改进的预测模型和关联分析提供额外的预测变量。
  • LexisNexis -基于广泛的新闻和公司信息内容集提供商业智能解决方案。LexisNexis收购DataOps进行搜索
  • Linguamatics 提供基于自然语言处理(NLP)的企业文本挖掘和文本分析软件,I2E,用于高价值的知识发现和决策支持。
  • Luminoso -经过麻省理工学院媒体实验室十多年的自然语言处理(NLP)、机器学习和人工智能研究,开发出企业反馈和文本分析解决方案
  • Mathematica -为文本对齐、模式匹配、聚类和语义分析提供内置工具。参见Wolfram语言,Mathematica的编程语言。
  • MATLAB提供文本分析工具箱,用于导入文本数据,将其转换为数字形式,用于机器和深度学习、情绪分析和分类任务
  • MeaningCloud 以前被称为text talytics:一组文本分析api,以SaaS模式和内部环境提供,完全可定制,以获得最高的精确度,并且由于其SDKs和插件,非常容易集成到任何系统或环境中。
  • Medallia -提供一个记录系统的调查,社会,文字,书面和在线反馈。
  • Megaputer Intelligence—从大量文本和结构化数据中获取可操作的知识,包括自然语言处理(NLP)、机器学习、情感分析、实体提取、聚类和分类。
  • NetOwl -多语言文本和实体分析产品套件,包括实体提取、链接和事件提取、情感分析、地理标记、名称翻译、名称匹配和身份解析等。
  • PoolParty Semantic Suite允许您开发一个知识图——从而构建并表示您的优先级知识域。高性能的PoolParty服务按照复杂的文本挖掘算法提取实体和术语。
  • RapidMiner及其文本处理扩展-数据和文本挖掘软件。
  • SAS - SAS文本挖掘和字谜;用于信息管理的商业文本分析、自然语言处理和分类软件。
  • Semantria -通过API和Excel插件提供服务。它是文本分析软件Lexalytics的一个分支,但不同之处在于它是通过API和Excel插件提供的,而且它包含了更大的知识库并使用深度学习。
  • Sketch Engine -一个语料库管理器和分析软件,提供从上传的文本或网络创建文本语料库,包括词性标注和引理或检测一个特定的网站
  • Smartlogic -信号;内容智能平台包含商业文本分析、自然语言处理、基于规则的分类、本体/分类法建模和用于信息管理的信息可视化软件。
  • StatSoft -为预测分析解决方案提供了一个可选的扩展。
  • Sysomos -提供社交媒体分析软件平台,包括文本分析和在线消费者对话的情绪分析。
  • WordStat -用于分析大量文本数据的QDA Miner的内容分析和文本挖掘附加模块。

Open source

  • Carrot2 -文本和搜索结果聚类框架。
  • Coding Analysis Toolkit - CAT是一个免费的、基于web的、开源的文本分析服务。在团队中加载、编码和注释文本数据。衡量评估者之间的可靠性,并判断程序员之间的差异。报告代码和编码器的准确性。通过系统迭代训练更好的程序员。
  • GATE-文本工程的通用架构,一个自然语言处理和语言工程的开源工具箱。
  • Gensim 大型主题建模和从非结构化文本(Python)中提取语义信息。
  • Natural Language Toolkit (NLTK)——一套用于Python编程语言的符号和统计自然语言处理(NLP)的库和程序。
  • OpenNLP 自然语言处理。
  • Orange及其文本挖掘附加组件。
  • Stanbol 一个针对语义内容管理的开源文本挖掘引擎。
  • 编程语言R 为包tm中的文本挖掘应用程序提供了一个框架。自然语言处理任务视图包含tm和其他文本挖掘库包
  • KNIME 文本处理扩展。
  • The PLOS 文本挖掘集合
  • Voyant Tools 一个基于web的文本分析环境,创建为一个学术项目。
  • spaCy - Python的开源自然语言处理库

参考文献

  • ^阿尔巴,大卫(2015年2月12日)。“帮助你实时分析Twitter聊天记录的初创公司”。《连线》杂志。2015年3月4日检索。
  • ^史蒂夫·洛尔(2014年6月27日)。“美国-德国通过社交媒体镜头比赛。《纽约时报》。2015年3月4日检索。
  • ^“文本分析工具箱”。www.mathworks.com。检索2019-07-10。
  • ^“文本分析与素描引擎”。素描引擎。词汇计算CZ s.r.o检索于2018年1月17日。
  • ^ tm包简介:R语言文本挖掘
  • ^ CRAN任务视图:自然语言处理
  • ^“目录:文本挖掘”。PLOS。

外部链接PLO

  • Mashape上的文本挖掘api[永久死链接]
  • 可编程Web上的文本挖掘api
  • 用于研究的文本分析门户中的文本挖掘api
相关文章
|
7月前
|
存储 机器学习/深度学习 缓存
软考软件评测师——计算机组成与体系结构(分级存储架构)
本内容全面解析了计算机存储系统的四大核心领域:虚拟存储技术、局部性原理、分级存储体系架构及存储器类型。虚拟存储通过软硬件协同扩展内存,支持动态加载与地址转换;局部性原理揭示程序运行特性,指导缓存设计优化;分级存储架构从寄存器到外存逐级扩展,平衡速度、容量与成本;存储器类型按寻址和访问方式分类,并介绍新型存储技术。最后探讨了存储系统未来优化趋势,如异构集成、智能预取和近存储计算等,为突破性能瓶颈提供了新方向。
|
10月前
|
资源调度 监控 调度
基于SCA的软件无线电系统的概念与架构
软件通信体系架构(SCA)是基于软件定义无线电(SDR)思想构建的开放式、标准化和模块化平台,旨在通过软件实现通信功能的灵活配置。SCA起源于美军为解决“信息烟囱”问题而推出的联合战术无线电系统(JTRS),其核心目标是提升多军种联合作战通信能力。 上海介方信息公司的OpenSCA操作环境严格遵循SCA4.1/SRTF标准,支持高集成、嵌入式等场景,适用于军用通信、雷达等领域。 SCA体系包括目标平台资源层(TRL)、环境抽象层(EAL)、SRTF操作环境(OE)及应用层(AL)。其中,SRTF操作环境包含操作系统、运行时环境(RTE)和核心框架(CF),提供波形管理、资源调度等功能。
|
7月前
|
运维 监控 数据可视化
一文详解:工业软件“低代码开发平台”技术架构研究与分析
本文围绕工业软件低代码开发平台的机遇与挑战,提出基于自动化引擎的技术架构,由工具链、引擎库、模型库、组件库、工业数据网关和应用门户组成。文章分析了其在快速开发、传统系统升级中的应用模式及价值,如缩短创新周期、降低试错成本、解决资源缺乏和提升创新可复制性,为我国工业软件产业发展提供参考和支持。
|
9月前
|
存储 人工智能 自然语言处理
Cursor这类编程Agent软件的模型架构与工作流程
编程Agent的核心是一个强大的大语言模型,负责理解用户意图并生成相应的代码和解决方案。这些模型通过海量文本和代码数据的训练,掌握了广泛的编程知识和语言理解能力。
977 1
|
运维 负载均衡 Shell
控制员工上网软件:高可用架构的构建方法
本文介绍了构建控制员工上网软件的高可用架构的方法,包括负载均衡、数据备份与恢复、故障检测与自动切换等关键机制,以确保企业网络管理系统的稳定运行。通过具体代码示例,展示了如何实现这些机制。
267 63
|
12月前
|
存储 缓存 关系型数据库
社交软件红包技术解密(六):微信红包系统的存储层架构演进实践
微信红包本质是小额资金在用户帐户流转,有发、抢、拆三大步骤。在这个过程中对事务有高要求,所以订单最终要基于传统的RDBMS,这方面是它的强项,最终订单的存储使用互联网行业最通用的MySQL数据库。支持事务、成熟稳定,我们的团队在MySQL上有长期技术积累。但是传统数据库的扩展性有局限,需要通过架构解决。
364 18
|
监控 前端开发 数据可视化
3D架构图软件 iCraft Editor 正式发布 @icraft/player-react 前端组件, 轻松嵌入3D架构图到您的项目,实现数字孪生
@icraft/player-react 是 iCraft Editor 推出的 React 组件库,旨在简化3D数字孪生场景的前端集成。它支持零配置快速接入、自定义插件、丰富的事件和方法、动画控制及实时数据接入,帮助开发者轻松实现3D场景与React项目的无缝融合。
903 9
3D架构图软件 iCraft Editor 正式发布 @icraft/player-react 前端组件, 轻松嵌入3D架构图到您的项目,实现数字孪生
|
Kubernetes 前端开发 分布式数据库
工作中常见的软件系统部署架构
在实际应用中,会根据项目的具体需求、规模、性能要求等因素选择合适的部署架构,或者综合使用多种架构模式来构建稳定、高效、可扩展的系统。
1338 2
|
消息中间件 Kafka Java
Spring 框架与 Kafka 联姻,竟引发软件世界的革命风暴!事件驱动架构震撼登场!
【8月更文挑战第31天】《Spring 框架与 Kafka 集成:实现事件驱动架构》介绍如何利用 Spring 框架的强大功能与 Kafka 分布式流平台结合,构建灵活且可扩展的事件驱动系统。通过添加 Spring Kafka 依赖并配置 Kafka 连接信息,可以轻松实现消息的生产和消费。文中详细展示了如何设置 `KafkaTemplate`、`ProducerFactory` 和 `ConsumerFactory`,并通过示例代码说明了生产者发送消息及消费者接收消息的具体实现。这一组合为构建高效可靠的分布式应用程序提供了有力支持。
288 0
|
测试技术
软件设计与架构复杂度问题之区分软件维护、演进和保护(苟且)如何解决
软件设计与架构复杂度问题之区分软件维护、演进和保护(苟且)如何解决

热门文章

最新文章