数据挖掘

首页 标签 数据挖掘
# 数据挖掘 #
关注
26232内容
Qwen2.5-Max:阿里通义千问超大规模 MoE 模型,使用超过20万亿tokens的预训练数据
Qwen2.5-Max是阿里云推出的超大规模MoE模型,具备强大的语言处理能力、编程辅助和多模态处理功能,支持29种以上语言和高达128K的上下文长度。
【机器学习PAI实践七】文本分析算法实现新闻自动分类
一、背景 新闻分类是文本挖掘领域较为常见的场景。目前很多媒体或是内容生产商对于新闻这种文本的分类常常采用人肉打标的方式,消耗了大量的人力资源。本文尝试通过智能的文本挖掘算法对于新闻文本进行分类。无需任何人肉打标,完全由机器智能化实现。 本文通过PLDA算法挖掘文章的主题,通过主题权重的聚类,实现新闻自动分类。包括了分词、词型转换、停用词过滤、主题挖掘、聚类等流程。
Python入门
2018年6月25日笔记 python可以做什么 多媒体应用、WEB开发、网络爬虫、人工智能与机器学习、数据分析处理、服务器运维及其他小工具 知乎链接:用python做一些有趣的事情 python的编程准则 在PowerShell中,进入python的shell,然后运行命令import this,出现下图所示。
《大规模元搜索引擎技》——1.3 搜索引擎技术概述
本节书摘来自华章出版社《大数据管理丛书》一书中的第1章,第1.3节,作者 [美]孟卫一(Weiyi Meng), 纽约州立大学, 宾汉姆顿分校於德(Clement T.Yu),伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
葡萄城控件调查报告:Spread最受欢迎,购买服务成为潮流
在葡萄城控件中文官网开通一周年之际,葡萄城联合五家经销商合作伙伴上海道宁、重庆慧都、北京哲想、一八软件网、软狗网举办了葡萄城控件调查。本次调查从2010年10月11日~2010年11月21日历时42天,得到了800多人的积极参与,现将调查结果发布如下: 分析“对葡萄城哪些控件产品感兴趣”问题的回答表明,葡萄城的两款拳头控件产品,表格控件Spread和报表控件ActiveReports最受关注,71%的参与者表示了对Spread产品的关注,55%的用户表示关注ActiveReports。
免费试用