文档备案控制台

开发者社区大数据文章正文

基于词云图+Kmeans聚类+LDA主题分析+社会网络语义分析对大唐不夜城用户评论进行分析(下)

2024-02-03 833

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 基于词云图+Kmeans聚类+LDA主题分析+社会网络语义分析对大唐不夜城用户评论进行分析

基于词云图+Kmeans聚类+LDA主题分析+社会网络语义分析对大唐不夜城用户评论进行分析（上）：https://developer.aliyun.com/article/1434918

2.3TF-IDF+Kmeans聚类分析

首先还是导入用到的第三方库以及数据

编写一个中文分词的函数

对分词结果进行词向量化并降维到1000维同时进行标准化操作

使用TF-IDF提权关键词并获取权重

使用Kmeans进行聚类，关于K的确定，我是试了几个数字，发现还是2最合适。

最后将聚类结果进行可视化

2.4LDA主题分析

首先还是导入我们的数据

在中文分词之前，我们先删除重复数据并且将评论长度小于10的进行剔除，从结果发现，我们剔除了40条评论。

中文分词

确定最佳主题个数K值

从图可看出，8是最低的点，但是8个主题明显太多，会出现过拟合，所以还剩下3和5。最后经过主题可视化我们最终确定了3是最佳的K值。

可以使用summary查看模型信息

Lda主题可视化

最后我们也可以将每个主题的关键词进行词云图展示

运行完上面的代码会生成3个html页面

主题0词云图

主题1词云图

主题2词云图

2.5社会语义网络分析

这里我们主要使用到的工具是ROSTCM6，关于软件的安装及使用可参考我的博文

ROSTCM6软件下载及语义网络分析详细操作教程（附网盘链接）_艾派森的博客-CSDN博客

三、总结

本次实验我们使用了词云图、情感分析、LDA主题分析、TF-IDF+Kmeans、社会网络语义分析等对大唐不夜城的评论进行了分析。关于博文中的源码大家可以关注派森小木屋公众号进入粉丝群领取，如对文章有疑惑，请评论区留言。

文章标签：

数据挖掘

自然语言处理

数据可视化

关键词：

网络分析

分析网络

lda网络语义分析

艾派森_

目录

相关文章

sysin

|

9月前

|

数据采集监控网络安全

VMware Cloud Foundation Operations for Networks 9.0.1.0 发布 - 云网络监控与分析

VMware Cloud Foundation Operations for Networks 9.0.1.0 发布 - 云网络监控与分析

sysin

492 3 3

VMware Cloud Foundation Operations for Networks 9.0.1.0 发布 - 云网络监控与分析

Q一个好的名字容易让人记住你2483558220

|

9月前

|

机器学习/深度学习大数据关系型数据库

基于python大数据的青少年网络使用情况分析及预测系统

本研究基于Python大数据技术，构建青少年网络行为分析系统，旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据，运用机器学习实现精准行为预测与实时干预，推动数字治理向“数据驱动”转型，为家庭、学校及政府提供科学决策支持，助力青少年健康上网。

Q一个好的名字容易让人记住你2483558220

745 2 2

站大爷

|

11月前

|

数据采集存储数据可视化

Python网络爬虫在环境保护中的应用：污染源监测数据抓取与分析

在环保领域，数据是决策基础，但分散在多个平台，获取困难。Python网络爬虫技术灵活高效，可自动化抓取空气质量、水质、污染源等数据，实现多平台整合、实时更新、结构化存储与异常预警。本文详解爬虫实战应用，涵盖技术选型、代码实现、反爬策略与数据分析，助力环保数据高效利用。

站大爷

568 0 0

sysin

|

监控安全 Linux

Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析

Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析

sysin

543 2 2

Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析

游客mncnacie65oem

|

运维监控安全

如何高效进行网络质量劣化分析与流量回溯分析？-AnaTraf

在数字化时代，网络质量分析与流量回溯对保障业务运行至关重要。网络拥塞、丢包等问题可能导致业务中断、安全隐患及成本上升。传统工具常缺乏细粒度数据，难以溯源问题。流量回溯分析可还原现场，助力精准排障。AnaTraf网络流量分析仪作为专业工具，能高效定位问题，提升团队响应力，降低运营风险。

游客mncnacie65oem

525 10 10

如何高效进行网络质量劣化分析与流量回溯分析？-AnaTraf

Echo_Wish

|

大数据

“你朋友圈的真面目，大数据都知道！”——用社交网络分析看透人情世故

“你朋友圈的真面目，大数据都知道！”——用社交网络分析看透人情世故

Echo_Wish

600 16 17

sysin

|

机器学习/深度学习运维自然语言处理

VMware Cloud Foundation Operations for Networks 9.0 发布 - 云网络监控与分析

VMware Cloud Foundation Operations for Networks 9.0 发布 - 云网络监控与分析

sysin

193 0 0

丰宝宝

|

SQL 安全网络安全

网络安全与信息安全：知识分享####

【10月更文挑战第21天】随着数字化时代的快速发展，网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性，并提供一些实用的建议，帮助读者提高自身的网络安全防护能力。 ####

丰宝宝

519 17 18

技术混子

|

SQL 安全网络安全

网络安全与信息安全：关于网络安全漏洞、加密技术、安全意识等方面的知识分享

随着互联网的普及，网络安全问题日益突出。本文将从网络安全漏洞、加密技术和安全意识三个方面进行探讨，旨在提高读者对网络安全的认识和防范能力。通过分析常见的网络安全漏洞，介绍加密技术的基本原理和应用，以及强调安全意识的重要性，帮助读者更好地保护自己的网络信息安全。

技术混子

383 10 10

历年考试不作弊

|

存储 SQL 安全

网络安全与信息安全：关于网络安全漏洞、加密技术、安全意识等方面的知识分享

随着互联网的普及，网络安全问题日益突出。本文将介绍网络安全的重要性，分析常见的网络安全漏洞及其危害，探讨加密技术在保障网络安全中的作用，并强调提高安全意识的必要性。通过本文的学习，读者将了解网络安全的基本概念和应对策略，提升个人和组织的网络安全防护能力。

历年考试不作弊

1057 9 9

热门文章

最新文章

AliOS Things SIG BLE Mesh网络的介绍和搭建

linux 下使用 tc 模拟网络延迟和丢包

yolov7论文学习——创新点解析、网络结构图

【网络奇缘】——奈氏准则和香农定理从理论到实践一站式服务|计算机网络

软考网络规划师复习第六章：基础网络实验

TCPIP vs OSI模型：网络通信的两种参考模型有哪些不同？

华为网络配置（IPSec）

如何使用 Python 和 Netmiko 自动创建网络设备 VLAN，受益颇深！

Java网络编程从入门到精通（31）：非阻塞I/O简介

【专栏】硬核干货：BGP（边界网关协议）是自治系统间交换路由信息的关键协议，用于大型网络的高效路由选择

基于python大数据的青少年网络使用情况分析及预测系统

概率神经网络的分类预测--基于PNN的变压器故障诊断（Matlab代码实现）

win10系统以太网未识别网络没有有效ip配置怎么办？

【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法（TTNRBO）优化深度信念网络（DBN）数据回归预测研究（Matlab代码实现）

配置VM网络：如何设定静态IP以访问主机IP和互联网

Python 网络请求架构——统一 SOCKS5 接入与配置管理

阿里云渠道商：怎么配置阿里云网络ACL？

Cisco IOS XRv 9000 Router IOS XR Release 7.11.2 MD - 思科 IOS XR 网络操作系统

基于灰色神经网络的预测方法

脑控网络设计方案续写

相关课程

更多

TCP/IP 网络基础

云计算工程师解析与实战-网络专家篇（体验版）

云网络白皮书-阿里云网络系列课

企业上云攻略-阿里云网络产品应用系列教程

Linux网络进阶 - TCP/IP协议及OSI七层模型

网络管理者必知-2分钟了解新出台的《网络安全法》

相关电子书

更多

可编程网络视角的网络创新研究

可编程网络和SDN3.0

开放促进创新：构建开放网络生态

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！