【Python】数据分析:numpy文本数据读取+索引切片

简介: 【Python】数据分析:numpy文本数据读取+索引切片

1-1 数据导入和数组转置

  • np.loadtxt(framme,dtype='dataType',delimmiter='分隔符',skiprows=''(跳过的行数'),usecols=''需要用到的行数',unpack='Ture/Flase(是否转置)':加载文本文件数据
    V4V1P%[LEG[}[H1]5GTZ}85.png

loadtxt参数意义.png

  • numpy数组转置的是4种方法
  • np.loadtxt中的参数unpack值设置为TRUE
  • 使用数组的.T属性进行转置
  • 使用数组的transpose()方法进行转置
  • 使用numpy数组的swapaxes方法

实例如下:

import numpy as np
filepath = './doubantop250.csv'
t1 = np.loadtxt(filepath,usecols=(1,2,3),delimiter=',',dtype='float')
print(t1)
# 转置的四种方式
# first method:Set the value of parameter "unpack" —— True
t2 = np.loadtxt(filepath,usecols=(1,2,3),delimiter=',',dtype='float',unpack=True)
# second method: use the '.T' attributions of array's
t3 = t1.T
print(t3)
# third method: use the method of 'transpose'
t4 = t1.transpose()
print(t4)
# forth method: swapaxes(arguments:axes needed swapped)
t5 = t1.swapaxes(0,1)
print(t5)

运行结果:

({WK8CH9RB5F1}WS27`BTT7.png

运行结果.png

1-2 numpy数组索引与切片

import numpy as np
filename = './doubantop250.csv'
t1 = np.loadtxt(filename,delimiter=',',dtype='float',usecols=(1,2,3))
# print(t1)
# 取行操作
print(t1[0])
print(t1[0,:])
# 取连续的多行
print(t1[3:])
print(t1[3:,:])
# 取不连续的多行
print(t1[[1,3,13,19]])
print(t1[[1,2,4,6],:])
# 取列
print(t1[:,0])
# 取连续的列
print(t1[:,2:])
# 取不连续的列
print(t1[:,[1,2]])
# 取第2-5行,2-3列
# 取多个位置的交叉数据
print(t1[1:5,1:3])
# 取不相邻的位置的数据信息
print(t1[[1,4,6],[0,1,2]])

import numpy as np
filepath = './doubantop250.csv'
t1 = np.loadtxt(filepath,delimiter=',',usecols=(1,2,3))
print(t1<9.5)
t1[t1 < 9.5] = 0
print(t1[:,1])
# if-else操作
np.where(t1>=9.6,10,0)
print(t1)
# clip(m,n)把数组中小于m的替换成m,大于n的替换成n
目录
相关文章
|
19小时前
|
机器学习/深度学习 自然语言处理 TensorFlow
使用Python实现深度学习模型:语言模型与文本生成
使用Python实现深度学习模型:语言模型与文本生成
27 5
|
1天前
|
机器学习/深度学习 自然语言处理 数据挖掘
使用Python和大模型进行数据分析和文本生成
Python语言以其简洁和强大的特性,成为了数据科学、机器学习和人工智能开发的首选语言之一。随着大模型(Large Language Models, LLMs)如GPT-4的崛起,我们能够利用这些模型实现诸多复杂任务,从文本生成到智能对话、数据分析等等。在这篇文章中,我将介绍如何用Python连接和使用大模型,并通过示例展示如何在实际项目中应用这些技术。
|
2天前
|
数据采集 前端开发 JavaScript
python语言通过简单爬虫实例了解文本解析与读写
python|通过一个简单爬虫实例简单了解文本解析与读写
|
3天前
|
数据采集 机器学习/深度学习 数据可视化
利用Python和Pandas库构建高效的数据分析流程
在数据驱动的时代,数据分析已成为企业决策的关键环节。本文介绍如何利用Python编程语言及其强大的数据分析库Pandas,构建一套高效且可扩展的数据分析流程。与常规的数据分析流程不同,本文不仅涵盖数据加载、清洗、转换等基础步骤,还强调数据可视化、模型探索与评估等高级分析技巧,并通过实际案例展示如何在Python中实现这些步骤,为数据分析师提供一套完整的数据分析解决方案。
|
5天前
|
机器学习/深度学习 数据采集 数据可视化
使用Python进行数据分析涉及数据收集
【6月更文挑战第21天】使用Python进行数据分析涉及数据收集(如数据库、文件、API),数据清洗(处理缺失值、异常值和重复项),数据探索(统计摘要、可视化和相关性分析),特征工程(创建新特征和编码),模型构建(选择算法、训练与调整),模型评估(计算指标、可视化效果),结果解释(报告和可视化),以及部署与维护。此过程因项目需求而异,可能需迭代。常用库有`pandas`、`requests`、`BeautifulSoup`、`Matplotlib`等。
14 1
|
9天前
|
存储 数据挖掘 索引
Python streamlit框架开发数据分析网站并免费部署
使用Python的Streamlit框架,开发了一个在线数据分析工具,替代Excel查看设备温度CSV数据。通过pandas读取数据,matplotlib绘制图表。程序处理CSV,提取所需列,计算最大最小平均值,用户可多选查看特定数据。[GitHub](https://github.com/yigedaigua/MGHB)上有完整代码,应用已部署至Streamlit Cloud。
|
7天前
|
数据采集 数据可视化 数据挖掘
Python数据分析入门指南
Python数据分析涉及环境搭建(推荐Anaconda,含pandas和matplotlib库)。使用`pandas`读取CSV数据,如`data = pd.read_csv(&#39;data.csv&#39;)`。数据清洗包括检查缺失值(`data.isnull().sum()`)和处理异常值。然后进行数据处理,如创建新列、选择特定列及分组。利用`matplotlib`进行数据可视化,绘制直方图和散点图,以`plt.hist()`和`plt.scatter()`展示数据。
|
8天前
|
机器学习/深度学习 人工智能 算法框架/工具
Python赋能AI数据分析
Python赋能AI数据分析
23 0
|
13天前
|
机器学习/深度学习 数据采集 数据挖掘
如何用Python进行数据分析?
【6月更文挑战第13天】如何用Python进行数据分析?
109 66
|
10天前
|
数据采集 数据可视化 数据挖掘
数据挖掘实战:使用Python进行数据分析与可视化
在大数据时代,Python因其强大库支持和易学性成为数据挖掘的首选语言。本文通过一个电商销售数据案例,演示如何使用Python进行数据预处理(如处理缺失值)、分析(如销售额时间趋势)和可视化(如商品类别销售条形图),揭示数据背后的模式。安装`pandas`, `numpy`, `matplotlib`, `seaborn`后,可以按照提供的代码步骤,从读取CSV到数据探索,体验Python在数据分析中的威力。这只是数据科学的入门,更多高级技术等待发掘。【6月更文挑战第14天】
49 11