Python 数据科学 - python基础

简介: Python 数据科学 - python基础

python基础


1.变量与数据类型


变量赋值


>>> x=5
>>> x
5
• 1
• 2
• 3

变量计算


>>> x=5
>>> x+2   #加
7
>>> x-2   #减
3
>>> x*2   #乘
10
>>> x%2   #取余
1
>>> x/float(2)   #除
2.5


类型与类型转换


#转为字符串
str()
#转为整数
int()
#转为浮点数
float()
#转为布尔值
bool()

调用帮助


>>> help(str)
• 1


2.数据类型-list


列表

>>> a='is'
>>> b='nice'
>>> my_list=['my','list',a,b]
>>> my_list2=[[4,5,6,7],[3,4,5,6]]


选择列表元素


子集
>>> my_list[1] #选择索引1对应的值
>>> my_list[-3] #选择倒数第3个索引对应的值
切片
>>> my_list[1:3] #选择索引1和2对应的值
>>> my_list[1:] #选择索引0之后对应的值
>>> my_list[:3] #选择索引3之前对应的值
>>> my_list[:] #复制列表
子集列表的列表
>>> my_list2[1][0]
>>> my_list[1][:2]


列表操作


>>> my_list+my_list
['my','list','is','nice','my','list','is','nice']
>>> my_list*2
['my','list','is','nice','my','list','is','nice']
>>> my_list>4
True


列表方法


>>> my_list.index(a) #获取某值的索引
>>> my_list.count(a) #统计某值出现的次数
>>> my_list.append('!') #追加某值
>>> my_list.remove('!') #移除某值
>>> del(my_list[0:1]) #移除某值
>>> my_list.reverse() #反转列表
>>> my_list.extend('!') #添加某值
>>> my_list.pop(-1) #移除某值
>>> my_list.insert(0,'!') #插入某值
>>> my_list.sort() #列表排序


3.数据类型-string


字符串


>>> my_string='thisStringIsAwesome'
>>> my_string
'thisStringIsAwesome'


字符串运算


>>> my_string*2
'thisStringIsAwesomethisStringIsAwesome'
>>> my_string+'Innit'
'thisStringIsAwesomeInnit'
>>> 'm' in my_string
True


字符串操作


>>> my_string[3]
>>> my_string[4:9]


字符串方法


>>> my_string.upper() #设为大写字符
>>> my_string.lower() #设为小写字符
>>> my.string.count('w') #统计某字符出现的次数
>>> my.string.replace('e','i') #替换字符
>>> my_string.strip() #清空空格


4.数据类型-tuple


创建元组


>>> tup1 = ('physics', 'chemistry', 1997, 2000)
>>> tup2 = (1, 2, 3, 4, 5 )
>>> tup3 = "a", "b", "c", "d"
>>> tup4 =() #创建空元组
>>> tup5 = (50,)


访问元组


>>> tup1[0]
physics
>>> tup2[1:3]
(2,3,4)


修改元组

元组中的元素值是不允许修改的,但我们可以对元组进行连接组合

元组中的元素值是不允许删除的,但我们可以使用del语句来删除整个元组


>>> tup1 = (12,34,56)
>>> tup2 = ('abc','xyz')
>>> tup3 = tup1 + tup2
(12,34,56,'abc','xyz')
>>> del tup3
()


5.数据类型-Dictionary


访问字典

>>> dict = {'Name': 'Zara', 'Age': 7, 'Class': 'First'}
>>> dict['Name']
Zara


修改字典


>>> dict = {'Name': 'Zara', 'Age': 7, 'Class': 'First'}
>>> dict['Age'] = 8
>>> dict['Age']
8


删除字典


>>> dict = {'Name': 'Zara', 'Age': 7, 'Class': 'First'}
>>> del dict['Name']
>>> dict.clear()
>>> del dict


6.数据类型-set


set集合用法


>>>x = set('runoob')
>>> y = set('google')
>>> x, y
(set(['b', 'r', 'u', 'o', 'n']), set(['e', 'o', 'g', 'l']))   # 重复的被删除
>>> x & y         # 交集
set(['o'])
>>> x | y         # 并集
set(['b', 'e', 'g', 'l', 'o', 'n', 'r', 'u'])
>>> x - y         # 差集
set(['r', 'b', 'u', 'n'])
相关文章
|
4月前
|
数据采集 数据可视化 大数据
Python在数据科学中的实际应用:从数据清洗到可视化的全流程解析
Python在数据科学中的实际应用:从数据清洗到可视化的全流程解析
104 1
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
Python 语言的瑰宝:数据科学中的无限潜能
在当今数字化时代,数据科学的应用已成为推动企业和学术界前进的重要力量。而Python语言,作为一门简洁、灵活且功能强大的编程语言,正日益成为数据科学领域的首选工具。本文将探讨Python语言在数据科学中的广泛应用,从数据分析到机器学习,再到人工智能。
|
4月前
|
数据采集 机器学习/深度学习 数据可视化
数据科学项目实战:完整的Python数据分析流程案例解析
【4月更文挑战第12天】本文以Python为例,展示了数据分析的完整流程:从CSV文件加载数据,执行预处理(处理缺失值和异常值),进行数据探索(可视化和统计分析),选择并训练线性回归模型,评估模型性能,以及结果解释与可视化。每个步骤都包含相关代码示例,强调了数据科学项目中理论与实践的结合。
470 2
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
使用Python进行数据科学入门指南
【8月更文挑战第6天】使用Python进行数据科学是一条充满挑战和机遇的道路。本文提供了入门指南,帮助您快速上手Python数据科学。通过实践项目和资源推荐,您将能够深入学习Python数据科学,成为一名合格的数据科学家。
|
2月前
|
机器学习/深度学习 数据采集 IDE
使用Python进行数据科学探索
【7月更文挑战第30天】通过本文,我们了解了如何使用Python进行数据科学探索的全过程,从环境搭建、数据收集、清洗、分析到机器学习应用。Python的强大功能和丰富的库使得数据科学探索变得简单而高效。希望这篇文章能为您的数据科学之旅提供有价值的参考。随着实践的深入,您将逐渐掌握更多高级技术和方法,解锁数据背后的无限潜力。
|
22天前
|
机器学习/深度学习 数据挖掘 数据处理
探索NumPy:Python数据科学的核心库
【8月更文挑战第20天】
34 0
|
2月前
|
数据采集 机器学习/深度学习 数据可视化
了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。
【7月更文挑战第5天】了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。数据预处理涉及缺失值(dropna(), fillna())和异常值处理。使用describe()进行统计分析,通过Matplotlib和Seaborn绘图。回归和分类分析用到Scikit-learn,如LinearRegression和RandomForestClassifier。
60 3
|
2月前
|
数据采集 机器学习/深度学习 数据可视化
完整的Python数据分析流程案例解析-数据科学项目实战
【7月更文挑战第5天】这是一个Python数据分析项目的概览,涵盖了从CSV数据加载到模型评估的步骤:获取数据、预处理(处理缺失值和异常值、转换数据)、数据探索(可视化和统计分析)、模型选择(线性回归)、训练与评估、优化,以及结果的可视化和解释。此流程展示了理论与实践的结合在解决实际问题中的应用。
87 1
|
3月前
|
机器学习/深度学习 自然语言处理 数据可视化
Python在数据科学中的应用与前景
本文探讨了Python在数据科学领域的广泛应用,分析了其作为数据科学首选编程语言的原因,并展望了未来的发展前景。
|
4月前
|
机器学习/深度学习 算法 前端开发
2024年8个可以提高数据科学工作效率并节省宝贵时间的Python库,2024年最新记得把每一次面试当做经验积累
2024年8个可以提高数据科学工作效率并节省宝贵时间的Python库,2024年最新记得把每一次面试当做经验积累
2024年8个可以提高数据科学工作效率并节省宝贵时间的Python库,2024年最新记得把每一次面试当做经验积累