Python 数据科学 - python基础

简介: Python 数据科学 - python基础

python基础


1.变量与数据类型


变量赋值


>>> x=5
>>> x
5
• 1
• 2
• 3

变量计算


>>> x=5
>>> x+2   #加
7
>>> x-2   #减
3
>>> x*2   #乘
10
>>> x%2   #取余
1
>>> x/float(2)   #除
2.5


类型与类型转换


#转为字符串
str()
#转为整数
int()
#转为浮点数
float()
#转为布尔值
bool()

调用帮助


>>> help(str)
• 1


2.数据类型-list


列表

>>> a='is'
>>> b='nice'
>>> my_list=['my','list',a,b]
>>> my_list2=[[4,5,6,7],[3,4,5,6]]


选择列表元素


子集
>>> my_list[1] #选择索引1对应的值
>>> my_list[-3] #选择倒数第3个索引对应的值
切片
>>> my_list[1:3] #选择索引1和2对应的值
>>> my_list[1:] #选择索引0之后对应的值
>>> my_list[:3] #选择索引3之前对应的值
>>> my_list[:] #复制列表
子集列表的列表
>>> my_list2[1][0]
>>> my_list[1][:2]


列表操作


>>> my_list+my_list
['my','list','is','nice','my','list','is','nice']
>>> my_list*2
['my','list','is','nice','my','list','is','nice']
>>> my_list>4
True


列表方法


>>> my_list.index(a) #获取某值的索引
>>> my_list.count(a) #统计某值出现的次数
>>> my_list.append('!') #追加某值
>>> my_list.remove('!') #移除某值
>>> del(my_list[0:1]) #移除某值
>>> my_list.reverse() #反转列表
>>> my_list.extend('!') #添加某值
>>> my_list.pop(-1) #移除某值
>>> my_list.insert(0,'!') #插入某值
>>> my_list.sort() #列表排序


3.数据类型-string


字符串


>>> my_string='thisStringIsAwesome'
>>> my_string
'thisStringIsAwesome'


字符串运算


>>> my_string*2
'thisStringIsAwesomethisStringIsAwesome'
>>> my_string+'Innit'
'thisStringIsAwesomeInnit'
>>> 'm' in my_string
True


字符串操作


>>> my_string[3]
>>> my_string[4:9]


字符串方法


>>> my_string.upper() #设为大写字符
>>> my_string.lower() #设为小写字符
>>> my.string.count('w') #统计某字符出现的次数
>>> my.string.replace('e','i') #替换字符
>>> my_string.strip() #清空空格


4.数据类型-tuple


创建元组


>>> tup1 = ('physics', 'chemistry', 1997, 2000)
>>> tup2 = (1, 2, 3, 4, 5 )
>>> tup3 = "a", "b", "c", "d"
>>> tup4 =() #创建空元组
>>> tup5 = (50,)


访问元组


>>> tup1[0]
physics
>>> tup2[1:3]
(2,3,4)


修改元组

元组中的元素值是不允许修改的,但我们可以对元组进行连接组合

元组中的元素值是不允许删除的,但我们可以使用del语句来删除整个元组


>>> tup1 = (12,34,56)
>>> tup2 = ('abc','xyz')
>>> tup3 = tup1 + tup2
(12,34,56,'abc','xyz')
>>> del tup3
()


5.数据类型-Dictionary


访问字典

>>> dict = {'Name': 'Zara', 'Age': 7, 'Class': 'First'}
>>> dict['Name']
Zara


修改字典


>>> dict = {'Name': 'Zara', 'Age': 7, 'Class': 'First'}
>>> dict['Age'] = 8
>>> dict['Age']
8


删除字典


>>> dict = {'Name': 'Zara', 'Age': 7, 'Class': 'First'}
>>> del dict['Name']
>>> dict.clear()
>>> del dict


6.数据类型-set


set集合用法


>>>x = set('runoob')
>>> y = set('google')
>>> x, y
(set(['b', 'r', 'u', 'o', 'n']), set(['e', 'o', 'g', 'l']))   # 重复的被删除
>>> x & y         # 交集
set(['o'])
>>> x | y         # 并集
set(['b', 'e', 'g', 'l', 'o', 'n', 'r', 'u'])
>>> x - y         # 差集
set(['r', 'b', 'u', 'n'])
相关文章
|
26天前
|
机器学习/深度学习 数据可视化 数据处理
从基础到进阶:探索Python在数据科学中的应用
【10月更文挑战第18天】从基础到进阶:探索Python在数据科学中的应用
39 1
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
Python 数据分析:从零开始构建你的数据科学项目
【10月更文挑战第9天】Python 数据分析:从零开始构建你的数据科学项目
53 2
|
2月前
|
机器学习/深度学习 数据可视化 数据挖掘
探索Python的奥秘:数据科学中的利器
本文将深入探讨Python编程语言在数据科学领域的强大应用。通过简洁易懂的语言,我们将解析Python的核心概念、流行库以及在实际项目中的应用,帮助您理解为何Python成为数据科学家的首选工具。
59 0
|
9天前
|
机器学习/深度学习 数据采集 数据可视化
Python在数据科学中的应用:从入门到实践
本文旨在为读者提供一个Python在数据科学领域应用的全面概览。我们将从Python的基础语法开始,逐步深入到数据处理、分析和可视化的高级技术。文章不仅涵盖了Python中常用的数据科学库,如NumPy、Pandas和Matplotlib,还探讨了机器学习库Scikit-learn的使用。通过实际案例分析,本文将展示如何利用Python进行数据清洗、特征工程、模型训练和结果评估。此外,我们还将探讨Python在大数据处理中的应用,以及如何通过集成学习和深度学习技术来提升数据分析的准确性和效率。
|
9天前
|
机器学习/深度学习 数据可视化 数据处理
Python数据科学:从基础到实战
Python数据科学:从基础到实战
18 1
|
20天前
|
机器学习/深度学习 数据可视化 数据处理
Python在数据科学中的应用###
本文探讨了Python语言在数据科学领域的广泛应用及其重要性。通过分析Python的简洁语法、强大的库支持和跨平台特性,阐述了为何Python成为数据科学家的首选工具。文章还介绍了Python在数据处理、分析和可视化方面的具体应用实例,展示了其在提升工作效率和推动科学研究方面的巨大潜力。最后,讨论了未来Python在数据科学领域的发展趋势和挑战。 ###
|
23天前
|
机器学习/深度学习 分布式计算 数据可视化
Python在数据科学中的应用与挑战
本文探讨了Python编程语言在数据科学领域的广泛应用及其面临的主要挑战。Python因其简洁的语法、强大的库支持和活跃的社区,已成为数据科学家的首选工具。然而,随着数据量的激增和复杂性的增加,Python也面临着性能瓶颈、内存管理等问题。本文将通过具体案例分析,展示Python在数据处理、分析和可视化方面的优势,同时讨论如何克服其在大规模数据处理中的局限性,为读者提供实用的解决方案和优化建议。
|
1月前
|
JSON 数据可视化 API
玩转数据科学:Python实战分析天气预报变动趋势
【10月更文挑战第1天】随着气候变化对日常生活的影响日益显著,理解和预测天气模式变得越来越重要。本文将引导您如何使用Python来抓取和分析天气预报数据,从而揭示天气变化的趋势。我们将介绍从获取公开气象API的数据到清洗、处理以及可视化整个过程的技术方法。
169 2
|
2月前
|
机器学习/深度学习 数据可视化 TensorFlow
探索Python在数据科学中的应用
这篇文章深入探讨了Python编程语言在数据科学领域的强大应用。从数据处理、分析到可视化,再到机器学习和深度学习,Python因其丰富的库和框架而成为数据科学家的首选工具。文章不仅介绍了Python的基本语法和数据结构,还详细讨论了如何使用Pandas进行数据清洗和预处理,以及NumPy和SciPy在数值计算中的重要性。此外,文章还涵盖了使用Matplotlib和Seaborn进行数据可视化的技巧,以及Scikit-learn和TensorFlow在构建预测模型中的应用。通过综合运用这些工具,数据科学家能够更有效地分析大量复杂的数据集,从而洞察趋势、模式和关联性,支持决策制定和策略优化。
49 2
|
2月前
|
数据采集 机器学习/深度学习 数据可视化
Python 在数据科学中的应用
这篇文章将深入探讨 Python 在数据科学中的多种应用,包括数据清洗、数据分析、可视化及机器学习。我们将通过实例展示如何利用 Python 的强大库和工具,如 Pandas、NumPy、Matplotlib、Seaborn 以及 Scikit-learn,来高效地进行数据处理与分析。无论您是初学者还是有经验的开发者,这篇文章都能为您提供宝贵的见解和实用技巧。