# 数据处理

1. # 加载数据
2. import pandas as pd
4. credits_data.shape# 查看数据的维度

1. print('-------------------------------------统计量描述-------------------------------------')
2. explore = credits_data.describe(percentiles=[], include='all').T # percentiles参数是指定计算多少的分位数表
3. explore['null'] = len(credits_data) - explore['count'] # describe()函数自动计算非空值数，需要手动计算空值数
5. explore = explore[['null', 'max', 'min','mean']]
6. explore.columns = [u'空值数', u'最大值', u'最小值',u'平均值']  # 表头重命名
7. # explore.to_csv('data/项目一/credits_data统计量描述.csv')  # 保存结果
8. print('--------------------------------------空值统计--------------------------------------')
9. print(credits_data.isnull().sum())

1. #导入tmdb_5000_movies表中的数据
3. data_movies.head(2)

# 数据划分

1. x=data_L.drop("vote_average",axis=1) #自变量
2. y=data_L["vote_average"]# 因变量

1. from sklearn.model_selection import train_test_split
2. #划分数据集 训练集80%测试集20%
3. x_train, x_test, y_train, y_test = train_test_split(x,y,test_size=0.2,random_state=42)

# 数据建模

1. import numpy as np
2. import matplotlib.pyplot as plt
3. from sklearn.ensemble import RandomForestRegressor
4. from sklearn.model_selection import train_test_split
5. from sklearn.multioutput import MultiOutputRegressor
6. # #定义模型
7. regr_rf = RandomForestRegressor()
8. # 集合模型
9. regr_rf.fit(x_train, y_train)
10. # 利用预测
11. y_rf = regr_rf.predict(x_test)
12. #评价
13. print(regr_rf.score(x_test, y_test))
14. # y_rf.round(1)

# 模型评估

1. import numpy as np
2. import matplotlib.pyplot as plt
3. from sklearn.ensemble import RandomForestRegressor
4. from sklearn.model_selection import train_test_split
5. from sklearn.multioutput import MultiOutputRegressor
6. from sklearn.model_selection import train_test_split
7. x_train, x_test, y_train, y_test = train_test_split(x,y,test_size=0.2,random_state=93)
8. # #定义模型 决策树的个数设置150 树的最大深度10
9. regr_rf = RandomForestRegressor(n_estimators=150,max_depth=10,random_state=0)
10.
11. # 集合模型
12. regr_rf.fit(x_train, y_train)
13. # 利用预测
14. y_rf = regr_rf.predict(x_test)
15. #评价
16. print(regr_rf.score(x_test, y_test))

# 结果预测

|
10天前
|
Python
python对象模型

21 1
|
10天前
|

39 5
|
13小时前
|

21 10
|
8天前
|

【8月更文挑战第30天】在PHP的世界中，面向对象编程（OOP）是一块基石，它让代码更加模块化、易于管理和维护。本文将深入探讨PHP中面向对象的魔法，从类和对象的定义开始，到继承、多态性、封装等核心概念，再到实战中如何应用这些理念来构建更健壮的应用。我们将通过示例代码，一起见证PHP中OOP的魔力，并理解其背后的设计哲学。
20 5
|
9天前
|

【8月更文挑战第29天】本文将引导你了解并实践如何使用Python编程语言实现一个简单的线性回归模型。我们将通过一个实际的数据集，一步步地展示如何进行数据预处理、建立模型、训练及评估模型性能。文章旨在为初学者提供一个易于理解且实用的编程指南，帮助他们快速入门机器学习领域。
12 1
|
10天前
|

30 1
|
7天前
|

【8月更文挑战第31天】在这个数字时代，人工智能（AI）已经渗透到我们生活的方方面面。从智能助手到自动驾驶汽车，AI正在改变世界。本文将带你走进AI的世界，通过Python编程语言，一步步教你如何构建第一个机器学习模型。无论你是编程新手还是有经验的开发者，这篇文章都将为你打开新世界的大门，让你体验到创造智能程序的乐趣和成就感。所以，让我们一起开始这段激动人心的旅程吧！
8 0
|
7天前
|

Python中实现简单的线性回归模型
【8月更文挑战第31天】本文将通过Python编程语言，介绍如何实现一个简单的线性回归模型。我们将从理论出发，逐步深入到代码实现，最后通过实例验证模型的有效性。无论你是初学者还是有一定编程基础的读者，都能从中获得启发和收获。让我们一起探索线性回归的世界吧！
6 0
|
2天前
|

【9月更文挑战第4天】在数字时代的浪潮中，编程已成为一种新兴的“超能力”。Python，作为一门易于上手且功能强大的编程语言，正吸引着越来越多的学习者。本文将带领读者走进Python的世界，从零基础出发，逐步深入，探索这门语言的独特魅力和广泛应用。通过具体代码示例，我们将一起解锁编程的乐趣，并理解如何利用Python解决实际问题。无论你是编程新手还是希望提升技能的开发者，这篇文章都将为你打开一扇通往高效编程的大门。
36 21
|
3天前
|

【9月更文挑战第3天】本文旨在通过深入浅出的方式，带领读者领略Python编程语言的魅力。我们将从基本语法入手，逐步深入至高级特性，最终通过实战案例将理论知识与实践操作相结合。无论你是编程新手还是有一定经验的开发者，这篇文章都将为你提供有价值的见解和技巧。
30 10

DDNS