python机器学习预测学习笔记(有点问题)

简介: python机器学习预测学习笔记(有点问题)
# -*- coding: utf-8 -*-
"""
Created on Wed May 24 17:19:23 2017
@author: yunjinqi 
E-mail:yunjinqi@qq.com 
Differentiate yourself in the world from anyone else.
"""
import pandas as pd
from sklearn.tree import DecisionTreeRegressor  
from sklearn.ensemble import RandomForestRegressor  
import numpy as np  
data=pd.read_csv('C:/Users/HXWD/Desktop/m9000.csv',encoding='gbk')
data.head()
len(data)
data['ret1']=(data['收盘价']-data['收盘价'].shift(1))/data['收盘价'].shift(1)
data['ret']=data['ret1'].shift(-1)
del data['ret1']
data=data[:len(data)-1]
data['ret']
data=data.fillna(0)
df_train=data.ix[::,list(range(7,31))]
df_target=data.ix[::,31]
value=[]
predict_ret=[]
for i in range(len(df_train)):
    if i>300:
        rf=RandomForestRegressor()   
        train=np.array(df_train[i-300:i])
        #print(train)
        target=np.array(df_target[i-300:i])
        rf.fit(train,target)#进行模型的训练  
        aaa=np.array(df_train.ix[i,::])
        aab=list(df_train.ix[i,::])
        a=rf.predict(aaa)
        predict_ret.append(float(a))
        b=df_target.ix[i,::]
        if float(a)*float(b)>=0:
            value.append(1)
        else:
            value.append(0)
value
count=0
for i in range(len(value)):
    if value[i]==1:
        count=count+1
len(value)  
print(count/len(value) )
data.ret.plot()
data.ret.mean()
predict_ret=pd.Series(predict_ret)
d1=pd.DataFrame(data['ret'],)
d1
d1.to_csv('预测.csv')
predict_ret


目录
相关文章
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据科学实战:从Pandas到机器学习
Python数据科学实战:从Pandas到机器学习
|
1月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
98 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
1月前
|
机器学习/深度学习 数据采集 人工智能
探索机器学习:从理论到Python代码实践
【10月更文挑战第36天】本文将深入浅出地介绍机器学习的基本概念、主要算法及其在Python中的实现。我们将通过实际案例,展示如何使用scikit-learn库进行数据预处理、模型选择和参数调优。无论你是初学者还是有一定基础的开发者,都能从中获得启发和实践指导。
47 2
|
1月前
|
机器学习/深度学习 数据采集 搜索推荐
利用Python和机器学习构建电影推荐系统
利用Python和机器学习构建电影推荐系统
95 1
|
1月前
|
机器学习/深度学习 数据可视化 数据处理
掌握Python数据科学基础——从数据处理到机器学习
掌握Python数据科学基础——从数据处理到机器学习
44 0
|
1月前
|
机器学习/深度学习 数据采集 人工智能
机器学习入门:Python与scikit-learn实战
机器学习入门:Python与scikit-learn实战
55 0
|
1月前
|
机器学习/深度学习 数据采集 数据挖掘
Python在数据科学中的应用:从数据处理到模型训练
Python在数据科学中的应用:从数据处理到模型训练
|
1月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
103 4
|
10天前
|
算法
PAI下面的gbdt、xgboost、ps-smart 算法如何优化?
设置gbdt 、xgboost等算法的样本和特征的采样率
28 2
|
28天前
|
机器学习/深度学习 算法 数据挖掘
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
45 1