machine-learning-course ==========================
预备
- 学习思路(每件事情都要经过以下三步)
- 第一步:去google、百度、bing进行搜索
- 第二步:搜索不到,问同学
- 第三步:还不能解决,问老师
- python安装
- ipython notebook安装
- 科学计算包安装使用(numpy, scipy, matplotlib等)
- 在windows下使用VirtualEnv
- Unofficial Windows Binaries for Python Extension Packages
- Scipy在线教程
- Statsmodels Examples
- 数据处理包(pandas)
- git安装使用
- python学习
- Introduction to Python(ipynb)
- Python Pedia
- 廖雪峰python2.7教程
- 实验楼(Python研发工程师)
- 高级正则表达式技术(Python版)
- 常用正规表达式
- Learn X in Y minutes
- Practical Business Python
- Python交互式教程可直接在网页上执行输入好的程序,通过对比预期结果和实际执行结果进行学习
- Python Seminar Course at UC Berkeley (AY 250)
- Materials for teaching the Python FUNdamentals workshop at UC Berkeley's D-lab
- Python开发指南:最佳实践精选
- 开始使用 Python 开发 Web 应用(学习步骤)
- Python 开发工具集:关于文档、测试、调试、程序的优化和分析
- Introduction to Python for Data Science
- Intermediate Python for Data Science
- Python codecademy
- 云主机
- ubuntu安装学习
- [ubuntu安装]
- [linux命令]
- 情感分析(sentiment analysis, opinion mining, etc.)
- Basic Sentiment Analysis with Python(blog)
- Basic Sentiment Analysis with Python(ipynb)
- Sentiment analysis using machine learning techniques
- Sentiment Analysis
- ga-students/DATSF11
- sentiment analysis step by step
- Happy:Python编写的一个情感分析库
- 网络爬虫(crawler)
- 抓取网页的含义和URL基本构成
- 利用urlib2通过制定的url抓取网页内容
- 网络爬虫异常处理和HTTP状态码的分类
- Opener与Handler的介绍和实例应用
- urllib2的使用细节与抓站技巧
- 一个简单的百度贴吧的小爬虫
- Python中的正则表达式教程
- 糗事百科的网络爬虫(v0.3)源码及解析(简化更新)
- 百度贴吧的网络爬虫(v0.4)源码及解析
- 一个爬虫的诞生全过程(以山东大学绩点运算为例)
- 亮剑!爬虫框架小抓抓Scrapy闪亮登场!
- 爬虫框架Scrapy的第一个爬虫示例入门教程
- 爬虫结合SqlmapApi判断注入
- Web Scraping Framework(grab)
- Selenium定向爬取海量精美图片及搜索引擎杂谈 可以了解Python简单爬取图片的一些思路和方法;学习Selenium自动、测试分析动态网页和正则表达式的区别和共同点;了解作者最近学习得比较多的搜索引擎和知识图谱的整体框架
- pySpider Spider(Web Crawler) System in Python
- RoboBrowser: Your friendly neighborhood web scraper
- 大数学堂-网络爬虫基础教学
- 大数学堂-网络爬虫实战教学
- 数据产品(Data Product)
- Building Data Products with Python: A Wine Review Website using Django and Bootstrap
- A machine learning approach to classify music by mood based on song lyrics
- 使用Python构建Twitter分析应用
- 歌曲推荐系统实践:Pandas、SciPy和D3.js -- Flipboard工程师撰文阐述如何利用流行的Python数据挖掘工具构建歌曲推荐系统,从数据获取到结果可视化,内容较全面。
- Python code for the free book A Programmer's Guide to Data Mining
- Kaggle's competition for using Google's word2vec package for sentiment analysis
- Entity Linking and Retrieval Tutorial
- 关键词提取
- 网站框架学习
- Django学习系列文章
- discover-flask
- Flask by Example
- Flask + Gunicorn + Nginx 部署
- 浅入浅出Flask框架
- Creating a web app with Flask
- XPath 是一个好工具
- 数据科学课程
- 哈佛大学CS109 Data Science
- data science course material
- 数据分析、机器学习与物联网
- Analysing Weed Pricing across US - Data Analysis Workshop
- Introduction to Statistics using Python
- Open Content for self-directed learning in data science
- Practical Data Science in Python
- 通过自行车数据分析西雅图工作习惯
- Bot or Not: an end-to-end data analysis in Python
- 用NFL数据分析
- Comprehensive Guide to Learning Python for Data Analysis and Data Science
- 男女选秀弥漫与娱乐机器轰鸣 ——试对《人民日报》的娱乐话语进行文本挖掘与可视化 (2005-2016)
- Knowledge Graph Embeddings scikit-kge
- Python module to perform under sampling and over sampling with various techniques
- XGBoost Feature Interactions & Importance
- 机器学习教程
- justmarkham/scikit-learn-videos
- Advanced Statistical Computing at Vanderbilt University's Department of Biostatistics
- amueller/scipy2015sklearn_tutorial
- 用Python十分钟构建一个预测模型
- 数据科学的学习路径
- 机器学习资料大汇总
- CMU机器学习进阶课程
- Implementing a Weighted Majority Rule Ensemble Classifier in scikit-learn
- KNN(Scikitlearn+Pandas从头到尾)
- 机器学习资料大汇总
- pattern_classification
- Regularized Linear Regression with scikit-learn
- 实例详解机器学习如何解决问题
- Classification using Pandas and Scikit-Learn(ipynb)
- Libraries for Top 10 Machine Learning Algorithms
- intro-to-machine-learning-by-python
- A Primer on Bayesian Methods for Multilevel Modeling(ipynb)
- 机器学习分析步骤stack(ipynb)
- 机器学习分类器选择
- 10 Scikit Learn Case Studies, Examples & Tutorials
- scikit-neuralnetwork
- Using scikit-learn Pipelines and FeatureUnions
- Python algorithms for regularized regression
- run a multitude of classifiers on you data and get an AUC report
- TensorFlow Tutorial part 1
- TensorFlow Tutorial part 2
- TensorFlow的简化接口Scikit Flow
- Kaggle Python Tutorial on Machine Learning
- Natural Language Processing (NLP) Fundamentals: Hidden Markov Models (HMMs)
- A Different Approach to Low-Rank Matrix Completion: Part 1
- 机器学习系列(4)_机器学习算法一览,应用建议与解决思路(有很好的思路)
- 信息检索
- TF-IDF
- Scoring using the Vector Space Model *数据预处理
- 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- 关于使用Sklearn进行数据预处理 —— 缺失值(Missing Value)处理
- 特征选择
- Introduction to Sequential Backward Selection(Iris例子,Wine例子等)
- 使用GBDT选取特征
- 机器学习技巧之feature_hashing
- 结合Scikit-learn介绍几种常用的特征选择方法
- 数学
- kaggle
- kaggle上的自行车出租数量预测
- kaggle机器学习竞赛冠军及优胜者的源代码汇总
- Kaggle入门——使用scikit-learn解决DigitRecognition问题
- Code for the Kaggle competition "Bag of Words Meets Bags of Popcorn"
- 图数据库(Neo4j)
- Deep Learning
- 自然语言处理
- 可视化(vision)
- Out-of-Core Dataframes in Python: Dask and OpenStreetMap
- a fact-based worldview
- 设计模板
- RAP Analysis Project用的设计模板
- 英文写作措辞
- 主题分析
- Generating a Word2Vec model from a block of Text using Gensim (Python)
- Modern Methods for Sentiment Analysis
- Deep Learning
- 推荐系统
- 教育数据挖掘和学习分析
- Hacking Education with Python - Data Mining Coursera for Popular Courses
- A machine learning pipeline for classifying MOOC discussion forums
- KDD Cup 2010 Educational Data Mining Challenge
- 博客
准备
- Giving Computers the Ability to Learn from Data(ipynb) 介绍机器学习类型,图片方式
第一单元 回归(Regression)
- Andrew NG-ppt-Linear Regression with one variable
- Andrew NG-note-Linear Regression
- Andrew NG-exercise-ex1(ipynb)
- Linear Regression-Scikit-learn(ipynb)
- simple linear regression(ipynb)
- Introduction to Linear Regression
- Linear Regression Example(ipynb) pycon2014
- Multiple Regression using Statsmodels
- Regularized Linear Regression with Scikit-learn
第二单元 分类(Classification)
- Logistic Regression
- 神经网络