酱油程序猿 CSDN 博客:http://blog.csdn.net/freeking101
From: http://blog.leanote.com/post/freewalk/Markdown-%E8%AF%AD%E6%B3%95%E6%89%8B%E5%86%8C From: http://www.jianshu.com/p/1e402922ee32/ Markdown 是一种用来写作的轻量级「标记语言」,它用简洁的语法代替排版,而不像一般我们用的字处理软件 W
From: http://www.blogjava.net/ivanwan/archive/2012/04/26/376670.html From: http://www.bubuko.com/infodetail-807886.html 安装Xming 和 Putty 看Wiki系统地了解了一下X Window System。X Window System(常被简称
计算机端口详解 一 摘要 端口是个网络应用中很重要的东西,相当于“门”了。 计算机“端口”是英文port的义译,可以认为是计算机与外界通讯交流的出口。其中硬件领域的端口又称接口,如:USB端口、串行端口等。软件领域的端口一般指网络中面向连接服务和无连接服务的通信协议端口,是一种抽象的软件结构,包括一些数据结构和I/O(基本输入输出)缓冲区。
TCP十一种状态 全部11种状态 1. 客户端独有的:(1)SYN_SENT (2)FIN_WAIT1 (3)FIN_WAIT2 (4)CLOSING (5)TIME_WAIT 。 2. 服务器独有的:(1)LISTEN (2)SYN_RCVD (3)CLOSE_WAIT (4)LAST_ACK 。 3. 共有的:(1)CLOSED (2)EST
scrapy英文文档 : https://doc.scrapy.org/en/1.3/index.html scrapy中文文档: http://scrapy-chs.readthedocs.io/zh_CN/1.0/intro/overview.html 内容都是从官方文档整理过来的,只整理一部分,要想深入了解,可以看官方文档 初窥Scrapy Scrapy
From:http://blog.csdn.net/yipiankongbai/article/details/25031461 一、域名系统 1、域名系统概述 域名系统DNS(Domain Name System)是因特网使用的命名系统,用来把便于人们使用的机器名字转换成为IP地址。域名系统其实就是名字系统。为什么不叫“名字”而叫“域名”呢?这是因为在这种因特
From:https://linux.cn/article-5926-1.html systemctl命令是系统服务管理器指令,它实际上将 service 和 chkconfig 这两个命令组合到一起。 任务 旧指令 新指令 使某服务自动启动 chkconfig --level 3 httpd on syste
C++ STL 基础 C++的类。请读下面一段代码: class Shape { private: int x_pos; int y_pos; int color; public: Shape() : x_pos(0), y_pos(0), color(1) {} Shape(int x, int y, int c = 1) :
模拟登录这块一直没搞过,主要是对 模拟登陆的流程不太熟悉,网上找了好多资料,感觉熟悉个大概,就先用豆瓣 试试。 验证码这一块,现在主要是先把验证码的图片保存下来,手动输入验证码,后期研究下python自动识别验证码。 但是验证码保存成本地图片,看的不不太清楚(有时间在改下),可以把验证码的 url 地址在浏览器中打开,就可以看清楚验证码了。 主要实现 登录豆瓣,并发表一句话 #
From : http://www.pythonclub.org/python-network-application/observer-spider 1.最基本的抓站 import urllib2 content = urllib2.urlopen('http://XXXX').read() 2.使用代理服务器 这在某些情况下比较有用,比如IP被封
From:http://cuiqingcai.com/2621.html 前言 XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。 xPath 同样也支持HTML。XPath 是一门小型的查询语言,这里与 python 爬虫相结合来介绍。python 中 lxml库使用
最终目的:高内聚,低耦合 1) 开放封闭原则 (OCP,Open For Extension, Closed For Modification Principle) 类的改动是通过增加代码进行的,而不是修改源代码。 2) 单一职责原则 (SRP,Single Responsibility Principle) 类的职责要单一,对外只提供一种功
来源:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正
From : http://www.uml.org.cn/c%2B%2B/201305272.asp From : http://bbs.csdn.net/topics/390269815 From : http://developer.51cto.com/art/201512/502598.htm From : http://www.cnblogs.com/ggjucheng/ar
From:http://blog.csdn.net/fenxinzi557/article/details/51457829 From:http://www.cnblogs.com/xFreedom/archive/2011/05/16/2048037.html CPP 之所以抛弃char*的字符串而选用C++标准程序库中的string类,是因为他和前者比较起来,不必担心内存是
From : http://www.cnblogs.com/aylin/p/5572104.html 1、socket socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO
来源:http://www.cnblogs.com/gw811/archive/2012/10/25/2738929.html 来源:http://www.cnblogs.com/L-hq815/archive/2012/08/01/2619135.html 来源:http://blog.csdn.net/qq_28796345/article/details/51288045
参考:http://www.usidcbbs.com/read-htm-tid-1898.html 常见格式串 %% 印出百分比符号,不转换。 %c 整数转成对应的 ASCII 字元。 %d 整数转成十进位。 %f 倍精确度数字转成浮点数。 %o 整数转成八进位。 %s 整数转成字符串。 %x 整数转成小写十六进位。 %X 整数转成大写十六进位。 %n sscanf
参考:http://cuiqingcai.com/1319.html Beautiful Soup 4.2.0 文档 1. Beautiful Soup 简介 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一
来源:http://www.cnblogs.com/likebeta/archive/2012/06/16/2551662.html 来源:http://www.cnblogs.com/likebeta/archive/2012/06/16/2551780.html C++的文件操作 在C++中,有一个stream这个类,所有的I/O都以这个“流”类为基础的,包括我们要认识的
参考:http://cuiqingcai.com/2556.html http://www.jianshu.com/p/e1f8b690b951 http://blog.csdn.net/shanzhizi/article/details/50903748 http://www.cnblogs.com/tangdongchu/p/4229049.htm
爬取 http://www.xiaohuar.com/ 美女校花 图片的爬虫 # -*- coding:utf-8 -*- import os import requests # from PIL import Image from lxml import etree class Spider(object): """ crawl image """ def
来源:https://segmentfault.com/a/1190000003742481 一直断断续续的用过几次 OpenCV,感觉熟练掌握它的使用方法已经变的非常必要了,正好找到一个很不错的英文教程,就以此为起点,详细记录一下对 OpenCV 的学习过程吧。 Update: 这段时间通过使用了OpenCV之后,发现了很多实际操作过程中的问题,所以再次更新一下
来源:http://www.cnblogs.com/qiaozhoulin/p/5227673.html “如何产生一个不能被继承的类”,这道题我反反复复只想到,将父类的构造函数私有,让子类不能调用,最后归结出一个单例模式,但面试官说,单例模式作为此题的解答不够灵活,后来面试官提示说,可以用友元+虚继承,可以完美实现这样一个类 当然那时我还不太明白,友元与虚继承我都极少接触
来源:http://dsqiu.iteye.com/blog/1669614 之前一直对C++内部的原理的完全空白,然后找到《Inside The C++ Object Model》这本书看了下, 感觉收获很大,因为书写得比较早,有些知识应该要更新,但是还是值得好好研读,由于该书的内容给人比较散的感觉,所以一直想找个时间整理一下,遂成此文,虽然都是抄书上的,但是却让我有了温故
来源:http://blog.csdn.net/wxc1987821/article/details/5958325 1 前言 了解你所使用的编程语言究竟是如何实现的,对于C++程序员可能特别有意义。首 先,它可以去除我们对于所使用语言的神秘感,使我们不至于对于编译器干的活感到完全不可思议;尤其重要的是,它使我们在Debug和使用语言高级特性的时 候,有更多的把握。当需要提
来源:http://www.oschina.net/translate/cpp-virtual-inheritance 来源:http://www.cnblogs.com/BeyondAnyTime/archive/2012/06/05/2537451.html C++中的虚拟继承的一些总结 1.为什么要引入虚拟继承 虚拟继承是多重继承中特有的概念。虚拟基类是为解决
来源:http://blog.csdn.net/haoel/article/details/3081328 前言 07年12月,我写了一篇《C++虚函数表解析》的文章,引起了大家的兴趣。有很多朋友对我的文章留了言,有鼓励我的,有批评我的,还有很多问问题的。我在这里一并对大家的留言表示感谢。这也是我为什么再写一篇续言的原因。因为,在上一篇文章中,我用了的示例都是非常简单的,主
来源:http://blog.csdn.net/haoel/article/details/1948051 C++ 虚函数表解析 陈皓 http://blog.csdn.net/haoel 前言 C++中的虚函数的作用主要是实现了多态的机制。关于多态,简而言之就是用父类型别的指针指向其子类的实例,然后通过父类的指针调用实际子类的成员函数。这种技术可以让
#include <iostream> using namespace std; template<typename Type> class AutoRelease { typedef void (Type::* pFunc)(void); public: AutoRelease(Type* p, pFunc pfunc) :
来源:http://www.cnblogs.com/ggjucheng/archive/2011/12/13/2286391.html 指针的概念 指针是一个特殊的变量,它里面存储的数值被解释成为内存里的一个地址。要搞清一个指针需要搞清指针的四方面的内容:指针的类型,指针所指向的类型,指针的值或者叫指针所指向的内存区,还有指针本身所占据的内存区。让我们分别说明。 先声明几
Python版本:2.7 一、爬虫入门 1. Python爬虫入门一之综述 2. Python爬虫入门二之爬虫基础了解 3. Python爬虫入门三之Urllib库的基本使用 4. Python爬虫入门四之Urllib库的高级用法 5. Python爬虫入门五之URLError异常处理 6. Python爬虫入门六之Cookie的使用
转载:静觅 » Python爬虫入门七之正则表达式 1.了解正则表达式 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 正则表达式是用来匹配字符串非常强大的工具,在其他编程语言中同样有正则表达式的概念,Python同样不例外,利用了正则
转载:静觅 » Python爬虫入门六之Cookie的使用 为什么要使用Cookie呢? Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密) 比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不允许的。那么我们可以利用Urllib2库保存我们登录的Cookie,然后再抓取其他页面就
转载:静觅 » Python爬虫入门三之Urllib库的基本使用 转载:静觅 » Python爬虫入门四之Urllib库的高级用法 1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便
转载:静觅 » Python爬虫入门一之综述 转载:静觅 » Python爬虫入门二之爬虫基础了解 首先爬虫是什么? 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。 根据我的经验,要学习Python爬虫,我们要学习的共有以下几点: Python基础知识 Py
来源:http://www.51testing.com/zhuanti/selenium.html 来源:http://www.ltesting.net/ceshi/open/kygncsgj/selenium/
http://edu.51cto.com/lesson/id-62643.html
来源:http://www.cnblogs.com/tugenhua0707/p/4623317.html Fiddler调式使用(一)深入研究 阅读目录 Fiddler的基本概念 如何安装Fiddler 了解下Fiddler用户界面 理解不同图标和颜色的含义 web session的常用的快捷键 了解web Session上下文菜单 Fiddler如何捕获fire
来源:http://www.uml.org.cn/oobject/201104212.asp 来源:http://blog.csdn.net/longronglin/article/details/1454329 来源:http://www.cnblogs.com/mimime/p/5827895.html 统一建模语言(UML:Unified Modeling Lang
来源:http://www.cnblogs.com/mcho/p/3983066.html 使用QuickExec Fiddler2成了网页调试必备的工具,抓包看数据。Fiddler2自带命令行控制,并提供以下用法。 Fiddler的快捷命令框让你快速的输入脚本命令。 键盘快捷键 按ALT+Q课迅速将焦点定位到快捷命令框。若Fiddler不在活跃状
#include <string> #include <occi.h> #include <iostream> using namespace std; using namespace oracle::occi; struct Student_struct { int no; int age; string name; }; std
来源:http://www.cnblogs.com/mrzhoushare/articles/4953614.html Fiddler是用C#开发的。 所以Fiddler不能在Mac系统中运行。 没办法直接用Fiddler来截获MAC系统中的HTTP/HTTPS, Mac 用户怎么办呢? Fiddler可以允许“远程连接”。 我们可以利用这个间接来实现Fid
来源:http://www.cnblogs.com/mrzhoushare/articles/4953604.html Fiddler是我最喜爱的工具,几乎每天都用, 我已经用了8年了。 至今我也只学会其中大概50%的功能。 Fiddler绝对称得上是"神器", 任何一个搞IT的人都得着的。 小弟我立志, 一定要把Fiddler的所有的功能和用法都写出来。 写成一个完整
来源:http://www.cnblogs.com/mrzhoushare/articles/4953598.html 这次我们介绍Fiddler中的一个非常有用的功能Composer,是用来创建和发送HTTP Request的。Composer的使用方法很简单,看下就知道用了。 Fiddler Composer介绍 Composer的官方帮助文档:http:/
来源:http://www.cnblogs.com/strick/p/4570006.html 当我以前在调PC端网页的时候,Firefox有Firebug,Chrom也有自己的调试抓包工具,用起来很方便。 但是现在我要在手机上面调试页面,这个时候就没有这么方便的现成工具了。 后面发现了Fiddler,设置一下后,就能用这个来抓取手机访问页面时候的请求了。 下面是文章大纲:
转载地址:写得很不错的fildder教程 http://kb.cnblogs.com/page/130367/ Fiddler的基本介绍 Fiddler的官方网站: www.fiddler2.com Fiddler的官方帮助:http://docs.telerik.com/fiddler/knowledgebase/quickex
来源:http://blog.csdn.net/aqwd2008/article/details/7506007 python 模块 chardet下载及介绍 在处理字符串时,常常会遇到不知道字符串是何种编码,如果不知道字符串的编码就不能将字符串转换成需要的编码。面对多种不同编码的输入方式,是否会有一种有效的编码方式?chardet是一个非常优秀的编码识别模块。 ch
来源:http://blog.csdn.net/liujiahan629629/article/details/18014051 一,游标是什么? 游标是一段私有的SQL工作区,也就是一段内存区域,用于暂时存放受SQL语句影响到的数据。通俗理解就是将受影响的数据暂时放到了一个内存区域的虚表中,而这个虚表就是游标。
来源:http://blog.csdn.net/gumingyaotangwei/article/details/7337893 OCCI数据库Oracle编程步骤1. 配置环境(1) Occi访问数据库需要occi.h头文件,此文件在oracle安装目录下,必须有oracle库的支持。安装oracle服务端或客户端;(2) 配置NLS_LANG环境变量,必须与数据库的字符编码一致,