自动判断网页编码获取网页源代码内容的函数

简介:
自动判断网页编码获取网页源代码内容的函数
'页面下载的函数,url是网页地址,urlcode是网页编码,例子gethttppage(" [url]http://www.sifulaoda.com/[/url]","GB2312")
function gethttppage(url,urlcode) 
  dim http 
  set http=Server.createobject("MSXML2.XMLHTTP") 
  Http.open "GET",url,false 
  Http.send() 
  if Http.readystate<>4 then
  gethttppage=""
   exit function 
  end if 
  gethttppage=readfile(Http.responseBody,urlcode) 
  set http=nothing
  if err.number<>0 then err.Clear  
end function
'字节流变换字符,url是字节流,urlcode网页编码,gb2312,utf-8例子readfile(Http.responseBody,"GB2312")
'20071119可自动判断编码方式
function readfile(url,urlcode)
dim srmobj
set srmobj=Server.CreateObject("ado" & "db.stre" & "am")
srmobj.type=1
srmobj.mode=3
srmobj.open
srmobj.write url
srmobj.position=0
srmobj.type=2
'判断编码方式开始
If AscB(MidB(url,1,1))=&HEF And AscB(MidB(url,2,1))=&HBB Then 
srmobj.charset="utf-8" 
ElseIf AscB(MidB(url,1,1))=&HFF And AscB(MidB(url,2,1))=&HFE Then 
srmobj.charset="unicode" 
Else 
srmobj.charset="gb2312" 
End If
'判断编码方式结束
'srmobj.charset=urlcode
readfile=srmobj.readtext()
set srmobj=nothing
end function
'剔除日文平甲字的函数:
function riwen(mm)
riwen=replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(mm,"ゴ",""),"ガ",""),"ギ",""),"グ ",""),"ゲ",""),"ザ",""),"ジ",""),"ズ",""),"ヅ",""),"デ",""),"ド",""),"ポ",""),"ベ",""),"プ",""),"ビ",""),"パ",""),"ヴ",""),"ボ",""),"ペ",""),"ブ",""),"ピ",""),"バ",""),"ヂ",""),"ダ",""),"ゾ",""),"ゼ","")
end function
本文转自分瓜博客51CTO博客,原文链接http://blog.51cto.com/aiqing/51134如需转载请自行联系原作者

aiqing
相关文章
|
5月前
|
网络协议
浅谈网页从请求到显示的过程
浅谈网页从请求到显示的过程
|
5月前
|
前端开发 JavaScript
前端JS控制网页复制粘贴
前端JS控制网页复制粘贴
|
7月前
|
JavaScript 前端开发
文本,粘贴事件如何实现,先实现一个小目标,如何存入图片,从本地生成源码,先转成base64,ctrl + v这张图片就显示出来了怎样实现的,Vue可以有方法可以获取粘贴的所有元素,转base64字符串
文本,粘贴事件如何实现,先实现一个小目标,如何存入图片,从本地生成源码,先转成base64,ctrl + v这张图片就显示出来了怎样实现的,Vue可以有方法可以获取粘贴的所有元素,转base64字符串
|
存储 缓存 网络协议
从输入URL到页面加载的全过程?隐藏元素有哪些方式,有什么区别?什么是内存泄漏?
1. 在浏览器地址栏输入url并回车 2. 浏览器查看是否有缓存,比较缓存是否过期,无缓存或过期则重新发起请求 3. DNS解析域名对应的IP 4. 根据IP建立TCP链接,即三次握手 5. 发送http请求 6. 服务器响应并返回结果 7. 关闭TCP链接,即四次挥手 8. 渲染页面,构建DOM树
|
前端开发 JavaScript
JS根据文件类型返回相应状态和图片 简单易懂 还不来多学一点
在前端开发中,我们经常需要判断文件类型并返回相应的状态,以便在页面中展示相应的图标。本文将介绍一种根据文件类型返回相应状态的方法。
|
移动开发 前端开发 开发者
第一个网页| 学习笔记
快速学习第一个网页。
第一个网页| 学习笔记
JS 禁止页面复制粘贴内容及事件类型讲解
JS 禁止页面复制粘贴内容及事件类型讲解
JS 禁止页面复制粘贴内容及事件类型讲解
|
Java
编写Java程序,读取文本文档的内容,去除文本中包含的“广告”字样,把更改后的内容保存到一个新的文本文档中
编写Java程序,读取文本文档的内容,去除文本中包含的“广告”字样,把更改后的内容保存到一个新的文本文档中
269 0
编写Java程序,读取文本文档的内容,去除文本中包含的“广告”字样,把更改后的内容保存到一个新的文本文档中
|
Web App开发 安全
网页端“混合内容”引起的一个问题
什么是混合内容呢,为什么https的页面无法发送http请求呢?
5286 0
网页端“混合内容”引起的一个问题
|
前端开发 JavaScript 数据安全/隐私保护
前端给网页添加明水印的解决办法
前端给网页添加明水印的解决办法
326 0