自动判断网页编码获取网页源代码内容的函数

简介:
自动判断网页编码获取网页源代码内容的函数
'页面下载的函数,url是网页地址,urlcode是网页编码,例子gethttppage(" [url]http://www.sifulaoda.com/[/url]","GB2312")
function gethttppage(url,urlcode) 
  dim http 
  set http=Server.createobject("MSXML2.XMLHTTP") 
  Http.open "GET",url,false 
  Http.send() 
  if Http.readystate<>4 then
  gethttppage=""
   exit function 
  end if 
  gethttppage=readfile(Http.responseBody,urlcode) 
  set http=nothing
  if err.number<>0 then err.Clear  
end function
'字节流变换字符,url是字节流,urlcode网页编码,gb2312,utf-8例子readfile(Http.responseBody,"GB2312")
'20071119可自动判断编码方式
function readfile(url,urlcode)
dim srmobj
set srmobj=Server.CreateObject("ado" & "db.stre" & "am")
srmobj.type=1
srmobj.mode=3
srmobj.open
srmobj.write url
srmobj.position=0
srmobj.type=2
'判断编码方式开始
If AscB(MidB(url,1,1))=&HEF And AscB(MidB(url,2,1))=&HBB Then 
srmobj.charset="utf-8" 
ElseIf AscB(MidB(url,1,1))=&HFF And AscB(MidB(url,2,1))=&HFE Then 
srmobj.charset="unicode" 
Else 
srmobj.charset="gb2312" 
End If
'判断编码方式结束
'srmobj.charset=urlcode
readfile=srmobj.readtext()
set srmobj=nothing
end function
'剔除日文平甲字的函数:
function riwen(mm)
riwen=replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(mm,"ゴ",""),"ガ",""),"ギ",""),"グ ",""),"ゲ",""),"ザ",""),"ジ",""),"ズ",""),"ヅ",""),"デ",""),"ド",""),"ポ",""),"ベ",""),"プ",""),"ビ",""),"パ",""),"ヴ",""),"ボ",""),"ペ",""),"ブ",""),"ピ",""),"バ",""),"ヂ",""),"ダ",""),"ゾ",""),"ゼ","")
end function
本文转自分瓜博客51CTO博客,原文链接http://blog.51cto.com/aiqing/51134如需转载请自行联系原作者

aiqing
相关文章
|
12月前
|
Web App开发 开发者
GNE v0.04版更新,支持提取正文图片与源代码
GNE v0.04版更新,支持提取正文图片与源代码
117 0
Python实现自动访问网页
Python实现自动访问网页
|
Java
编写Java程序,读取文本文档的内容,去除文本中包含的“广告”字样,把更改后的内容保存到一个新的文本文档中
编写Java程序,读取文本文档的内容,去除文本中包含的“广告”字样,把更改后的内容保存到一个新的文本文档中
210 0
编写Java程序,读取文本文档的内容,去除文本中包含的“广告”字样,把更改后的内容保存到一个新的文本文档中
17行html代码实现的将网页文本保存成本地文本文件
17行html代码实现的将网页文本保存成本地文本文件
351 0
17行html代码实现的将网页文本保存成本地文本文件
|
数据库连接
系统必需文件收录贴
系统必需文件收录贴
617 0
|
测试技术
测试了小程序的内嵌网页总结几点
  11月2日深夜微信团队宣布小程序内嵌页面开放了,很多开发者已经测试了小程序的内嵌网页,他们总结了以下几点: 1、内嵌网页的域名需要在小程序管理后台设置为业务域名,也就是需要先加入白名单 一个小程序最多可以添加 20 个业务域名,且一年只可修改 50 次业务域名。
1103 0
|
前端开发 JavaScript 开发者
一分钟修改网页中的内容
有时候需要修改网页中的内容,一般采取的做法是截图网页然后使用PS或特殊工具修改,这种方法麻烦又费力,而且修改后的效果往往不是很好。
1230 0