探讨webapp的SEO难题(上)

本文涉及的产品
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介:
前言

网络蜘蛛无法解析javascript,至少百度是不能的,神马搜索差的更远,而我们的webapp的渲染展示完全由javascript驱动
所以蜘蛛访问webapp页面会得到一个白页面,比如,我们期待SEO看到的是这个样子的网页

其实他看到的是这个样子的代码:


那么这个问题应该如何处理呢?比较早的处理方案是提供两套代码,一套用于webapp一套用于SEO,比如:
webapp/blade/demo/debug.html是用于webapp的
而html5/blade/demo/debug.html就是用于SEO访问的
这样做确实是解决了SEO的问题,业务团队却需要写两套代码,这个情况是开发也不是不可接受的,举个例子来说
webapp一般是纯粹的前端开发,而且逻辑会相对复杂,而seo开发一定是会服务器端语言的
也就是说要完成此等开发需要预期1.3-1.5倍的工作量(SEO页面往往比较简单只做纯粹展示),而开发需要掌握前后端,而这个后端可能是php,java,.net
这个样子除了有点耗费人力之外没有什么问题,因为从重构角度来说,不相关的模块就是应该分离,显然这里的webapp与seo就是两个东西
这里是典型的业务关联,而非功能关联,写在一起总会遇到适配问题,但抱着一套代码解决两个问题的信念,我们今天来探索如何使用一套代码完成webapp与seo两个功能
PS:此文只是个人粗浅的理解,若是有误请您指正
.net解决思路

这里要webapp与SEO使用同一套代码完成不同的渲染的话,其实基本前提是必须的:
① 数据为先,而且是所有需要的数据必须事先定义,是否允许异步我们不予理睬,但是必须是实现准备好数据接口定义!
由于数据接口事先定义好了,webapp的数据请求就有两种方式,同步、异步
② 数据可以与html一起返回,写入到页面,不然就是先吐出html,然后前端解析后Ajax请求数据,渲染模板
这里处理的一个重点大家都发现了,他就是首屏渲染!所谓SEO其实就是要做到首屏渲染
PS:这里可能会发生数据交错依赖的需求,我们这里暂时不予理睬
而对于SEO,浏览器访问后需要直接返回完好无损的HTML,这里便必须同步处理,所以我们首屏的webapp的数据也采用一并返回的方法
这里服务器只会提供统一的restful接口,webapp使用underscore渲染页面,需要产生相同的数据就需要一个前提:
服务器需要解析前端webapp underscore模板的能力!这里便提供了初步的方案,简单模拟如下index.html:
复制代码
<script type="text/blade_config">
  {
    url: 'restful/index',
    template: 'indexTmpt'
  }
</script>
复制代码
复制代码
<script id="indexTmpt" type="text/blade_template">
  <ul>
    <% for(var i = 0, len = data.length; i < len; i++) { %>
      <li><%=data[i].name %></li>
    <% } %>
  </ul>
</script>
复制代码
复制代码
//模拟数据返回
data = [
  {id: 0, name: 'item_0'},
  {id: 1, name: 'item_1'},
  {id: 2, name: 'item_2'}
]
复制代码
这里期待的webapp处理逻辑:

① 服务器解析config中的data,请求url后封装为数据
② 服务器处理模板与data,生成html,返回返回
当然这里可以将data返回页面由前端渲染,但是这样意义不大,不然直接渲染算了
期待的seo处理逻辑:

① 解析config,请求url生成data
② 根据前端模板,生成最终html
其实SEO的逻辑与前端一致了,没有什么不同,只不过生成静态html后的处理逻辑差距便大了
为什么不直接服务器吐出完整html?

到这里其实很多朋友就会开始质疑了,既然如此,我们何必要定义config中的url,或者template,这里直接使用服务器端渲染给给前端不好么?
这里还省了很多看似莫名其妙的配置,其实这样做还是有道理的
本来SEO需要会服务器端语言的,而一旦我们给出config中的约定与模板后,事实上整个便与服务器端没有任何联系了
虽说他与服务器端吐出差距不大,但是我业务开发人员事实上只需要掌握前端技能,这个设计的原因便是如此
整个程序对前端来说依旧只需要restful与模板,我可以单个前端同时完成webapp与seo,这就是其意义所在
这个方案的代价是:

① blade中的静态html需要变成动态脚本,这样服务器才能解析内容(比如index.html->index.aspx)
② 之前形成的编写方式需要改变,这里只是需要onShow、onHide事件点
③ 需要按套路出牌,必须定义url与template等东西
凡是有优点就有缺点,这样做的优点是:
① 一套代码解决webapp seo难题
② 可以使用.net解析模板,整个服务器来说比较稳定
缺点是:
① 对前端规范约束太多,碰到复杂业务逻辑会比较头疼,比如模板嵌套,数据依赖,这里的配置就麻烦了
② 不太“webapp”,诚然,此种做法不太webapp
③ 脆弱,问题同样来源于模板,一次模板语法解析错误,会造成服务器端抛错,整个程序便死掉了
这个问题的提出其实有点吹毛求疵,因为模板就前端解析也会经常出错,但是这里的不同点是前端稍微好调试点,如果抛给服务器端的话其调试成本会增加
.net解析javascript

扯了这么多,小钗这里为了证明自己原来是搞.net的这里做一个简单实现,这里便出现了第一个难点:
因为我们模板是underscore的语法(模板暂时不考虑嵌套),那么.net如何解析javascript代码呢??
.net解析javascript需要引入第三方库,借助一些javascript引擎,就如node之于V8;.net的话我们这里暂时使用IronJS做处理
https://github.com/fholm/IronJS
这里小钗不得不汗颜,一件事情,就是C#已经变成这个样子了,我却根本不知道......

PS:尼玛这个狗东西,我看得懂个毛线啊!!!所以本着不丢脸的原则,我们这里省略一万字
我们这里直接提供一个思路即可,因为该方案不是今日的重点,我的重心依旧是放在nodeJS上的,这里的思路是:
① 解析页面的config信息,取出url以及template

② 根据url发出请求返回数据,这里由于是局域网应该很快

③ 解析template,根据data生成静态html

④ 其它处理,返回客户端

模拟处理逻辑

我们这里略去url请求一步,假设数据已经返回,否则这里又要写.net程序

var data = [
  {id: 0, name: 'item_0'},
  {id: 1, name: 'item_1'},
  {id: 2, name: 'item_2'}
];
这里的模板字符串为:

复制代码
var template = [
  '<ul>',
    '<% for(var i = 0, len = data.length; i < len; i++) { %>',
      '<li><%=data[i].name %></li>',
    '<% } %>',
  '</ul>'
].join('');
复制代码
然后我们要做的就是解析这个模板,生成对应的模板解析函数,这里是调试代码:

 View Code
首次调试爆了很多错误,而且服务器端的调试比较费力,错了只能靠经验去猜测



这里返回的是需要构造成函数的字符串,但是我们看到我们的“ul”等标签被吃掉了!!!

复制代码
var __t,__p='',__j=Array.prototype.join,print=function(){__p+=__j.call(arguments,'');};
with(obj||{}){
__p+='';
 for(var i = 0, len = data.length; i < len; i++) { 
__p+=''+
((__t=(data[i].name ))==null?'':__t)+
'';
 } 
__p+='';
}
return __p;
复制代码
我们这里一旦调用就抛了一个错误,这个时候一般是模板或者传入数据出错了,可惜的是他是对其中一段语法不可解析!这里从侧面反映出一个问题:

该方法若是模板出错会导致程序无法运行,如果是node的话很可能就crash了!

PS:这里由于CLR4解析javascript的时候字符串的replace遇到正则时有问题,在此逗留3小时,这里把我搞惨了,定位就很久最后还得重写模板解析!!!

 正确的代码


我这里使用生命在调试啊!!!因为服务器解析javascript时候,很多东西都不支持,感觉有点回到了c++!!!

小结

这里字符串解析成功,我们这部分也就告一段落了,本身.net方案也不是这次的重点,这里提供基本思路各位自己去看看吧,总之调试很坑

下期预告

对javascript来说,nodeJS自然是亲爹,我们这次的主要方案其实是基于nodeJS的,这里的期望:

① 用户请求过来时候首先判断是否为网络爬虫

② 网络爬虫访问seo/index.html,用户访问webapp/index.html

当然,我们做demo时候不会这么麻烦,我们直接为其添加一个seo=true的标志位在url即可

nodeJS实现SEO的方案重点依旧在首屏渲染,我们这里首先基于blade做两个页面,然后以此扩展seo的方案

当然此块内容有点小复杂,加之,小钗对nodeJS停留在学习阶段,这块需要学习,而且最近有些其它事情扰心,暂时便搁置了

这块的内容可能与RapidJS(clouda前身)有关,有兴趣的同学可以先去看看

文中有误请您指出,若您对webapp的seo有什么好的想法请留言





本文转自叶小钗博客园博客,原文链接:http://www.cnblogs.com/yexiaochai/p/3886925.html,如需转载请自行联系原作者
相关文章
|
2月前
|
SEO 搜索推荐 数据采集
让 JSF 应用秒变搜索引擎宠儿!揭秘 SEO 优化的神奇魔法,让你的网站脱颖而出!
【8月更文挑战第31天】随着互联网的发展,搜索引擎已成为用户获取信息的主要途径,SEO 对 Web 应用至关重要。本文介绍如何提升 JavaServer Faces(JSF)应用的 SEO 友好性,包括关键词优化、网页结构优化和外部链接建设等基础知识,并提出了使用语义化 HTML 标签、优化页面标题和描述、生成静态 HTML 页面及 URL 重写等具体策略,帮助您的网站在搜索引擎中获得更高排名。
27 0
|
5月前
|
搜索推荐 前端开发 JavaScript
nextjs是怎么获得绝佳SEO的?
nextjs是怎么获得绝佳SEO的?
157 0
|
10月前
|
数据采集 搜索推荐 算法
|
数据采集 安全 搜索推荐
如何做谷歌SEO网站推广?
答案是:可以选择谷歌SEO+谷歌Ads双向运营。 制定合适的谷歌SEO战略 确定目标市场和客户群体 了解您的目标客户是谁以及他们在哪里寻找信息至关重要,这有助于确定适当的关键词和内容战略。 设定具体实施步骤和时间表 谷歌SEO是一个长期过程,明确的实施步骤和时间表可以确保工作的连续性和效果。
114 0
如何做谷歌SEO网站推广?
|
数据采集 监控 搜索推荐
谷歌SEO词投入怎么做?
答案是:谷歌seo关键词需要8-25w一年的预算。 当我们在制定和执行搜索引擎优化(SEO)策略时,关键词投入是不可忽视的一部分。 这不仅可以提高网站的搜索排名,还能吸引更多的目标用户访问我们的网站。 以下是如何进行谷歌SEO词投入的一些步骤和策略。
95 0
谷歌SEO词投入怎么做?
|
数据采集 搜索推荐 安全
谷歌SEO需要做哪些准备工作?
答案是:做足够多的GPB外链+足够多的优质内容,做好站内优化需要足够多的优质内容+较快的网站打开速度。 了解谷歌SEO的基础 在开始谷歌SEO工作之前,您需要了解一些基本概念,包括关键词、元标签、外链和内容优化等。 关键词研究 关键词是搜索引擎优化的核心。 这涉及找出与您的产品或服务最相关的词或短语,这些词或短语应该是用户在搜索时可能使用的。
88 0
谷歌SEO需要做哪些准备工作?
|
架构师 区块链 数据安全/隐私保护
web3行业有哪些职业发展路径?
Web3 是一个相对较新的概念,因此其职业发展路径也在不断演变。一般来说,Web3 职业发展路径可以分为以下几个方向: 1. 区块链开发工程师:区块链开发工程师需要掌握 Solidity 等语言和智能合约开发技能,负责开发和维护区块链协议和智能合约。典型的公司如以太坊基金会、比特大陆等。 - 技能要求:Solidity、智能合约开发、区块链协议开发 - 公司分析:以太坊基金会是区块链开发领域的知名组织,负责以太坊协议的开发和维护。比特大陆则是全球知名的比特币矿机生产商,也在区块链技术研发方面有着深厚的积累。 2. 区块链架构师:区块链架构师需要具备深厚的区块链技术知识和经验,负责设计、
199 0
|
数据采集 搜索推荐 算法
谷歌SEO外链策略解析:如何在百度SEO中找到优势?
答案是:可以选择主流的GPB外链。 理解谷歌和百度的SEO 搜索引擎优化(SEO)是提升网站在搜索引擎中的排名,从而增加网站流量的关键策略。 其中,谷歌SEO和百度SEO各有特点和独特的算法。 了解两者的差异和特性,才能制定有效的SEO策略。 在本文中,我们将详细探讨谷歌seo新规则【2023年最新】,并比较百度SEO的相关规则。
175 0
|
搜索推荐 定位技术 UED
SEO外包服务都包含哪些内容?详解网站SEO外包服务解决方案
SEO外包服务是由SEO公司提供的搜索引擎优化服务,通过整套SEO优化解决方案全面提升网站关键词排名数量与位置,帮助企业实现SEO营销,增强企业线上获客能力。接下来小编为你详细分享网站SEO外包服务解决方案,一起来看看吧。
165 0
|
数据采集 人工智能 搜索推荐
要想文章上Google搜索引擎首页,SEO 要做好下面7个点优化
当Google SEO 除了关键字分析,还学会语意判读,你该如何花最少的力气抢占关键字首页?接着,我们会从过往撰写SEO 文章的经验中,汇整出一套SEO 文章的撰写步骤,并且在讲解步骤之前会先一一拆解SEO 文章类型、内容、架构与字数的差异,让你能更理解执行每一步骤的原因。 Google 首页的SEO 文章与一般文章区别是什么?
453 1
要想文章上Google搜索引擎首页,SEO 要做好下面7个点优化