前言
在浏览移动版本的oschina的时候,发现,怎么要找不到我最喜欢的翻译频道,正好我作为一个打杂的会一点node, 正愁着拿着node 不知道干什么东西好,就试着用node 做一个壳的移动版本翻译频道,如果你只对代码有兴趣的话,可以直接去 下载下来运行看看效果https://github.com/youxiachai/nodeScrapeOscTranslationChannel
准备
其实,所谓的套壳,就是我们俗称的采集类网站,把别人网站的数据,变成自己的网站,虽然,不是上得了台面的东西,不过,如果不是用现成的采集工具,而是自己动手来干的话,你会对dom树的操作,网页的处理有更好的理解.基于某种考虑,特别写上.
运用的技术与库
分析
我们要从外部改造一个网站,首先需要熟悉我们要改造对象的网站结构,将oschina 翻译频道进行草稿化,如下图
经过我简单分析以后然后转换为移动版本的话
在我的设计中只保留了分类,和列表,而在接下来的代码实现中,我只实现了列表的部分...
译文列表部分
翻译频道译文列表的解析转换代码 请移步到gist 查看..为了方便阅读,修改了一下跟最后源码的实现会有点不同.
幸好翻译频道的结构挺简单的,由于刚上手js不久,这个第一版的dom解析代码还可以进行简化,虽然,现在这个版本挺难看的但是,可以跑起来.
这段代码的主要干了以下事情:
迭代每个div.article 结点获取列表的信息,并且用
<li />
标签进行包装把链接转换为相对链接.
最终的效果:左边为原页面,右边为移动版本
好了,这就完成了web -> mobile 页面的转换,接下来我们转化一下内容页.
译文部分
草稿部分忽略,拍照什么的挺麻烦的.. 翻译频道译文内容的解析转换代码 请移步到gist 查看..为了方便阅读,修改了一下跟最后源码的实现会有点不同.
这部分就比较简单了,dom的操作
获取译文内容
移除了译者信息..
最终的效果:左边为原页面,右边为移动版本
内容方面我们就搞定了.下面的部分就是如何部署一个套壳的网站
建立属于自己的移动网站
前提: 对express 有一定了解
要web 化很简单,只需要把刚才的解析代码放到路由里面即可,详细实现看源码..
app.get('/', callback);
app.get('/translate/:title', callback);
最终演示用地址挂在我自己的服务器上(用了google的短网址服务可能有转换慢,或者无法访问的情况) :演示网址http://goo.gl/K3Dc8
最近,kindle入华貌似变成了事实,特此贴上kindle浏览的效果..图片压缩了一下,可能效果差了不少,不过对于kindle3 而言中文字体的确很难看,有kpw可否贴下?
展望
由于整个程序虽然代码不多,不过需要的知识的广度不少,例如,dom树,jsdom ,express, html5, 每个知识都只是用了那么一点...写起来真不好下手,有兴趣的朋友,可以fork 我github的项目,地址,开头就给了.
当然,这个程序是一个半成品(一个晚上的代码,再花了一个晚上写这篇博文),很多东西都还没加上...接下来,我应该会着手实现webapp离线化....
本文转自 liam2199 博客,原文链接:http://blog.51cto.com/youxilua/1193825 如需转载请自行联系原作者