Monday, July 13, 2015

保存网页的三种境界



一、第一重境界:文件另存为

    在以前很早的时候,我就用这种方法,一般是在IE(Internet Explorer)浏览器里,另存为html文件,后来稍好一点,改成另存为mht文件,可惜这种mht文件据我所知,只能用IE打开,其他浏览器或其他平台似乎打开不了。而且,这种保存网页的方法,要把网页内容重新从网络上下载一遍,如果遇到长网页或网页内容有大型图片的话,就特慢或干脆都停滞而保存不了。

二、第二重境界:用虚拟的PDF打印机,打印成PDF文件

    后来由于接触免费软件的缘故,我下载使用了PDF虚拟打印机,还不错,原来是用Firefox搭配一款忘记了名字的PDF虚拟打印机,这样保存网页就不用再下载一遍网页元素了。但是这个组合打超长网页时,还会出现滞死的状况,如打维基百科的“美国”词条时,就会这样子。

    再后来,出了Google Chrome浏览器(可百度搜索“Chrome 新浪下载”,去下载纯净版的离线安装包,很爽),再配合上PDF打印机,就变成了无敌组合,超长网页也吃得消。

    再后来,我终于发现了好用的PDF24虚拟打印机,超稳定,并且会自动生成PDF文件名,但缺点是打出的PDF文件不能做文字搜索(有些款的PDF虚拟打印机是可以打成文字,做文字搜索的,欢迎读者朋友拍砖),实际上转化成图片了。

    我发现PDF24是来自德语区的产品,而Linux、UNIX世界的cups pdf打印机,也是来自德语区(可能是德国,也可能是瑞士德语区)。cups能让打印出来的pdf文件内,文字可以搜索,无论是Linux还是苹果MacOS上,都是这样,而奇怪的是,这样一款产品居然不提供Windows版本,所以欢迎大家提出比pdf24更稳定,又能像cups pdf那样生成文字pdf的、Windows平台的更好用的PDF虚拟打印机。

    三、直接把网页存到邮箱里

    再后来,对苹果手机和iPad接触多了,就喜欢上了Safari浏览器,它能一键把网页发送到邮箱的功能。这样,网页文字不仅可以基本上原汁原味地保存到邮箱中一份,而且事后检索或阅览以前查找过的网页,或者把网页内容分享给朋友,也都更方便快捷,因为只要在自己的邮箱里一找,就什么都出来了,特别是支持全文检索(而不仅仅是检索标题)的邮箱,用起来更方便。

    如果是用境界二的办法,要查找文件,只能在传统台式电脑中,用Everything等查找工具辅助查找。这境界三的查找办法,就宽裕得多,用苹果手机、平板上的邮件程序,或用浏览器登录网页邮箱,都可以查找并调阅以前储存的资料,方便多了。

    在苹果手机、平板的Safari上,一键存为邮件网文的办法,具体说是在完全载入网页后,点击地址栏左边的“三”字形阅读器视图按钮(不一定全都行,有些网页中,这个按钮不行,结果只能把网页链接发到邮箱中),然后再点击“占”字形按钮(上面有个箭头的按钮),再选邮箱图标,就可以用邮件把网文存起来了(当然前提是设置了邮箱账号,如果没设置邮箱账号,这一步也到不了)。

    后来我在Mac电脑上试了一下,也可以用类似的办法做到一键发送并存储邮件网文。

    并且这样存储的网文,可以在iPhone上以相当大的字体查看,阅读体验十分好(前提是在设置选项中选用了较大的字体:设置 > 通用 > 辅助功能 > 更大字体)。

    更好的一点是,iOS设备的邮箱程序中,如果全选文字十分方便,只要用手指长按屏幕上的文字,就会出现全选按钮,拷贝文字十分方便。

    如果苹果手机上装了Voice Dream(要钱的,不过物有所值),那么在邮箱程序中全选后拷贝到该程序中,就能即时朗读,可以实现初步的听文字了,只是声音有点突兀,有些多音字发音不是很准。

    四、意外之喜

    我在Mac电脑上试验成功后,就想到用此法可能破解360doc图书馆的文字封锁,即网文不能保存的限制。一试验果然行。当然,对于豆瓣、道客88等用Flash控件呈现网文的网站而言,此招还是无效。

    以前破解360doc网站的网文拷贝封锁,我用的办法一般是用Firefox+Noscript插件(Chrome上似乎也有类似插件),这种插件能把执行拷贝封锁任务的网页脚本程序禁用掉,结果网文就能拷贝了。

    五、遗憾之处

    在Mac上屡试不爽之后,我就想在Windows平台上实现类似的功能,但没有成功。    Safari for Windows的开发止步于5.1.7版,安装后只能发送网页链接,不能发网文。

    Chrome浏览器上有Email this page插件,但安装后试验失败。

    Firefox浏览器上也有类似插件,但也不能用。

    Opera浏览器似乎也只有发送网页链接的插件。

    只有Windows Vista上有个Mail程序,似乎有插入整个网页并作为邮件发送出去的功能。

    调查不够仔细,欢迎拍砖。

    六、更大的遗憾

    我又想到Firefox上过去有AutoPage等插件,能把分序码的几页网文拼接起来,合成一页看,类似的插件有Autopagerize, pagezipper, PageOne等(用这些关键字去找找,就有结果了)。

    我就想Safari上能否有这样的插件,找了半天,只有AutoPagerize可以,但官网网页出错。

    于是,市面上似乎找不到一款浏览器,既能合并分页,又能一键发送网文到邮箱。

    七、设计欠考虑

    实际上,苹果的iOS设备已经证明,用邮件来作为移动平台和PC平台的沟通媒介,是完全合适的。精致的iOS程序,一般都有把数据发送到邮箱的界面按钮。可惜这么多浏览器和操作系统平台,做不到尽善尽美的一键发送网文邮件 + 分页网文整合。只是MacOS/iOS + Safari最接近这个理想。

     而诸如Ever什么、Readit Later、InstaPaper、网文捕手等应用,无一不是?针对上述的保存网文的需求来的,我没怎么用过后面的这些东东,但这些东东一到一个客户端就要装一遍,哪像邮件客户端这样已经现成地遍地开花了呢?所以我觉得后面这些东西还是用处不很大,不知用过后面这些东西的人以为然否?

     既然欠考虑,那么退而求其次,就是用选择、拷贝、粘贴的办法,把网页直接粘贴到新建的邮件中,这被证明是可行的,即使是网页邮件的正文框,也可以毫不费力地存下拷贝的网页。

    文毕,欢迎大家指正。

    如月之恒,如日之升。 ——《诗经?小雅?无保》          

No comments:

Post a Comment