The RSS
从BLOG到电子书——把wordpress备份的WXR转为epub
原文链接:http://mental.8gua.me/mental/entry/224/my_weblog
分类:(未分类)
TAG:
本文被浏览了205次
作者:猛禽 | 2011-09-07 18:43:00 | 0评

古人云,敝帚自珍。

虽然自己写的BLOG都是些没营养的东西,但还是想收藏起来。

花了点时间研究了一下epub格式,写了段转换程序,把Wordpress导出的备份文件WXR转成epub格式。

本想贴代码凑数,结果发现代码还是多了点,所以还是改成下载吧。

第一个是生成epub的库:epubbuilder.py

之后是解析WXR并调用epubbuilder生成epub的主程序:wxr2epub.py

下载:wxr2epub source code 5.4K(GPL)

使用时在源目录下放一个叫做wordpress.xml的WXR文件,再创建一个images的子目录,里面放上文章中所有引用过的图片,最好有一 个叫cover.jpg的,这个图片将会被作为电子书的封面。生成的电子书每一篇文章及其评论会作为电子书的一个章节,文章多的话,目录项会很多,某些电 子书软件可能无法完全显示所有目录项。

所以说,还是开放好啊。Wordpress的WXR用的是开放的XML格式,epub也是用开放的zip+HTML+XML格式。像CSDN BLOG这种自己开发的平台就没办法了……

推送到[go4pro.org]

为了保证评论的有效性,我们需要对评论做出审核后进行发布。另外敬请在表单的Approved字段中随便填写一些东西——这是为了防止spam。

Ver 2.0,2009 - 2012,Go4Pro.org
知识共享许可协议
Go4Pro.org is licensed under a Creative Commons 署名-非商业性使用-相同方式共享 3.0 Unported License.
Go4Pro老版请访问:legacy.go4pro.org | Q & A

Valid XHTML 1.0 Transitional  Valid CSS!