获取知乎专栏的所有文章并合成pdf

FindHao 2018-11-1 471

使用的代码:

https://gitee.com/crossin/snippet/blob/master/get_zhihu/get_zhihu.py

可以把最后的topdf函数注释掉,因为apt安装的wkhtmltopdf经常出问题,不能转换多个html文件。只使用前面的代码即可。

python3 get_zhihu.py

执行,输入专栏的id,下载所有的html文件。

执行下面的代码转换所有的html文件并合成一个pdf文件:

for i in `ls *html` 
do
	wkhtmltopdf -s B6 ./"$i" $i.pdf 
done
b=`ls *pdf`
pdfunite $b out.pdf

里面纸张大小设置成了B6,方便在10寸的n96上看。

最新回复 (0)
全部楼主
返回