最近在写一个爬虫需要将网页进行解析供微信小程序使用。文字和图片解析都好说小程序也有对应的text和image标签可以呈现。而更复杂的SEO排名服务小程序也有对应的text和image标签可以呈现。而更复杂的比如表格则比较棘手不管是服务端解析还是小程序呈现都很费劲也很难覆盖所有情况。于是我想将表格对应的HTML代码转成图片不失为一种变通的方法。
这里我们采用node-webshot模块它对PhantomJS进行了轻量封装可以轻松地将网页以截图形式保存下来。
首先安装Node.js和PhantomJS然后新建一个js文件加载node-webshot模块:
const webshot =require('webshot');
定义选项:
const options ={
// 浏览器窗口
screenSize:{
width:755,
height:25
},
// 要截图的页面文档区域
shotSize:{
height:'all'
},
// 网页类型
siteType:'html'
};
这里浏览器窗口的宽度要根据网页情况合理设置高度可以设置为一个很小的数值然后页面文档区域的高度一定要设置为all宽度默认为窗口宽度SEO排名服务宽度默认为窗口宽度这样就可以把表格以最小的尺寸完整截图。
接下来定义html字符串:
let html ="target rich text html code, eg: <table>...</table>";
注意里面的HTML代码一定要去掉换行符并将双引号替换为单引号。
最后截图:
webshot(html,'demo.png', options,(err)=>{
if(err)
console.log(`Webshot error: ${err.message}`);
});
这样就实现了从HTML代码到本地图片的转换后续可以上传到七牛云等。不管是服务端的解析还是小程序的呈现都没有什么难度了...
二:微信小程序登录绕过CAS单点登录(SSO)认证检查
作者:林诺欧巴来自原文地址 1.为了让微信API能够绕过CAS认证检查将微信api入口部分设计为独立的模块。放入controller目录下命名为wechat。java文件为WechatController.java
文件大体内容如下:
@Controller
@RequestMapping("/wechat")
publicclassWechatController{
@RequestMapping(value="/dologin")
publicvoid dologin(HttpSession session,HttpServletRequest request,HttpServletResponse response)
...
}
2.因为绕过了CAS认证为了安全起见需要在这里做登陆检查。 大体思路是在dologin成功之后往session里面写一个标记比如写入用户名session.setAtribute("username",username); 其他的服务接口在函数开始的时候对session进行检查session.get6Attribute("username");如果为空表明没有登陆。
3.修改web.xml文件的cas过滤条件。
<filter>
....
<init-param>
<param-name>ignorePattern</param-name>
<param-value>wechat</param-value>