html页面获取后端数据
目录
html页面获取后端数据
项目场景:
记一次根据html页面转换成后端数据经历
问题描述:
一次项目经历需要去获取谷歌云平台的某个页面的数据,查询接口文档无果,后来在浏览器控制台上发现了获取该页面数据的接口,并且不需要携带对应的鉴权信息,但是返回的是一个html页面,遂将该html页面转换成后端需要的数据,以此记录
解决方案:
首先因为是将获取到html页面,所以需要引入Jsoup 来解析对应的html页面
其次,根据想要的数据去找对应的html标签,比如说我这边需要的是白色字体的数据,这些数据是在标签table下的td标签里面的,所以就是
Document parse = Jsoup.parse(result);
Elements elements = Objects.requireNonNull(parse).select("table").get(0).select("td");
List<String> collect = elements.stream().map(Element::text).collect(Collectors.toList());
其中result 就是获取到的html页面,最终的collect就是获取到的后端数据