目录

html页面获取后端数据

html页面获取后端数据

https://img-home.csdnimg.cn/images/20240711112329.png

项目场景:

记一次根据html页面转换成后端数据经历


问题描述:

一次项目经历需要去获取谷歌云平台的某个页面的数据,查询接口文档无果,后来在浏览器控制台上发现了获取该页面数据的接口,并且不需要携带对应的鉴权信息,但是返回的是一个html页面,遂将该html页面转换成后端需要的数据,以此记录

https://i-blog.csdnimg.cn/blog_migrate/2ac41d4ff49ab6c19c201f0291bba067.png

解决方案:

首先因为是将获取到html页面,所以需要引入Jsoup 来解析对应的html页面

https://i-blog.csdnimg.cn/blog_migrate/37672638d3c61b1bd25c9da8bc726692.png

其次,根据想要的数据去找对应的html标签,比如说我这边需要的是白色字体的数据,这些数据是在标签table下的td标签里面的,所以就是 https://i-blog.csdnimg.cn/blog_migrate/9f8be729ab91b54fe373a8dbbc74eb6b.png

     Document parse = Jsoup.parse(result); 
     
     Elements elements = Objects.requireNonNull(parse).select("table").get(0).select("td"); 
     
     List<String> collect = elements.stream().map(Element::text).collect(Collectors.toList());

其中result 就是获取到的html页面,最终的collect就是获取到的后端数据

https://i-blog.csdnimg.cn/blog_migrate/380dd0900a31337a623dc1aaa653aebd.png