日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

Java使用httpRequest+Jsoup爬取紅藍球號碼

瀏覽:207日期:2022-08-09 14:38:03
目錄1、Jsoup介紹1.1、簡介1.2、Jsoup的主要功能2、源網站及頁面元素分析2.1、號碼源2.2、dom元素分析3、代碼實現1、Jsoup介紹1.1、簡介

jsoup 是一款Java 的HTML解析器,可直接解析某個URL地址、HTML文本內容。它提供了一套非常省力的API,可通過DOM,CSS以及類似于jQuery的操作方法來取出和操作數據。

1.2、Jsoup的主要功能

1、從一個URL,文件或字符串中解析HTML2、使用DOM或CSS選擇器來查找、取出數據3、可操作HTML元素、屬性、文本注意:jsoup是基于MIT協議發布的,可放心使用于商業項目。

2、源網站及頁面元素分析2.1、號碼源

首先,這里我選擇近年來比較穩定的數據源地址【某網站】截圖如下

Java使用httpRequest+Jsoup爬取紅藍球號碼

2.2、dom元素分析

2.2.1、開獎號碼主體分析

先打開開發者工具,找到每條開獎號碼對應的dom元素

可以看到每一期號碼信息主體在一個<tr>標簽中,其中第一個<td>是開獎日期,第二個<td>是開獎期號,第三個<td>是開獎號碼,每個獎號是單獨的標簽,紅球的class=rr,籃球沒有設置樣式

<tr> <td align='center'>2021-06-13</td> <td align='center'>2021065</td> <td style='padding-left:10px;'> <em class='rr'>01</em> <em class='rr'>04</em> <em class='rr'>08</em> <em class='rr'>19</em> <em class='rr'>29</em> <em class='rr'>33</em> <em>16</em></td> <td><strong>362,527,724</strong></td> <td style='color:#999;'><strong>3</strong></td> <td align='center'><strong class='rc'>82</strong></td> <td align='center'> <a rel='external nofollow' target='_blank'><img src='http://images.zhcw.com/zhcw2010/kaijiang/zhcw/ssqpd_42.jpg' ></a> <a rel='external nofollow' target='_blank'><img src='http://images.zhcw.com/zhcw2010/kaijiang/zhcw/ssqpd_43.jpg' ></a> </td></tr>

2.2.2、頁碼區域分析

由于我們爬取數據的時候,需要進行翻頁操作,所以這里還需要分析翻頁部分的內容,繼續在開發者工具中,定位頁碼區域

Java使用httpRequest+Jsoup爬取紅藍球號碼

可以看到頁碼部分是<tbody>中的最后一個<tr>中,翻頁操作的內容再class=pg的 <p> 標簽中可以拆分為多個<storage>標簽數組,可以分析得出翻頁鏈接的規律。/zhcw/inc/ssq/ssq_wqhg.jsp?pageNum=頁碼或/zhcw/html/ssq/list_頁碼.html

元素 含義 0 總頁數 1 總記錄數 2 第一頁的連接 3 上一頁的鏈接 4 下一頁的鏈接 5 最后一頁的連接 6 當前頁數

<tr> <td colspan='7' style='background:#fdf2e3;'><p class='zhu'></p><p class='pg'> 共<strong>136</strong> 頁 /<strong>2709 </strong>條記錄 <strong><a href='http://www.b3g6.com/zhcw/inc/ssq/ssq_wqhg.jsp' rel='external nofollow' >首頁</a></strong> <strong><a href='http://www.b3g6.com/zhcw/inc/ssq/ssq_wqhg.jsp?pageNum=1' rel='external nofollow' >上一頁</a></strong> <strong><a href='http://www.b3g6.com/zhcw/inc/ssq/ssq_wqhg.jsp?pageNum=2' rel='external nofollow' >下一頁</a></strong> <strong><a href='http://www.b3g6.com/zhcw/inc/ssq/ssq_wqhg.jsp?pageNum=136' rel='external nofollow' >末頁</a></strong> 當前第<strong> 1 </strong>頁</p> </td> </tr>3、代碼實現

maven引用,這里使用的是Jsoup1.13.1版本

<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.13.1</version> </dependency>

這使用的是基于jeecg開發的Job,搭建過程不贅述了,直接看主體代碼。

public void execute(JobExecutionContext arg0) throws JobExecutionException { Integer maxPage=getMaxPage();//獲取總頁數 for(int pageNo=0;pageNo<maxPage;pageNo++){//循環處理每一頁的數據 String url = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list_'+(pageNo+1)+'.html';//拼訪問地址 String strDateFormat = 'yyyy-MM-dd'; SimpleDateFormat sdf = new SimpleDateFormat(strDateFormat); String html = JwtHttpUtil.httpRequest(url, 'GET',null);//訪問對應的頁面 Document doc = Jsoup.parse(html);//用Jsoup解析頁面內容并且解析為Document Document doc1= Jsoup.parse(doc.getElementsByClass('wqhgt').toString());//wqhgt是table標簽的class,這里獲取到開獎號碼的table的內容并且解析為Document Elements trs= doc1.getElementsByTag('tr');//根據tag獲取到所有的tr標簽,這里獲取到的是一個Element數組 logger.info('當前頁碼---'+(pageNo+1)+'----'+trs.size()); for(int i=2;i<trs.size()-1;i++){//這里是根據頁面內容確定開獎內容是從第三個tr開始到倒數第二個tr結束,最后一個tr是翻頁按鈕 try { Elements tds=trs.get(i).getElementsByTag('td'); String kjrq=tds.get(0).text(); String kjqh=tds.get(1).text(); //這里是為了防止重復拉取,所以做了判斷,如果已存在當前期的獎號,就直接跳過 Long count=lotterySsqKjjlService.getCountForJdbc('select count(*) from lottery_ssq_kjjl where SSQ_KJQH=’'+ kjqh + '’'); //下面的內容很容易理解,就是可以對照頁面分析部分內容看,就不贅述了 if(count>0)break; LotterySsqKjjlEntity kjhmEntiry=new LotterySsqKjjlEntity();Elements kjhm=tds.get(2).getElementsByTag('em'); kjhmEntiry.setSsqKjrq(sdf.parse(kjrq)); kjhmEntiry.setSsqKjqh(kjqh);kjhmEntiry.setSsqR1(Integer.parseInt(kjhm.get(0).text()));kjhmEntiry.setSsqR2(Integer.parseInt(kjhm.get(1).text()));kjhmEntiry.setSsqR3(Integer.parseInt(kjhm.get(2).text()));kjhmEntiry.setSsqR4(Integer.parseInt(kjhm.get(3).text()));kjhmEntiry.setSsqR5(Integer.parseInt(kjhm.get(4).text()));kjhmEntiry.setSsqR6(Integer.parseInt(kjhm.get(5).text()));kjhmEntiry.setSsqB1(Integer.parseInt(kjhm.get(6).text()));lotterySsqKjjlService.save(kjhmEntiry); } catch (ParseException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (Exception e) { // TODO Auto-generated catch block e.printStackTrace(); } } } } private Integer getMaxPage(){ String url = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list.html'; String html = JwtHttpUtil.httpRequest(url, 'GET',null); Document doc = Jsoup.parse(html); Document docPageBar= Jsoup.parse(doc.getElementsByClass('pg').toString()); Elements elePageBar = docPageBar.getElementsByTag('strong'); Integer maxPageNo=Integer.parseInt(elePageBar.get(0).text()); return maxPageNo; }

以下是執行完成的部分數據截圖

Java使用httpRequest+Jsoup爬取紅藍球號碼

拉取到基礎數據后,我們可以再寫一個job,去計算出每期開獎號碼的指標,可以進行獎號分析,預測等。這里簡單實現了部分分析指標的計算,以下是主體代碼。

public void run(){ List<LotterySsqKjjlEntity> list= lotterySsqKjjlService.findByQueryString('from LotterySsqKjjlEntity t'); for(int i=0;i<list.size();i++){ LotterySsqKjjlEntity kjjg=list.get(i); logger.info('正在處理:'+kjjg.getSsqKjqh()); kjjg.setSsqMin(kjjg.getSsqR1());//最小號 kjjg.setSsqMax(kjjg.getSsqR6());//最大號 kjjg.setSsqKd(kjjg.getSsqR6()-kjjg.getSsqR1());//號碼跨度 kjjg.setSsqJsCnt(ssqKjjgUtils(kjjg, 'jsCnt'));//奇數個數 kjjg.setSsqOsCnt(ssqKjjgUtils(kjjg, 'osCnt'));//偶數個數 kjjg.setSsqSum(ssqKjjgUtils(kjjg, 'sum'));//號碼和 lotterySsqKjjlService.updateEntitie(kjjg); } logger.info('結果數據條數'+list.size()); } /** * * @param kjjg * @param opType jsgs=奇數個數 * @return */ private Integer ssqKjjgUtils(LotterySsqKjjlEntity kjjg,String opType){ List<Integer> t =new ArrayList<Integer>(); t.add(kjjg.getSsqR1()); t.add(kjjg.getSsqR2()); t.add(kjjg.getSsqR3()); t.add(kjjg.getSsqR4()); t.add(kjjg.getSsqR5()); t.add(kjjg.getSsqR6()); Integer result=0; switch (opType) { case 'jsCnt': case 'osCnt': int jsgs=0; int osgs=0; for(int i=0;i<t.size();i++){ if(t.get(i)%2==0){ osgs++; }else{ jsgs++; } } if('jsCnt'.equals(opType)){ result=jsgs; }else{ result=osgs; } break; case 'sum': int sum=0; for(int i=0;i<t.size();i++){ sum+=t.get(i); } result=sum; break; default: break; } return result; }

至此,這個簡單的爬蟲就寫完了,可以利用爬過來的這些基礎數據,進行一些數據分析,預測。

到此這篇關于Java使用httpRequest+Jsoup爬取紅藍球號碼的文章就介紹到這了,更多相關Java 爬取紅藍球號碼內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Java
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
午夜在线观看免费一区| 国内激情久久| 日韩国产在线观看一区| 日本精品一区二区三区在线观看视频 | 欧美三区不卡| 日本久久一区| 国产一区二区三区四区| 亚洲天堂久久| 亚洲啊v在线免费视频| **爰片久久毛片| 日韩av有码| 一本一本久久| 91精品国产一区二区在线观看| 精品视频一区二区三区在线观看| 欧洲一级精品| 激情欧美一区| 日韩一区二区三区精品视频第3页 日韩一区二区三区免费视频 | 69精品国产久热在线观看| 国产精品二区影院| a国产在线视频| 久久夜色精品| 麻豆91在线播放| 黄色亚洲大片免费在线观看| 日韩**一区毛片| 日韩欧美一区二区三区在线视频| 久久狠狠久久| 日韩欧美另类一区二区| 蜜桃av一区二区在线观看| 麻豆精品久久| 亚洲成人二区| 91亚洲无吗| 日韩久久视频| 婷婷五月色综合香五月| 久久电影tv| 亚洲资源网站| 中文在线а√天堂| 日韩中文字幕在线一区| 久久中文亚洲字幕| 国产精品一站二站| 成人av二区| 精品一区二区三区的国产在线观看| 911亚洲精品| 日韩精品一卡| 欧美激情亚洲| 亚洲网址在线观看| 日韩精品免费一区二区三区| 日韩手机在线| 亚洲天堂成人| 成人国产精品一区二区网站| 首页亚洲欧美制服丝腿| 精品欧美一区二区三区在线观看| 黄色在线网站噜噜噜| 丝袜美腿亚洲一区二区图片| 成人黄色av| 91免费精品国偷自产在线在线| 日本 国产 欧美色综合| 福利一区二区免费视频| 欧美一级网址| 综合激情一区| 久久久久国产精品一区二区| 国产伦精品一区二区三区视频 | 亚洲欧美久久| 色婷婷综合网| 国产精品久久久免费| 综合亚洲色图| 另类激情亚洲| 久久亚洲精品中文字幕蜜潮电影| 日韩精品水蜜桃| 国产精东传媒成人av电影| 美日韩精品视频| 99国产精品免费视频观看| 久久精品99久久久| 亚洲永久精品唐人导航网址| 婷婷亚洲五月| 亚洲天堂成人| 伊人久久大香线蕉av不卡| 国产96在线亚洲| 久久精品一区二区三区中文字幕| 深夜福利视频一区二区| 国产精品chinese| 免费视频最近日韩| 亚洲精品一区二区妖精| 国产精品99一区二区| 亚洲a一区二区三区| 久久蜜桃精品| 日韩精品电影| 不卡一二三区| 亚洲午夜天堂| av资源中文在线天堂| 福利一区二区免费视频| 97在线精品| 国产不卡精品在线| 麻豆国产91在线播放| 久久精品国产99国产| 另类欧美日韩国产在线| 久久亚洲人体| av免费不卡国产观看| 精品捆绑调教一区二区三区| 99精品小视频| 亚洲少妇诱惑| 中文久久精品| 日韩在线卡一卡二| 日韩和欧美一区二区三区| 日本欧美在线| 久久中文字幕导航| 久久国产毛片| 免费欧美日韩| 日本不卡视频一二三区| 国产日本久久| 精品72久久久久中文字幕| 欧美日韩在线观看首页| 欧美日韩在线观看视频小说| 在线综合视频| 青青草伊人久久| 精品五月天堂| 欧美 日韩 国产精品免费观看| 亚洲制服欧美另类| 日本免费在线视频不卡一不卡二| 日韩成人高清| 99久久夜色精品国产亚洲1000部| 日韩精品亚洲专区| 日韩不卡在线观看日韩不卡视频| 午夜av成人| 色爱av综合网| 午夜在线播放视频欧美| 久久国际精品| 久久久久久美女精品| 水蜜桃久久夜色精品一区的特点 | 精品资源在线| 99久久夜色精品国产亚洲狼 | 狠狠色狠狠色综合日日tαg| 国产亚洲永久域名| 国产精品久久久久久模特| 一本大道色婷婷在线| 亚洲日产国产精品| 成人午夜在线| 欧美成人久久| 国产麻豆一区| 伊人影院久久| 国产精品v一区二区三区| 久久香蕉国产| 国产丝袜一区| 亚洲天堂成人| 国产精品啊v在线| 自由日本语亚洲人高潮| 国产精品一区二区av交换| 999久久久国产精品| 日韩国产在线不卡视频| 久久青草久久| 国产精品亚洲片在线播放| 婷婷综合激情| 成人精品高清在线视频| 综合视频一区| 激情欧美日韩一区| 蜜桃精品视频| 人人精品人人爱| 亚洲天堂免费电影| 国产精品欧美日韩一区| 久久不射中文字幕| 亚洲涩涩在线| 国产精品毛片久久久| 国产午夜久久| 日韩欧美中文| 你懂的国产精品| 老色鬼久久亚洲一区二区| 日韩黄色大片网站| 国产精品久久久久久模特| 日韩精品一区第一页| 欧美精品资源| 美女免费视频一区| 日韩动漫一区| 中文不卡在线| 一区三区视频| 日韩不卡在线| 成人国产精品| 精品国产一区二区三区噜噜噜| 精品一区二区三区中文字幕| 欧美精选一区二区三区| 国产专区精品| 国产精品男女| 欧美日韩亚洲一区在线观看| 伊人国产精品| 爽好久久久欧美精品| 欧美一级精品| 日韩免费福利视频| 精品一区二区三区的国产在线观看 | 天堂日韩电影| 久久99性xxx老妇胖精品| 亚洲精品进入| 日韩午夜高潮| 免费国产自久久久久三四区久久| 精品91久久久久| 日韩深夜视频| 97精品国产| 欧美激情五月| 国产精品777777在线播放| 国产日韩中文在线中文字幕| 久久精品99国产精品| 国产伦精品一区二区三区千人斩 | 欧美国产日本|