校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > Java中使用正則表達式處理文本數據

Java中使用正則表達式處理文本數據

熱門標簽:宿遷智能外呼系統供應商 地圖標注商戶中心要收錢多少 400免費電話去哪申請 菏澤智能ai電銷機器人銷售公司 鄂州人工智能電銷機器人軟件 css百度地圖標注位置顯示 實用地圖標注app 線上教育ai外呼系統 地圖標注字母的軟件

本文將介紹如何在Java中使用正則表達式來處理文本數據。正則表達式就是一個字符串,但和普通的字符串不同的是,正則表達式是對一組相似字符串的抽象,如下面的幾個字符串:

a98b   c0912d   c10b   a12345678d   ab

我們仔細分析上面五個字符串,可以看出它們有一個共同特征,就是第一個字符必須是'a'或'c',最后一個字符必須是'b'或'd',而中間的字符是任意多個數字組成(包括0個數字)。因此,我們可以將這五個字符串的共同特點抽象出來,這就產生了一個正則表達式:[ac]\\d*[bd]。而根據這個正則表達式,我們可以寫出無窮多個滿足條件的字符串。

在Java中使用正則表達式的方法非常多,最簡單的就是和字符串一起使用。在String中有四個方法可以使用正則表達式,它們是matches、split、replaceAll和replaceFirst。

一、matches方法

matches方法可以判斷當前的字符串是否匹配給定的正則表達式。如果匹配,返回true,否則,返回false。matches方法的定義如下:

復制代碼 代碼如下:

public boolean matches(String regex)

如上面給出的正則表達式我們可以用如下程序驗證。

!---->String[] ss = new String[]{"a98b", "c0912d", "c10b", "a12345678d", "ab"};
for(String s: ss)
 System.out.println(s.matches("[ac]\\d*[bd]"));

輸出結果:

true
true
true
true
true

下面簡單解釋一下這個正則表達式的含義。如果我們學過編譯原理的詞法分析,就會很容易理解上面的正則表達式(因為正則表達式的表示方法和詞法分析中的表達式類似)。如在 [...]中的相當于或"|",如[abcd]相當于a|b|c|d,也就是a或b或c或d。如上面的正則表達式的開頭部分是[ac],就代表著字符串的開頭只能是a或c。[bd]表達字符串結尾只能是b或d。而中間的\d表達0-9的數字,由于\在正則表達式中有特殊含義,所以用\\來表示\。而*表示有0或無窮多個(這在詞法分析中叫*閉包),由于*跟在\d后面,因此表達有0或無窮多個數字。

二、split方法

split方法使用正則表達式來分割字符串,并以String數組的形式返回分割結果。split有兩種重載形式,它們定義如下:

!---->public String[] split(String regex)
public String[] split(String regex, int limit)

如下面的代碼將使用split的第一種重載形式來分割HTTP請求頭的第一行,代碼如下:

!---->String s = "GET /index.html HTTP/1.1";
String ss[] = s.split(" +");
for(String str: ss)
System.out.println(str);

輸出結果:

GET
/index.html
HTTP/1.1

在使用split的第一種重載形式時應注意,如果分割后的字符串最后有空串,將被忽略。如使用正則表達式\d來分割字符串a0b1c3456時,得到的數組的長度為3,而不是7。

在split的第二種重載形式中有一個limit參數,要分三種情況討論:

1. 大于0: 如limit的值為n,那么將對正則表達式使用n-1次,下面的代碼:

!---->String s = "a0b1c3456";
String ss[] = s.split("\\d", 3);
for(String str: ss)
  System.out.println(str);

輸出結果:

a
b
c3456

從輸出結果可以看出,程序只對" a0b1c3456"使用了兩次正則表達式,也就是在少掃描完字符'1'后,不管后面有沒有滿足條件的字符串,都將后面的字符串作為一個整體來作為返回數組的最后一個值。

2. 小于0: 不忽略結尾的空串。也就是上面的例子返回數組的長度應該是7,而不是3。

3. 等于0:這是默認值,相當于split的第一種重載形式。

三、replaceAll 和 replaceFirst方法

為兩個方法的定義如下:

public String replaceAll(String regex, String replacement)
public String replaceFirst(String regex, String replacement)

這兩個方法用replacement替換當前字符串中和regex匹配的字符串。使用方法很簡單,這里不再詳述,感興趣的讀者可以參考相關的文檔。

您可能感興趣的文章:
  • Java正則表達式實現在文本中匹配查找換行符的方法【經典實例】
  • Java基于正則表達式實現查找匹配的文本功能【經典實例】
  • Java基于正則表達式實現的替換匹配文本功能【經典實例】
  • Java 正則表達式詳解
  • Java 正則表達式學習總結和一些小例子
  • java中 利用正則表達式提取( )內內容
  • Java正則表達式入門基礎篇(新手必看)
  • java正則表達式四種常用的處理方式(匹配、分割、替代、獲取)
  • java正則表達式表單驗證類工具類(驗證郵箱、手機號碼、qq號碼等)
  • JAVA中正則表達式匹配,替換,查找,切割的方法
  • Java使用正則表達式獲取子文本的方法示例

標簽:咸陽 綿陽 恩施 鞍山 梅州 三亞 六安 池州

巨人網絡通訊聲明:本文標題《Java中使用正則表達式處理文本數據》,本文關鍵詞  Java,中,使用,正則,表達式,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Java中使用正則表達式處理文本數據》相關的同類信息!
  • 本頁收集關于Java中使用正則表達式處理文本數據的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 环江| 区。| 昌黎县| 海丰县| 若羌县| 青冈县| 龙州县| 五峰| 黔西县| 什邡市| 白沙| 连云港市| 庄河市| 广安市| 富平县| 铜梁县| 大宁县| 安新县| 石城县| 临朐县| 郧西县| 芜湖县| 墨江| 磴口县| 绥芬河市| 华亭县| 秦皇岛市| 句容市| 西藏| 县级市| 成武县| 天水市| 漳州市| 平顶山市| 昭觉县| 德江县| 平阴县| 龙泉市| 兰州市| 积石山| 敦化市|