Java匹配中文的正则表达式

清华大佬耗费三个月吐血整理的几百G的资源,免费分享!....>>>

[\u4E00-\u9FA5]汉字﹐[\uFE30-\uFFA0]全角字符 [\u4E00-\u9FA5]汉字﹐[\uFE30-\uFFA0]全角字符所以说 ,Java的正则表达式是可以匹配中文字符的,同时,用中文字符来写表达式也是可以的.

正则表达式

public static void regxChinese(){  
       // 要匹配的字符串     
       String source = "<span title='5 星级酒店' class='dx dx5'>";  
       // 将上面要匹配的字符串转换成小写     
      // source = source.toLowerCase();     
       // 匹配的字符串的正则表达式     
       String reg_charset = "<span[^>]*?title=\'([0-9]*[\\s|\\S]*[\u4E00-\u9FA5]*)\'[\\s|\\S]*class=\'[a-z]*[\\s|\\S]*[a-z]*[0-9]*\'";       

       Pattern p = Pattern.compile(reg_charset);     
       Matcher m = p.matcher(source);     
       while (m.find()) {     
        System.out.println(m.group(1));  
       }  
} 
 public static void regxChinese(){
        // 要匹配的字符串  
        String source = "<span title='5 星级酒店' class='dx dx5'>";
        // 将上面要匹配的字符串转换成小写  
       // source = source.toLowerCase();  
        // 匹配的字符串的正则表达式  
        String reg_charset = "<span[^>]*?title=\'([0-9]*[\\s|\\S]*[\u4E00-\u9FA5]*)\'[\\s|\\S]*class=\'[a-z]*[\\s|\\S]*[a-z]*[0-9]*\'";    

        Pattern p = Pattern.compile(reg_charset);  
        Matcher m = p.matcher(source);  
        while (m.find()) {  
         System.out.println(m.group(1));
        }
 }