加入收藏 | 设为首页 | 会员中心 | 我要投稿 宁德站长网 (https://www.0593zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

收集一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配

发布时间:2016-11-28 23:29:08 所属栏目:大数据 来源:站长网
导读:正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。本贴随时会更新,请持续关注本站。 匹配中文字符的正则表达式: [u4e00-u9fa5] 匹配双字节字符(包括汉

正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。本贴随时会更新,请持续关注本站。

匹配中文字符的正则表达式: [u4e00-u9fa5]

匹配双字节字符(包括汉字在内):[^x00-xff]

应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;}

匹配空行的正则表达式:n[s| ]*r

匹配HTML标记的正则表达式:/lt;(.*)gt;.*lt;/1gt;|lt;(.*) /gt;/

匹配首尾空格的正则表达式:(^s*)|(s*$)

String.prototype.trim = function()
{
  return this.replace(/(^s*)|(s*$)/g, "");
}

利用正则表达式分解和转换IP地址:

下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序:

function IP2V(ip)
{
 re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正则表达式
if(re.test(ip))
{
return RegExp.1#8727;Math.pow(255,3))+RegExp.2*Math.pow(255,2))+RegExp.3#8727;255+RegExp.4*1
}
else
{
 throw new Error("Not a valid IP address!")
}
}

不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下:

var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

匹配网址URL的正则表达式:http://([w-]+.)+[w-]+(/[w- ./#63;%=]*)#63;

利用正则表达式去除字串中重复的字符的算法程序:[注:此程序不正确,原因见红色字体]

var s="abacabefgeeii"
var s1=s.replace(/(.).*1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"") 
alert(s1+s2) //结果为:abcefgi

===============================

如果var s = "abacabefggeeii"

结果就不对了,结果为:abeicfgg

正则表达式的能力有限

我原来在CSDN上发贴寻求一个表达式来实现去除重复字符的方法,最终没有找到,这是我能想到的最简单的实现方法。思路是使用后向引用取出包括重复的字符,再以重复的字符建立第二个表达式,取到不重复的字符,两者串连。这个方法对于字符顺序有要求的字符串可能不适用。

得用正则表达式从URL地址中提取文件名的javascript程序,如下结果为page1

s="http://www.9499.net/page1.htm"
s=s.replace(/(.*/){0,}([^.]+).*/ig,"$2")
alert(s)

利用正则表达式限制网页表单里的文本框输入内容:

用正则表达式限制只能输入中文:

onkeyup="value=value.replace(/[^u4E00-u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^u4E00-u9FA5]/g,''))"

用正则表达式限制只能输入全角字符:

 onkeyup="value=value.replace(/[^uFF00-uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^uFF00-uFFFF]/g,''))"

用正则表达式限制只能输入数字:

onkeyup="value=value.replace(/[^d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,''))"

用正则表达式限制只能输入数字和英文:

onkeyup="value=value.replace(/[W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,''))"

应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下:

/**
 * 计算字符串长度,将非宽字符计算为半个字符
 * 
 * @param str
 * @returns
 */
function gbLength(str) {
  return typeof str === "string" #63; str.length + str.replace(/[x00-x7f]/g, '').length + 1 gt;gt; 1 : 0;
}

/**
 * 获取字符串的指定长度的子串,将非宽字符计算为半个字符
 * 
 * @param str
 * @param length
 * @returns
 */
function gbSubstr(str, length) {
  if (typeof str !== "string")
    return str;
  length += length;
  for ( var n = 0, L = str.length; n lt; L  length gt; 0; n++){
    length -= str.charCodeAt(n) gt; 127 #63; 2 : 1;
  }
  return str.substr(0, n);
}
/**
 * 切割指定字符串的指定长度子串,如果长度超过指定长度,则丢弃末尾两个字符并附加...
 * 
 * @param str
 * @param len
 * @returns
 */
function fit_length(str, len){
  len = len || 16;
  if (typeof str !== "string" || str.length lt;= len || gbLength(str) lt;= len){
    return str;
  }
  var ret = gbSubstr(str, len - 2);
  return ret + '..';
}
var replaceCJK = /[^x00-xff]/g,
  testCJK  = /[^x00-xff]/;

    cjkLength: function(strValue){
      return strValue.replace(replaceCJK, "lv").length;
    },
    isCjk: function(strValue){
      return testCJK.test(strValue);
    },
    cutString: function(str,len,suffix,slen){
      suffix = suffix || '';
      slen = slen || suffix.length;
      if(str.length gt; len){
        str = str.substr(0,len - slen) + suffix;
      }
      return str;
    },
    cutCjkString: function(str,len,suffix,slen){
      suffix = suffix || '';
      slen = slen || suffix.length;
      len -= slen;
      if(this.cjkLength(str) lt;= len){
        return str;
      }
      var s = str.split(''),c = 0,tmpA = [];
      for(var i=0;ilt;s.length;i+=1){
        if(c lt; len){
          tmpA[tmpA.length] = s[i];
        }
        if(this.isCjk(s[i])){
          c += 2;
        }else{
          c += 1;
        }
      }
      return tmpA.join('') + suffix;
    }
  }

以上内容给大家分享我日常收集的一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~),希望大家喜欢。欲了解更多,请持续关注本站。

(编辑:宁德站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!