•測(cè)試字符串的某個(gè)模式。例如,可以對(duì)一個(gè)輸入字符串進(jìn)行測(cè)試,看在該字符串是否存在一個(gè)電話號(hào)碼模式或一個(gè)信用卡號(hào)碼模式。這稱為數(shù)據(jù)有效性驗(yàn)證
•替換文本。可以在文檔中使用一個(gè)正則表達(dá)式來標(biāo)識(shí)特定文字,然后可以全部將其刪除,或者替換為別的文字 •根據(jù)模式匹配從字符串中提取一個(gè)子字符串??梢杂脕碓谖谋净蜉斎胱侄沃胁檎姨囟ㄎ淖? 正則表達(dá)式語法 一個(gè)正則表達(dá)式就是由普通字符(例如字符 a 到 z)以及特殊字符(稱為元字符)組成的文字模式。該模式描述在查找文字主體時(shí)待匹配的一個(gè)或多個(gè)字符串。正則表達(dá)式作為一個(gè)模板,將某個(gè)字符模式與所搜索的字符串進(jìn)行匹配。 創(chuàng)建正則表達(dá)式
var re = new RegExp();//RegExp是一個(gè)對(duì)象,和Aarray一樣 //但這樣沒有任何效果,需要將正則表達(dá)式的內(nèi)容作為字符串傳遞進(jìn)去 re =new RegExp("a");//最簡單的正則表達(dá)式,將匹配字母a re=new RegExp("a","i");//第二個(gè)參數(shù),表示匹配時(shí)不分大小寫 RegExp構(gòu)造函數(shù)第一個(gè)參數(shù)為正則表達(dá)式的文本內(nèi)容,而第一個(gè)參數(shù)則為可選項(xiàng)標(biāo)志.標(biāo)志可以組合使用 •g (全文查找) •i (忽略大小寫) •m (多行查找)
var re = new RegExp("a","gi");//匹配所有的a或A 正則表達(dá)式還有另一種正則表達(dá)式字面量的聲明方式
var re = /a/gi; 和正則表達(dá)式相關(guān)的方法和屬性 正則表達(dá)式對(duì)象的方法 •test,返回一個(gè) Boolean 值,它指出在被查找的字符串中是否存在模式。如果存在則返回 true,否則就返回 false。 •exec,用正則表達(dá)式模式在字符串中運(yùn)行查找,并返回包<script type="text/javascript" src="http://www./javascripts/tinymce/themes/advanced/langs/zh.js"></script><script type="text/javascript" src="http://www./javascripts/tinymce/plugins/javaeye/langs/zh.js"></script>含該查找結(jié)果的一個(gè)數(shù)組。 •compile,把正則表達(dá)式編譯為內(nèi)部格式,從而執(zhí)行得更快。 正則表達(dá)式對(duì)象的屬性 •source,返回正則表達(dá)式模式的文本的復(fù)本。只讀。 •lastIndex,返回字符位置,它是被查找字符串中下一次成功匹配的開始位置。 •$1...$9,返回九個(gè)在模式匹配期間找到的、最近保存的部分。只讀。 •input ($_),返回執(zhí)行規(guī)范表述查找的字符串。只讀。 •lastMatch ($&),返回任何正則表達(dá)式搜索過程中的最后匹配的字符。只讀。 •lastParen ($+),如果有的話,返回任何正則表達(dá)式查找過程中最后括的子匹配。只讀。 •leftContext ($`),返回被查找的字符串中從字符串開始位置到最后匹配之前的位置之間的字符。只讀。 •rightContext ($'),返回被搜索的字符串中從最后一個(gè)匹配位置開始到字符串結(jié)尾之間的字符。只讀。 String對(duì)象一些和正則表達(dá)式相關(guān)的方法 •match,找到一個(gè)或多個(gè)正則表達(dá)式的匹配。 •replace,替換與正則表達(dá)式匹配的子串。 •search,檢索與正則表達(dá)式相匹配的值。 •split,把字符串分割為字符串?dāng)?shù)組。 測(cè)試正則表達(dá)式是如何工作的!
//test方法,測(cè)試字符串,符合模式時(shí)返回true,否則返回false var re = /he/;//最簡單的正則表達(dá)式,將匹配he這個(gè)單詞 var str = "he"; alert(re.test(str));//true str = "we"; alert(re.test(str));//false str = "HE"; alert(re.test(str));//false,大寫,如果要大小寫都匹配可以指定i標(biāo)志(i是ignoreCase或case-insensitive的表示) re = /he/i; alert(re.test(str));//true str = "Certainly!He loves her!"; alert(re.test(str));//true,只要包含he(HE)就符合,如果要只是he或HE,不能有其它字符,則可使用^和$ re = /^he/i;//脫字符(^)代表字符開始位置 alert(re.test(str));//false,因?yàn)閔e不在str最開始 str = "He is a good boy!"; alert(re.test(str));//true,He是字符開始位置,還需要使用$ re = /^he$/i;//$表示字符結(jié)束位置 alert(re.test(str));//false str = "He"; alert(re.test(str));//true //當(dāng)然,這樣不能發(fā)現(xiàn)正則表達(dá)式有多強(qiáng)大,因?yàn)槲覀兺耆梢栽谏厦娴睦又惺褂?=或indexOf re = /\s/;// \s匹配任何空白字符,包括空格、制表符、換頁符等等 str= "user Name";//用戶名包含空格 alert(re.test(str));//true str = "user Name";//用戶名包含制表符 alert(re.test(str));//true re=/^[a-z]/i;//[]匹配指定范圍內(nèi)的任意字符,這里將匹配英文字母,不區(qū)分大小寫 str="variableName";//變量名必須以字母開頭 alert(re.test(str));//true str="123abc"; alert(re.test(str));//false 當(dāng)然,僅僅知道了字符串是否匹配模式還不夠,我們還需要知道哪些字符匹配了模式
var osVersion = "Ubuntu 8";//其中的8表示系統(tǒng)主版本號(hào) var re = /^[a-z]+\s+\d+$/i; //+號(hào)表示字符至少要出現(xiàn)1次,\s表示空白字符,\d表示一個(gè)數(shù)字 alert(re.test(osVersion));//true,但我們想知道主版本號(hào) //另一個(gè)方法exec,返回一個(gè)數(shù)組,數(shù)組的第一個(gè)元素為完整的匹配內(nèi)容 re=/^[a-z]+\s+\d+$/i; arr = re.exec(osVersion); alert(arr[0]);//將osVersion完整輸出,因?yàn)檎麄€(gè)字符串剛好匹配re //我只需要取出數(shù)字 re=/\d+/; var arr = re.exec(osVersion); alert(arr[0]);//8 更復(fù)雜的用法,使用子匹配
//exec返回的數(shù)組第1到n元素中包含的是匹配中出現(xiàn)的任意一個(gè)子匹配 re=/^[a-z]+\s+(\d+)$/i;//用()來創(chuàng)建子匹配 arr =re.exec(osVersion); alert(arr[0]);//整個(gè)osVersion,也就是正則表達(dá)式的完整匹配 alert(arr[1]);//8,第一個(gè)子匹配,事實(shí)也可以這樣取出主版本號(hào) alert(arr.length);//2 osVersion = "Ubuntu 8.10";//取出主版本號(hào)和次版本號(hào) re = /^[a-z]+\s+(\d+)\.(\d+)$/i;//.是正則表達(dá)式元字符之一,若要用它的字面意義須轉(zhuǎn)義 arr = re.exec(osVersion); alert(arr[0]);//完整的osVersion alert(arr[1]);//8 alert(arr[2]);//10 注意,當(dāng)字符串不匹配re時(shí),exec方法將返回null String對(duì)象的一些和正則表達(dá)式有關(guān)的方法
//replace方法,用于替換字符串 var str ="some money"; alert(str.replace("some","much"));//much money //replace的第一個(gè)參數(shù)可以為正則表達(dá)式 var re = /\s/;//空白字符 alert(str.replace(re,"%"));//some%money //在不知道字符串中有多少空白字符時(shí),正則表達(dá)式極為方便 str ="some some \tsome\t\f"; re = /\s+/; alert(str.replace(re,"#"));//但這樣只會(huì)將第一次出現(xiàn)的一堆空白字符替換掉 //因?yàn)橐粋€(gè)正則表達(dá)式只能進(jìn)行一次匹配,\s+匹配了第一個(gè)空格后就退出了 re = /\s+/g;//g,全局標(biāo)志,將使正則表達(dá)式匹配整個(gè)字符串 alert(str.replace(re,"@"));//some@some@some@ //另一個(gè)與之相似的是split var str = "a-bd-c"; var arr = str.split("-");//返回["a","bd","c"] //如果str是用戶輸入的,他可能輸入a-bd-c也可能輸入a bd c或a_bd_c,但不會(huì)是abdc(這樣就說他輸錯(cuò)了) str = "a_db-c";//用戶以他喜歡的方式加分隔符s re=/[^a-z]/i;//前面我們說^表示字符開始,但在[]里它表示一個(gè)負(fù)字符集 //匹配任何不在指定范圍內(nèi)的任意字符,這里將匹配除字母處的所有字符 arr = str.split(re);//仍返回["a","bd","c"]; //在字符串中查找時(shí)我們常用indexOf,與之對(duì)應(yīng)用于正則查找的方法是search str = "My age is 18.Golden age!";//年齡不是一定的,我們用indexOf不能查找它的位置 re = /\d+/; alert(str.search(re));//返回查找到的字符串開始下標(biāo)10 //注意,因?yàn)椴檎冶旧砭褪浅霈F(xiàn)第一次就立即返回,所以無需在search時(shí)使用g標(biāo)志 //下面的代碼雖然不出錯(cuò),但g標(biāo)志是多余的 re=/\d+/g; alert(str.search(re));//仍然是10 注意,當(dāng)search方法沒有找到匹配時(shí),將返回-1 類似于exec方法,String對(duì)象的match方法也用于將字符串與正則表達(dá)式進(jìn)行匹配并返回結(jié)果數(shù)組
var str = "My name is CJ.Hello everyone!"; var re = /[A-Z]/;//匹配所有大寫字母 var arr = str.match(re);//返回?cái)?shù)組 alert(arr);//數(shù)組中只會(huì)包含一個(gè)M,因?yàn)槲覀儧]有使用全局匹配 re = /[A-Z]/g; arr = str.match(re); alert(arr);//M,C,J,H //從字符串中抽取單詞 re = /\b[a-z]*\b/gi;//\b表示單詞邊界 str = "one two three four"; alert(str.match(re));//one,two,three,four RegExp對(duì)象實(shí)例的一些屬性
var re = /[a-z]/i; alert(re.source);//將[a-z]字符串輸出 //請(qǐng)注意,直接alert(re)會(huì)將正則表達(dá)式連同前向斜線與標(biāo)志輸出,這是re.toString方法定義的 每個(gè)RegExp對(duì)象的實(shí)例具有l(wèi)astIndex屬性,它是被查找字符串中下一次成功匹配的開始位置,默認(rèn)值是-1。 lastIndex 屬性被 RegExp 對(duì)象的 exec 和 test 方法修改.并且它是可寫的.
var re = /[A-Z]/; //exec方法執(zhí)行后,修改了re的lastIndex屬性, var str = "Hello,World!!!"; var arr = re.exec(str); alert(re.lastIndex);//0,因?yàn)闆]有設(shè)置全局標(biāo)志 re = /[A-Z]/g; arr = re.exec(str); alert(re.lastIndex);//1 arr = re.exec(str); alert(re.lastIndex);//7 當(dāng)匹配失?。ê竺鏇]有匹配),或lastIndex值大于字符串長度時(shí),再執(zhí)行exec等方法會(huì)將lastIndex設(shè)為0(開始位置)
var re = /[A-Z]/; var str = "Hello,World!!!"; re.lastIndex = 120; var arr = re.exec(str); alert(re.lastIndex);//0 RegExp對(duì)象的靜態(tài)屬性
//input 最后用于匹配的字符串(傳遞給test,exec方法的字符串) var re = /[A-Z]/; var str = "Hello,World!!!"; var arr = re.exec(str); alert(RegExp.input);//Hello,World!!! re.exec("tempstr"); alert(RegExp.input);//仍然是Hello,World!!!,因?yàn)閠empstr不匹配 //lastMatch 最后匹配的字符 re = /[a-z]/g; str = "hi"; re.test(str); alert(RegExp.lastMatch);//h re.test(str); alert(RegExp["$&"]);//i ,$&是lastMatch的短名字,但由于它不是合法變量名,所以要。。 //lastParen 最后匹配的分組 re = /[a-z](\d+)/gi; str = "Class1 Class2 Class3"; re.test(str); alert(RegExp.lastParen);//1 re.test(str); alert(RegExp["$+"]);//2 //leftContext 返回被查找的字符串中從字符串開始位置到最后匹配之前的位置之間的字符 //rigthContext 返回被搜索的字符串中從最后一個(gè)匹配位置開始到字符串結(jié)尾之間的字符 re = /[A-Z]/g; str = "123ABC456"; re.test(str); alert(RegExp.leftContext);//123 alert(RegExp.rightContext);//BC456 re.test(str); alert(RegExp["$`"]);//123A alert(RegExp["$'"]);//C456 multiline屬性返回正則表達(dá)式是否使用多行模式,這個(gè)屬性不針對(duì)某個(gè)正則表達(dá)式實(shí)例,而是針對(duì)所有正則表達(dá)式,并且這個(gè)屬性可寫.(IE與Opera不支持這個(gè)屬性)
alert(RegExp.multiline); //因?yàn)镮E,Opera不支持這個(gè)屬性,所以最好還是單獨(dú)指定 var re = /\w+/m; alert(re.multiline); alert(RegExp["$*"]);//RegExp對(duì)象的靜態(tài)屬性不會(huì)因?yàn)榻oRegExp某個(gè)對(duì)象實(shí)例指定了m標(biāo)志而改變 RegExp.multiline = true;//這將打開所有正則表達(dá)式實(shí)例的多行匹配模式 alert(RegExp.multiline); 使用元字符注意事項(xiàng):元字符是正則表達(dá)式的一部分,當(dāng)我們要匹配正則表達(dá)式本身時(shí),必須對(duì)這些元字符轉(zhuǎn)義.下面是正則表達(dá)式用到的所有元字符 ( [ { \ ^ $ | ) ? * + .
var str = "?"; var re = /?/; alert(re.test(str));//出錯(cuò),因?yàn)??是元字符,必須轉(zhuǎn)義 re = /\?/; alert(re.test(str));//true 使用RegExp構(gòu)造函數(shù)與使用正則表達(dá)式字面量創(chuàng)建正則表達(dá)式注意點(diǎn)
var str = "\?"; alert(str);//只會(huì)輸出? var re = /\?/;//將匹配? alert(re.test(str));//true re = new RegExp("\?");//出錯(cuò),因?yàn)檫@相當(dāng)于re = /\?/ re = new RegExp("\\?");//正確,將匹配? alert(re.test(str));//true 既然雙重轉(zhuǎn)義這么不友好,所以還是用正則表達(dá)式字面量的聲明方式 如何在正則表達(dá)式中使用特殊字符?
//ASCII方式用十六進(jìn)制數(shù)來表示特殊字符 var re = /^\x43\x4A$/;//將匹配CJ alert(re.test("CJ"));//true //也可使用八進(jìn)制方式 re = /^\103\112$/;//將匹配CJ alert(re.test("CJ"));//true //還可以使用Unicode編碼 re =/^\u0043\u004A$/;//使用 Unicode,必須使用u開頭,接著是字符編碼的四位16進(jìn)制表現(xiàn)形式 alert(re.test("CJ")); 另處,還有一些其它的預(yù)定義特殊字符,如下表所示: 字符 描述 \n 換行符 \r 回車符 \t 制表符 \f 換頁符(Tab) \cX 與X對(duì)應(yīng)的控制字符 \b 退格符(BackSpace) \v 垂直制表符 \0 空字符("") 字符類 ---〉簡單類,反向類,范圍類,組合類,預(yù)定義類
//簡單類 var re = /[abc123]/;//將匹配abc123這6個(gè)字符中一個(gè) //負(fù)向類 re = /[^abc]/;//將匹配除abc之外的一個(gè)字符 //范圍類 re = /[a-b]/;//將匹配小寫a-b 26個(gè)字母 re = /[^0-9]/;//將匹配除0-9 10個(gè)字符之處的一個(gè)字符 //組合類 re = /[a-b0-9A-Z_]/;//將匹配字母,數(shù)字和下劃線 下面是正則表達(dá)式中的預(yù)定義類 代碼 等同于 匹配 . IE下[^\n],其它[^\n\r] 匹配除換行符之外的任何一個(gè)字符 \d [0-9] 匹配數(shù)字 \D [^0-9] 匹配非數(shù)字字符 \s [ \n\r\t\f\x0B] 匹配一個(gè)空白字符 \S [^ \n\r\t\f\x0B] 匹配一個(gè)非空白字符 \w [a-zA-Z0-9_] 匹配字母數(shù)字和下劃線 \W [^a-zA-Z0-9_] 匹配除字母數(shù)字下劃線之外的字符 量詞(下表量詞單個(gè)出現(xiàn)時(shí)皆是貪婪量詞) 代碼 描述 * 匹配前面的子表達(dá)式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等價(jià)于{0,}。 + 匹配前面的子表達(dá)式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價(jià)于 {1,}。 匹配前面的子表達(dá)式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價(jià)于 {0,1}。 {n} n 是一個(gè)非負(fù)整數(shù)。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個(gè) o。 {n,} n 是一個(gè)非負(fù)整數(shù)。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價(jià)于 'o+'。'o{0,}' 則等價(jià)于 'o*'。 {n,m} m 和 n 均為非負(fù)整數(shù),其中n <= m。最少匹配 n 次且最多匹配 m 次。劉, "o{1,3}" 將匹配 "fooooood" 中的前三個(gè) o。'o{0,1}' 等價(jià)于 'o?'。請(qǐng)注意在逗號(hào)和兩個(gè)數(shù)之間不能有空格。 貪婪量詞與惰性量詞 •用貪婪量詞進(jìn)行匹配時(shí),它首先會(huì)將整會(huì)字符串當(dāng)成一個(gè)匹配,如果匹配的話就退出,如果不匹配,就截去最后一個(gè)字符進(jìn)行匹配,如果不匹配,繼續(xù)將最后一個(gè)字符截去進(jìn)行匹配,直到有匹配為止。直到現(xiàn)在我們遇到的量詞都是貪婪量詞 •用惰性量詞進(jìn)行匹配時(shí),它首先將第一個(gè)字符當(dāng)成一個(gè)匹配,如果成功則退出,如果失敗,則測(cè)試前兩個(gè)字符,依些增加,直到遇到合適的匹配為止 惰性量詞僅僅在貪婪量詞后面加個(gè)"?"而已,如"a+"是貪婪匹配的,"a+?"則是惰性的
var str = "abc"; var re = /\w+/;//將匹配abc re = /\w+?/;//將匹配a 多行模式
var re = /[a-z]$/; var str = "ab\ncdef"; alert(str.replace(re,"#"));//ab\ncde# re =/[a-z]$/m; alert(str.replace(re,"#"));//a#\ncde# 分組與非捕獲性分組
re = /abc{2}/;//將匹配abcc re = /(abc){2}/;//將匹配abcabc //上面的分組都是捕獲性分組 str = "abcabc ###"; arr = re.exec(str); alert(arr[1]);//abc //非捕獲性分組 (?:) re = /(?:abc){2}/; arr = re.exec(str); alert(arr[1]);//undefined 候選(也就是所說的“或”)
re = /^a|bc$/;//將匹配開始位置的a或結(jié)束位置的bc str ="add"; alert(re.test(str));//true re = /^(a|bc)$/;//將匹配a或bc str ="bc"; alert(re.test(str));//true 當(dāng)包含分組的正則表達(dá)式進(jìn)行過test,match,search這些方法之后,每個(gè)分組都被放在一個(gè)特殊的地方以備將來使用,這些存儲(chǔ)是分組中的特殊值,我們稱之為反向引用
var re = /(A?(B?(C?)))/; /*上面的正則表達(dá)式將依次產(chǎn)生三個(gè)分組 (A?(B?(C?))) 最外面的 (B?(C?)) (C?)*/ str = "ABC"; re.test(str);//反向引用被存儲(chǔ)在RegExp對(duì)象的靜態(tài)屬性$1—$9中 alert(RegExp.$1+"\n"+RegExp.$2+"\n"+RegExp.$3); //反向引用也可以在正則表達(dá)式中使用\1 ,\2...這類的形式使用 re = /\d+(\D)\d+\1\d+/; str = "2008-1-1"; alert(re.test(str));//true str = "2008-4_3"; alert(re.test(str));//false 使用反向引用可以要求字符串中某幾個(gè)位置上的字符必須相同.另外,在replace這類方法中可用特殊字符序列來表示反向引用
re = /(\d)\s(\d)/; str = "1234 5678"; alert(str.replace(re,"$2 $1"));//在這個(gè)里面$1表示第一個(gè)分組1234,$2則表示5678 其它——〉正向前瞻,用來捕獲出現(xiàn)在特定字符之前的字符,只有當(dāng)字符后面跟著某個(gè)特定字符才去捕獲它。與正向前瞻對(duì)應(yīng)的有負(fù)向前瞻,它用匹配只有當(dāng)字符后面不跟著某個(gè)特定字符時(shí)才去匹配它。在執(zhí)行前瞻和負(fù)向前瞻之類的運(yùn)算時(shí),正則表達(dá)式引擎會(huì)留意字符串后面的部分,然而卻不移動(dòng)index
//正向前瞻 re = /([a-z]+(?=\d))/i; //我們要匹配后面跟一個(gè)數(shù)字的單詞,然后將單詞返回,而不要返回?cái)?shù)字 str = "abc every1 abc"; alert(re.test(str));//true alert(RegExp.$1);//every alert(re.lastIndex);//使用前瞻的好處是,前瞻的內(nèi)容(?=\d)并不會(huì)當(dāng)成一次匹配,下次匹配仍從它開始 //負(fù)向前瞻(?!) re = /([a-z](?!\d))/;i //將匹配后面不包含數(shù)字的字母,并且不會(huì)返回(?!\d)中的內(nèi)容 str = "abc1 one"; alert(re.test(str)); alert(RegExp.$1);//one 構(gòu)建一個(gè)驗(yàn)證電子郵箱地址有效性的正則表達(dá)式。電子郵箱地址有效性要求(我們姑且這樣定義):用戶名只能包含字母數(shù)字以及下劃線,最少一位,最多25位,用戶名后面緊跟@,后面是域名,域名名稱要求只能包含字母數(shù)字和減號(hào)(-),并且不能以減號(hào)開頭或結(jié)尾,然后后面是域名后綴(可以有多個(gè)),域名后綴必須是點(diǎn)號(hào)連上2-4位英文字母
var re = /^\w{1,15}(?:@(?!-))(?:(?:[a-z0-9-]*)(?:[a-z0-9](?!-))(?:\.(?!-)))+[a-z]{2,4}$/; |
|