QWrap選擇器的一個(gè)bug:tagName的大小寫(xiě)
對(duì)于現(xiàn)代Web前端來(lái)說(shuō),Selector是必備之物。對(duì)于標(biāo)準(zhǔn)瀏覽器,可用querySelector,而對(duì)于IE8標(biāo)準(zhǔn)模式以下,需要一個(gè)Selector引擎。
因?yàn)楸卷?xiàng)目會(huì)在代碼里使用QWrap,所以雖然我寫(xiě)的部分代碼并沒(méi)有用QWrap,但既然怎樣都需要一個(gè)Selector引擎,不如用QWrap。
結(jié)果發(fā)生一件悲劇的事情。
我使用html5-shim/shiv庫(kù)來(lái)讓IE正確解析新的HTML5標(biāo)簽。但是QWrap引擎居然不能正確選擇出html5的元素。
嘗試人肉選擇,發(fā)現(xiàn)是可以的,那就是QWrap的Selector存在bug。
經(jīng)過(guò)艱苦卓絕的斗爭(zhēng),最終發(fā)現(xiàn)問(wèn)題出在這個(gè)函數(shù)的第2行:
- function(a) {
 - sFun.push('el.tagName=="' + a.toUpperCase() + '"');
 - return '';
 - }).replace(/([\[(].*)|#([\w\-]+)|\.([\w\-]+)/g,//id縮略寫(xiě)法//className縮略寫(xiě)法
 
QWrap采用了代碼生成技術(shù),即為selector拼裝出對(duì)應(yīng)的函數(shù)。這是一項(xiàng)相當(dāng)陷阱先進(jìn)的技術(shù)。
不難看出這里會(huì)產(chǎn)生一個(gè)tag的匹配,對(duì)于匹配“nav”所生成的代碼應(yīng)該是:el.tagName=="nav".toUpperCase() 。
通常瀏覽器對(duì)于所有HTML元素,其調(diào)用tagName返回的都是全大寫(xiě)字母。
【號(hào)外】為什么是大寫(xiě)?
Hax答:這是從HTML的祖先SGML那里繼承下來(lái)的習(xí)慣。對(duì)于早期寫(xiě)SGML/HTML的人,要區(qū)分標(biāo)簽和正文內(nèi)容的最簡(jiǎn)單方法恐怕就是把標(biāo)簽用大寫(xiě)。
不過(guò),據(jù)圈子里有名的那個(gè)紋身佬說(shuō),HTML用大寫(xiě)是因?yàn)槟菚r(shí)候技術(shù)落后,存儲(chǔ)太緊張,全大寫(xiě)比較省存儲(chǔ)空間……(大意如此,詳情我記不清了,請(qǐng)八卦人士咨詢(xún)Winter)
【/號(hào)外】
然而不幸的是,html5-shim以及我所知差不多所有的類(lèi)似庫(kù),都會(huì)使用全小寫(xiě)。這是因?yàn)楝F(xiàn)代Web標(biāo)準(zhǔn)的主流是采用全小寫(xiě)。
【號(hào)外】為什么換小寫(xiě)了涅?
Hax答:因?yàn)檫@樣比較不傷眼,也不傷手。
【/號(hào)外】
而IE雖然對(duì)于它所能識(shí)別的HTML元素都是大小寫(xiě)不敏感的,但是對(duì)于通過(guò)createElement神經(jīng)刀產(chǎn)生的新元素,它其實(shí)將其視作類(lèi)XML元素,也就是大小寫(xiě)敏感的,所以其tagName屬性將返回最初設(shè)定的大小寫(xiě)形式。
如何fix這個(gè)問(wèn)題?
一個(gè)容易想到的方式是把html5-shim里的標(biāo)簽列表改為大寫(xiě)。不過(guò)這個(gè)方式并不管用。因?yàn)閠agName返回的是最初設(shè)定的值,也就是,如果你寫(xiě)...,返回的是SECTION,如果你寫(xiě)...返回的就是SECtion(即start tag的大小寫(xiě)),如果你寫(xiě)document.createElement('sEcTion'),返回的就是sEcTion。
顯然,QWrap Selector(或任何通用腳本庫(kù))不應(yīng)依賴(lài)網(wǎng)頁(yè)作者如何書(shū)寫(xiě)。所以這個(gè)問(wèn)題必須由QW來(lái)解決。
此外,庫(kù)也不應(yīng)該假設(shè)tagName一定返回大寫(xiě)。雖然規(guī)范規(guī)定對(duì)于HTML元素tagName應(yīng)該始終返回大寫(xiě),但庫(kù)必須考慮兼容性(即這里所提到的IE的問(wèn)題)。
此外,通用腳本庫(kù)也要有前瞻性,比如考慮Selector引擎用于選擇XML元素。當(dāng)前各種純JS selector engine并非namespace-aware,所以本不能選擇XML元素。但HTML規(guī)范已經(jīng)允許直接在HTML里混合MathML、SVG。新的瀏覽器也都已經(jīng)支持了。
比如你可以試著在FireFox里看下述代碼:
- <body>
 - <div id="test"><math>
 - <mi>x</mi>
 - <mo>=</mo>
 - <mfrac>
 - <mrow>
 - <mo form="prefix">−</mo> <mi>b</mi>
 - <mo>±</mo>
 - <msqrt>
 - <msup> <mi>b</mi> <mn>2</mn> </msup>
 - <mo>−</mo>
 - <mn>4</mn> <mo></mo> <mi>a</mi> <mo></mo> <mi>c</mi>
 - </msqrt>
 - </mrow>
 - <mrow>
 - <mn>2</mn> <mo></mo> <mi>a</mi>
 - </mrow>
 - </mfrac>
 - </math></div>
 - </body>
 
你可以看到$('test').firstChild.tagName返回的是“math”而不是“MATH”。而document.querySelector('#test math')也可以正確選擇到該元素。
但是QW Selector就不能選擇到math元素了。
【擴(kuò)展】
假如你在這個(gè)文檔里插入document.createElement('math')會(huì)發(fā)生什么呢?
注意,你插入的不是一個(gè)MathML元素,那需要通過(guò)createElementNS,加上適當(dāng)?shù)膎amespace(http://www.w3.org/1998/Math/MathML)才可以。你插入的其實(shí)是一個(gè)名字恰好為“math”的HTML元素,該元素的tagName返回的是全大寫(xiě)的“MATH”。
此時(shí),使用getElementsByTagName('math')或document.querySelectorAll('math')會(huì)返回這兩個(gè)元素。而getElementsByTagName('MATH')或document.querySelectorAll('MATH')只會(huì)返回那個(gè)正好叫做“math”的HTML元素,而不會(huì)返回真正的MathML的math元素。注:FF行為如此,而目前Chrome是兩者都返回的,這應(yīng)該是WebKit的bug。
【/擴(kuò)展】
盡管純JS Selector引擎主要的目的是向前兼容,但若能做到向后兼容就更好了。而QW Selector由于這個(gè)小小的大小寫(xiě)問(wèn)題,在兩方面都失敗了。
好在,修正它是很容易的。
sFun.push('el.tagName=="' + a.toUpperCase() + '"');
改為
sFun.push('el.tagName.toLowerCase()=="' + a.toLowerCase() + '"');
即可。
有人可能會(huì)問(wèn),為啥全換成toLowerCase()?
之前人家木有說(shuō)過(guò)嗎,UPPERCASE什么的最討厭了!
說(shuō)正經(jīng)的,用toLowerCase()是因?yàn)闃?biāo)準(zhǔn)所規(guī)定的行為就是這樣的。盡管全換成toUpperCase()似乎也沒(méi)有什么不一樣的。
上述代碼的結(jié)果和目前Chrome的行為較為一致,即即使是非HTML namespace的元素,也按照大小寫(xiě)不敏感的方式比較。如果要按照FF的行為,可以改為:
'isHTMLElement(el) ? tagName.toLowerCase() == "{a.toLowerCase()}" : tagName == "{a}"'
上述isHTMLElement檢測(cè)一個(gè)元素是否是HTML元素,邏輯請(qǐng)自行查標(biāo)準(zhǔn)確定。{a}這里用模板語(yǔ)法,這是為了讓大家看得更明白,我也省下打許多引號(hào)和加號(hào)的力氣。
原文:http://hax.iteye.com/blog/1126134
【編輯推薦】















 
 
 


 
 
 
 