今天在学习DIVE INTO HTML5时,在HTML5 Peeks, Pokes and Pointers一页看到这样一句话:
Optional start tags. <html>, <head>, <body>, <tbody>, <colgroup>. Amaze your friends! Skip the tags and still validate!
顿时来了兴趣。
其实这一点在WHATWG的HTML vs. XHTML页面中也有提到,其中最常接触的就是tbody标签的省略(其实多数是因为偷懒或者干脆是忘记了),部分浏览器(IE)会自动补上一个tbody元素,而其他浏览器则可以在没有tbody的情况下渲染table(此处确实是IE的错,因为标准里说table里允许直接写tr,这点和本文要说的html、head、body标签不同)。
既然html、head、body这三个标签可以省略,但是标准中指定的根元素为html元素,且在html元素的内容模型中明确其只能包含一个head元素和一个body元素,甚至连head必须在body之前也已经明确说明了。那么这就意味着,虽然在编写过程中,HTML里没有html、head、body这三个元素,但是在浏览器对纯文本的文档进行解析之后,势必要按着标准来创建这三个元素,最终的DOM模型里必须有html、head和body存在。
于是就会产生一个问题,如果完全不写这三个元素,那么浏览器会根据什么样的原理,将所有的元素分别放置到自动生成的head和body元素之中。为此,编写了一个页面,通过一个简单的例子,试图找出浏览器自动创建head和body元素的规律。
页面可以通过这里查看测试页面,页面的html结构如下:
在各浏览器中测试结果如下:
各浏览器中的结果出奇地一致,就连老得掉渣的IE6也很顺应主流地将各个元素“正确”地分配到了head和body元素之中。
经过对各浏览器中的结果的观察,似乎不难得出这样的一个结论:浏览器始终创建一个head元素,并自上而下依次检查页面源码中的各标签,能够加入到head元素的标签都加入到head元素中,随后将剩余的元素分配到自动创建的body元素中。
而这种结果也是符合正常的思维逻辑的,可见浏览器确实可以为我们做到很多,让我们省心省力……
那么进一步的,head元素中可以放置哪些元素呢?在标准中的head标签一章中明确指出,head元素的内容模型为元数据内容,包括了base、command、link、meta、noscript、script、style、title这几个。
因此,对于自动创建head和body元素这一回事,如果使用代码来表述,大概是以下的模式:
//elements - 所有顶层元素 var head = document.createElement('head'), body = document.createElement('body'), i = 0, //循环用 element, //当前的元素 forceToBody = false; //指定所有元素都放到body中 for (; element = elements[i]; i++) { if (!forceToBody && isMetadataContent(element)) { head.appendChild(element); } else { !foreceToBody && forceToBody = true; body.appendChild(element); } } document.appendChild(head); document.appendChild(body);
其实,html、head、body这三个标签确实没什么用,html还有一个lang属性,如果需要用到这个属性的话,就留着html,其他时候完全就是一个累赘,反而导致HTML的结构多了一层,看起来更复杂了。个人的推荐是,从此去掉html、head、body三个标签,在head内容和body内容之间使用2-3个换行来分隔,整个源码会更清爽整洁。
题外话:在群里说起这个问题的时候,我先表达的是“没有html、head、body元素的HTML页面能通过验证器验证”,结果遭到了反驳,大家提出不要为了验证器而编码。其实确实是这样的,个人的观点一直是“只要浏览器表现一致,且稳定的标准支持这种使用方法,那么就可以投入生产环境之中”,对于前端这样多变、分裂的局面,我想这种态度相对一本正经地抱着标准不放会来得更好