Linux内核代码中的脏话统计

添加时间：2013-12-19

相关阅读: 程序 linux

按脏话数/版本号统计

graph

按脏话密度/版本号统计

relgraph

上图显示的是对Linux内核里的c，h和S源代码里的脏话统计结果，我会每月更新一次这些数据，当有新版本发布时也会更新一次。我是受the linux kernel fuck count的启发，但遗憾的是它里面的数据已经过期了。

从图中可以很明显的看出，自从2.4版开始，脏话的数量有大量的增加。然而，总的代码量也增加了很多，所以，总的来看，平均每行的诅咒密度是减少的。

介绍一下统计方法：不论任何地方出现的脏话词汇都会计入总数——出现在另一个词内也算。本来可以做的更合理些，但结果发现FreeBSD的正则表达式引擎有严重的内存泄漏问题，我也就没有再改进了。一行里对一个脏词可能会统计出多次，因为有时候一个程序员会遇到非常非常懊恼的一天。

你可以在找到这个脚本，但它写的实在是太乱了，不推荐。

相关Linux内核代码中的脏话统计

Python程序的执行原理(1) [2013-12-19]

Hacker News 排名算法工作原理 [2013-12-19]

编程语言编年史：作为程序员的你怎能不知？ [2013-12-19]

全球11月最受欢迎编程语言排名 TOP 50 [2013-12-19]

Google App Engine支持PHP环境 [2013-12-19]

“未来教育”第二季：人人都是程序员 [2013-12-19]

咨询热线：020-85648757 85648755 85648616 0755-27912581 客服：020-85648756 0755-27912581 业务传真：020-32579052
广州市网景网络科技有限公司 Copyright◎2003-2008 Veelink.com. All Rights Reserved.
广州商务地址：广东省广州市黄埔大道中203号(海景园区)海景花园C栋501室
= 深圳商务地址：深圳市宝源路华丰宝源大厦606
研发中心：广东广州市天河软件园海景园区粤ICP备05103322号工商注册