脏话越多，代码越好！

2023-02-28

代码脏话 fuck

你在读开源代码的时候有没有遇到过这种注释?Whatthefuck？Dude，WTFFuckthis!我遇到过，每次都忍不住笑，心想老外可真是性情中人，遇到不爽的地方就开骂，还直接写到注释中，甚至代码中。Bob大叔在《CleanCode》一书中谆谆教导我们：要对变量、函数、类精心命名，避免耍小聪明，

你在读开源代码的时候有没有遇到过这种注释?

What the fuck ？

Dude，WTF

Fuck this !

我遇到过，每次都忍不住笑，心想老外可真是性情中人，遇到不爽的地方就开骂，还直接写到注释中，甚至代码中。

Bob大叔在《Clean Code》一书中谆谆教导我们：要对变量、函数、类精心命名，避免耍小聪明，别使用双关语。

那么在注释甚至在代码中说脏话，会不会影响总体代码质量呢？

还真有人做了这个研究，Jan Strehmel，一个来自德国卡尔斯鲁厄理工学院的学生发表了一篇论文，名称就叫《在开源代码中脏话的使用和代码质量之间有相关性吗？》

为了研究这个问题，作者从GitHub中抓取了3800个含脏话的C代码库，7600个不含脏话的C代码库，用自家的软件SoftWipe分析它们对编码标准的遵守情况，逐个打分。

然后发挥他在统计学的技能，用了中心极限定理，Bootstrapping，Significance testing，Jarque-Bera test，Shapiro-Wilk test，Q-Q plot，Kolmogorov-Smirnov test ......，一顿操作猛如虎，最后他得到了一个惊人结论：

包含脏话的开源代码明显比不含脏话的质量更好！

(原论文有很多图，感兴趣的可以去看看）

面对这个结果，作者恐怕也没想到，他试图解释到：脏话代表了程序员对代码极其复杂性的情感！在写代码的时候，骂几句脏话，是缓解压力的一种方式，这反过来⼜可以提⾼注意⼒，从而提⾼代码质量。

当然，你可千万不要理解成只要在代码中用了脏话，代码质量就会有提高，那就大错特错了。

这个结果让我立刻想到了Linus Torvalds，他经常Fuck 这个，Fuck那个的，Linus在内核源码中对别人代码的评论就足以扭曲统计结果。

在Linux最早的几个版本中就出现fuck, shit ,damn这样脏话，这似乎成了一种Linux的文化，在后续Linux源码中各种脏词不断出现。

在2005年7月28号，fuck*达到了顶峰，足足出现了68次，随后逐渐下降。

而 idiot* 则一致是在缓慢上升，现在和damn* 并驾齐驱，不分上下。

但是，这些脏话并不影响Linux内核是优秀代码的典范（详情参见这一篇文章《漫画 | 因为用了C语言，Linux内核代码一团糟》），以Linus Torvalds为首的团队对代码结构和风格做了严格的定义，在Review中坚持执行。

在Java社区，开源代码中的脏话也不少。

2018年，IBM 软件工程师 Adam Farley 给 OpenJDK 提交了一个 Bug ，说 OpenJDK 源码中脏话太多了，到处都是，OpenJDK是在专业领域使用的，这太不合适了吧？这不我特意提交了一个Changset把它们都删了。

3天后，经过 OpenJDK 社区讨论，大家认为：

Damn 和 Crap 不算脏话！还有3 个 f**k，是上游的锅（回头会跟进处理），只有一个文件中的f**k，都是脏话，应该删掉。

为什么程序员喜欢在源码中用脏话表示自己的想法呢？

代码是程序员每天都要面对的工作对象，对代码确实会出现复杂的情感，有时候需要一种情绪的宣泄。

看到一段高深的，自己无法理解的代码，what the fuck？

好不容易把一段复杂逻辑的各种分支，边界条件都搞定了，代码实在是乱，don't fuck with it ！

花了很大的精力写完了逻辑，却发现有个异常无法处理，damn,damn,damn

......

咱们国内程序员似乎比较含蓄，很少在代码中写脏话，更喜欢吐槽公司，吐槽系统，是不是这样？

不过，一定要记住一点：当在代码评论中出现脏话时，你就要小心了，不要轻易动下面的代码，弄不好就是个大坑！

参考资料：

https://cme.h-its.org/exelixis/pubs/JanThesis.pdf

https://www.vidarholen.net/contents/wordcount

.parentNode.insertBefore(hm, s); })(); Jzndc69N7BtnPgpT" })