深圳幻海软件技术有限公司 欢迎您!

一行注释也能影响运行结果?

2023-02-27

没想到吧,一行注释也能影响运行结果!也许你在某个段子里听说过,某行注释删掉后,程序竟然不能预期执行?真的会这样么?你还别不信。见证“奇迹”复制#include <stdio.h> #include <math.h> int m

没想到吧,一行注释也能影响运行结果!

也许你在某个段子里听说过,某行注释删掉后,程序竟然不能预期执行?真的会这样么?你还别不信。

见证“奇迹”

#include <stdio.h> 
#include <math.h> 
int main(void) 

    int a = (int)sqrt(30); 
    //is sqrt(30) + 1 > 5 ??/ 
    //故意让a++,你别管为什么 
   a++; 
   if(a > 5) 
       printf("sqrt(30) +1 > 5 \n"); 
   else 
   { 
       printf("sqrt(30) +1 <= 5 \n"); 
   } 
   return 0; 
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.

编译运行:

$ gcc -o main main.c -trigraphs 
$ ./main 
sqrt(30) +1 > 5  
  • 1.
  • 2.
  • 3.

作为受过九年义务教育的我们,一看就知道结果是对的,毕竟 5 * 5 < 30 < 6 * 6。

但是删掉第九行,再运行:

$ ./main 
sqrt(30) +1 <= 5  
  • 1.
  • 2.

结果竟然变了!!

看到这里,细心的读者可能已经发现了其中的端倪,我也就不卖关子了。接下来就说说我们本次要提到的主角-三字符组(trigraph sequences)。

三字符组

我们都知道C语言里面有很多转义符号,例如:

\n 换行符(LF) 
\r 回车符(CR) 
\t 水平制表符(HT) 
\b 退格符(BS) 
\’ 单引号 
\” 双引号 
\\ 反斜杠 
...... 
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.

当然还有很多,我就不一一列举了。这些符号在代码中都有特别的作用,或者无法直接输入,因此用转移符+其他字符组合来代替。

同样的,早期的一些键盘可能没法输入一些特殊的符号,如:

# $ @ [ \ ] ^ ` { | } ~  
  • 1.

于是,为了解决这个问题C语言标准规定预处理器(C preprocessor)在扫描处理C语言源文件时,替换下述的3字符出现为1个字符:

也就是说,??/会被替换为\,如果删掉原先的第九行,就变成了:

//is sqrt(30) + 1 > 5 \ 
a++; 
  • 1.
  • 2.

我们都知道,\的存在(通常一行代码太长,可以通过该符号来换行),使得上面看似两行,实则是一行。即变成了:

//is sqrt(30) + 1 > 5 a++; 
  • 1.

也就是说,a++根本不会执行了,当然会导致最终结果不符合预期。

当然了,很多现代编译器可能并不会做这样的替换,所以这样的问题也基本无需担心,老实用原本的符号即可。

实际上,细心的读者可能观察到了,我在前面例子代码中加了编译选项-trigraphs,否则的话,编译是有警告的:

$ gcc -o main main.c 
main.c: In function ‘main’: 
main.c:6:27: warning: trigraph ??/ ignored, use -trigraphs to enable [-Wtrigraphs] 
     //is sqrt(30) + 1 > 5 ??/ 
  • 1.
  • 2.
  • 3.
  • 4.

双字符组

除了三字符组,还有双字符组。

总结

今天的你不知道很难踩坑,知道了也没啥用的内容就介绍到这里了。