最近遇到了很多 \n
与 \r\n
,虽然一直知道他们都是换行符,但也没有细究,今天顺手查了下。
首先,先解释下 \n
与 \r\n
的区别,在 Difference between \n and \r? 中有这样的示意
\r = CR (Carriage Return) → Used as a new line character in Mac OS before X \n = LF (Line Feed) → Used as a new line character in Unix/Mac OS X \r\n = CR + LF → Used as a new line character in Windows
简单而言,现在除了 Windows
把 \r\n
作为换行符,其他系统都是把 \n
作为了换行符。那我们有没有一种方法可以 把文件中的不可打印字符显示出来,来确认文件中是以什么换行的。
# 试验
首先,先造一个包含两种换行符号的文件 newline.txt
$ echo -e 'LF\nCRLF\r\nEND' > newline.txt
$ cat newline.txt
LF
CRLF
END
使用 cat
,它们都会按照换行符进行处理。而在浏览器中也会把它们当做换行符处理
> const o = 'LF\nCRLF\r\nEND'
< "LF
CRLF
END"
# 如何判断文件中的换行符
# vim
在 vim
中会发现其中蹊跷,:set list
。
$ vim newline.txt
LF$
CRLF^M$
END$
# cat
cat -e
代表显示不可打印字符与换行符。
$ cat -e newline.txt
LF$
CRLF^M$
END$
# 终极办法:strace
既然 cat
会把文件内容打印到终端, 那我们直接查看关于到标准输出 (FD 为1) 的系统调用 write
就能从最根源上解决问题。
$ strace -e write cat newline.txt
write(1, "LF\nCRLF\r\nEND\n", 13LF
CRLF
END
) = 13
+++ exited with 0 +++