use-linux-format-not-dos

写个 shell 脚本格式化输出数据,出现诡异 bug,郁闷了一天,早上看书之际,dos2unix 出现到脑海中,乌云散去,果然如此。

情景

有一个 txt 文件,行数很多,需要复制其中的部分数据到 excel 统计,一个文件大概要复制 40-50 次,懒人总是想捷径。首先想到的是使用 shell 脚本实现,因为 python 才开始,先是看书,4-5天,写脚本,各种碰壁,于是 用了低级方法可以干活,隔几天后 改进,如下。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
#!/bin/bash

tempfile=`mktemp const.XXXXXXXX`

sed -n '/+\/-/p' $1 > $tempfile
bulkmodulus=`gawk '/=/ { print $4 }' $tempfile`


for (( j = 4; j < 7; j = j + 2 ))
do
for (( i = 1; i < 22; i++ ))
do
cijTempName=`cat $tempfile | gawk -v circle=$j '$1 == loop {print $circle}' loop=$i`

if [ $i -ge 2 ] && [ $i -le 6 ]
then
if [ -z $cijTempName ]
then
echo -e "-\t\c"
else
echo -e $cijTempName"\t\c"
fi
else
if [ -z $cijTempName ]
then
echo -e "0\t\c"
else
echo -e $cijTempName"\t\c"
fi
fi
done
echo
done

echo

echo 'bulk:' $bulkmodulus

rm -f $tempfile $tempfile2

数据大概如下:

pic

做了部分模糊处理。

错误

需要提出 cij 的 第 4列 以及 第 6 列。使用制表符在各自行中打印。

pic

结果出乎我的意料,第二行的 误差值 只打印了两个。

百思不得其解,我甚至已经考虑 使用 awk 的 FS ORS 各种折腾。最后皆以失败告终。

解决

今天图书馆看书,突然想到我这个 txt 文件是在 windows 生成的,自然 换行符与 linux/unix 的不同,如此以来自然能够解释 中间部分正常,而尾巴部分出现诡异。

于是,加上 dos2unix Constants.txt ,完美解决问题。

pic

存在即是合理,不是莫名其妙,只是你不知道。

---------本文结束感谢阅读---------
Title - Artist
0:00