
CommandlineFu 是一个记录脚本片段的网站,,每个片段都有对应的功能说明和对应的标签。我想要做的就是尝试用 shell 写一个多进程的爬虫把这些代码片段记录在一个 org 文件中。
参数定义
这个脚本需要能够通过 -n 参数指定并发的爬虫数(默认为 CPU 核的数量),还要能通过 -f 指定保存的 org 文件路径(默认输出到 stdout)。
#!/usr/bin/env bashproc_num=$(nproc)store_file=/dev/stdoutwhile getopts :n:f: OPT; docase $OPT inn|+n)proc_num="$OPTARG";;f|+f)store_file="$OPTARG";;*)echo "usage: ${0##*