求推荐一款能按照对换表进行批量替换的文本替换软件

Pixie · 2022 年12 月 30 日 13:59

对换表类似

1111=aaaa
2222=bbbb
3333=cccc

或其他相近格式的txt，或干脆就是个 excel 表

然后直接调用这个表进行文本文件批量替换的软件

VIctoryRoad · 2022 年12 月 31 日 02:33

可以借助 busybox-w32 + sed + awk 来完成。

为了表述方便，本文作如下约定：

replace.sh 是脚本文件

list.csv 是文字对换表

处理单个文件，可用这个脚本：

#!/bin/sh

FILE=$1
L=1
E=`awk 'END {print NR}' list.csv`

while [ $L -le $E ]
do
    A="`awk -F ',' -v L=$L 'NR==L {print $1}' list.csv`"
    B="`awk -F ',' -v L=$L 'NR==L {print $2}' list.csv`"
    sed -i "s/$A/$B/g" "$FILE"
    unix2dos "$FILE"
    L=$(($L+1))
done

将上述内容保存为脚本文件 replace.sh。

对换表保存在 list.csv 文档中，第一列为原始文本，第二列为替换文本。比如：

111,AAA
222,BBB

假设原始文本内容为 “测试内容111和测试内容222.”，替换后为 “测试内容AAA和测试内容BBB.”。

然后，下载 busybox-w32，将 busybox.exe 复制到 X:\Windows\ (X 为系统盘盘符) 目录下，在CMD中执行如下命令启动脚本：

busybox ash ./replace.sh ./1.txt

其中，1.txt 是要处理的文本（文件扩展名无所谓，只要是纯文本文件即可）。注意该方法会直接将修改写入原文件，且不可撤销，使用前要注意备份原文件。

如要处理大量文本文件，请将 list.csv 和所有要处理的文本文档放在同一目录下，然后在该目录下创建脚本文件 replace.sh 并写入如下命令：

#!/bin/sh

for FILE in *.txt
do
    L=1
    E=`awk 'END {print NR}' list.csv`

    while [ $L -le $E ]
    do
        A="`awk -F ',' -v L=$L 'NR==L {print $1}' list.csv`"
        B="`awk -F ',' -v L=$L 'NR==L {print $2}' list.csv`"
        sed -i "s/$A/$B/g" "$FILE"
        unix2dos "$FILE"
        L=$(($L+1))
    done
done

到 CMD 中执行如下命令：

busybox ash ./replace.sh

KagamineTime · 2022 年12 月 31 日 03:25

楼主可以考虑 EmEditor ，如下图操作：

不过我看了一下官网，
似乎只有专业版才有这个功能，
免费版没有……
所以你或许可以考虑找个专业版试一试，
然后再决定是否入正版～
https://zh-cn.emeditor.com/text-editor-features/history/emeditor-free/

Pixie · 2022 年12 月 31 日 06:09

这个是处理文件名吧，我需要处理的是文本文件里的内容

Pixie · 2022 年12 月 31 日 06:30

不错，就是替换表编辑起来略麻烦，留作备用

Pixie · 2022 年12 月 31 日 06:31

感谢，就是我要得功能~

seabirdr · 2022 年12 月 31 日 09:26

quicker可以，不过需要自己制作动作

dog · 2022 年12 月 31 日 09:34

嗷嗷，脑子抽了，
文件批量替换的话，这个特别好用，支持正则、特征和普通模式：
超级批量修改工具-YEStudio

VIctoryRoad · 2022 年12 月 31 日 10:02

作一点补充说明：

sed 支持正则表达式，所以之前提到的对照表 list.csv 里面可以写入正则表达式，如在其中加入 [0-9],X 可以将文档中的所有阿拉伯数字替换为 X。
上述脚本中，awk 命令后的 -F 选项可以指定分隔符。如果替换列表中使用了其他分隔符，请作相应的替换。如：对照表中为 X=Y 的形式，则可将 awk -F ',' 替换为 awk -F '='。
如在 UNIX 系统或 Linux 系统上使用该脚本，可去掉 unix2dos $FILE 命令。

参考资料：

sed 使用方法：http://c.biancheng.net/view/994.html
awk 入门指南：https://www.ruanyifeng.com/blog/2018/11/awk.html
UNIX shell 脚本教程：https://www.w3cschool.cn/unix/8qan1pd9.html

SoSo · 2022 年12 月 31 日 10:15

Excel和TXT 可以用SoSo工具集11中的批量替换的功能

Pixie · 2022 年12 月 31 日 11:05

这个以前我都在用，不知道为啥现在在我 win10 上显示了两个错误就打不开了

dog · 2022 年12 月 31 日 11:27

呃，你试试下载别的下载站的看看？
我是在东坡下载站下载的

yazii · 2022 年12 月 31 日 18:09

如果不用正则，直接使用字典替换文本，最通用的办法是上opencc

Pixie · 2023 年1 月 1 日 09:08

对啊，这倒是我从来没想到的用法，opencc 的确可以用来批量替换文本
以前只是用来简繁替换，果然还是我脑洞不够

NSFW · 2023 年1 月 1 日 16:52

opencc 不适合小白——普通的繁简转换都不一定会用，更何况还要自定义词汇表。对小白来说，还是现成的GUI软件省心。

VIctoryRoad · 2023 年1 月 2 日 01:56

感谢各位大佬提醒，的确 opencc 也是一个很好的方法。

Windows 上安装 opencc 可以参考这篇文章：

Linux上的话，一般软件源里面应该就有。以Ubuntu为例：sudo apt install opencc。

然后，准备两个文件：

配置文件 replace.json
字典文件 dict.txt

配置文件按如下格式书写：

{
  "name": "Just for test",
  "segmentation": {
    "type": "mmseg",
    "dict": {
      "type": "text",
      "file": "dict.txt"
    }
  },
  "conversion_chain": [{
    "dict": {
      "type": "group",
      "dicts": [{
        "type": "text",
        "file": "dict.txt"
      }]
    }
  }]
}

其中，dict.txt 是我们一会儿要用到的对换表。

对换表文件 dict.txt 按如下格式书写：

原始字段[制表符]替换字段

注意 “原始字段” 和 “替换字段” 之间要用制表符分隔，不要用空格。

将 replace.json 和 dict.txt 放在同一文件夹下，然后打开命令行，执行转换命令：

opencc -i 输入文件 -o 输出文件 -c replace.json

其中，“输入文件” 和 “输出文件” 可以是同一文件，这样就可以直接修改输入文件的内容了。

如果是要处理大量文件，在WIndows系统上，可以写一个批处理文件：

@echo off

for %%i in (*.txt) do opencc -i "%%i" -o "%%i_output".txt -c replace.json

如果想直接修改原文件，则可使用这个批处理：

@echo off

for %%i in (*.txt) do opencc -i "%%i" -o "%%i" -c replace.json

opencc 还可以接收来自其他程序的标准输出，比如要对某程序的输出结果进行替换，可执行：

cat text.txt | opencc -c replace.json

说句题外话，如果只是要进行简繁转换，执行如下命令即可：

简体到繁体：opencc -i 输入文件 -o 输出文件 -c s2t
繁体到简体：opencc -i 输入文件 -o 输出文件 -c t2s

更多功能可参考其项目主页：https://github.com/BYVoid/OpenCC/

Pixie · 2023 年1 月 4 日 07:11

真不错，又多一种方法。感谢感谢，网址收藏了

leeary · 2023 年1 月 7 日 14:30

我的ABC软件工具箱可以实现你需要的功能批量替换不同规则的不同文档都是可以的

VIctoryRoad · 2023 年2 月 13 日 11:05

最近才发现，其实这种替换表根本不用 awk。sed 是支持脚本模式的。

比如，要将文本文件中所有的 AAA 替换为 111，BBB 替换为 222，可将替换表按这种形式写好，并保存为 replace.sed：

s/AAA/111/g
s/BBB/222/g

其中，AAA、BBB、111、222 都是正则表达式或字符串（注意特殊字符要转义）

然后命令行运行

busybox sed -f replace.sed 输入文件 > 输出文件

即可。

话题		回复	浏览量
求可以按顺序执行正则查找替换的方案问题求助	11	1833	2023 年1 月 13 日
像EmEdito那样能录制脚本的文本编辑器，还有什么？问题求助 windows	23	3581	2023 年2 月 5 日
有那种可以批量对文件夹中的所有文件做批量的正则表达式替换的工具问题求助 windows	14	1986	2023 年5 月 21 日
有什么编辑器，支持基于字典的搜索替换吗？问题求助文本处理	4	1337	2018 年9 月 4 日
求一个文本处理工具，批量添加尾内容问题求助 windows	7	1085	2023 年8 月 18 日

求推荐一款能按照对换表进行批量替换的文本替换软件

相关话题