求推荐一款能按照对换表进行批量替换的文本替换软件

Pixie · 2022 年12 月 30 日 13:59

对换表类似

1111=aaaa
2222=bbbb
3333=cccc

或其他相近格式的txt，或干脆就是个 excel 表

然后直接调用这个表进行文本文件批量替换的软件

VIctoryRoad · 2022 年12 月 31 日 02:33

可以借助 busybox-w32 + sed + awk 来完成。

为了表述方便，本文作如下约定：

replace.sh 是脚本文件

list.csv 是文字对换表

处理单个文件，可用这个脚本：

#!/bin/sh

FILE=$1
L=1
E=`awk 'END {print NR}' list.csv`

while [ $L -le $E ]
do
    A="`awk -F ',' -v L=$L 'NR==L {print $1}' list.csv`"
    B="`awk -F ',' -v L=$L 'NR==L {print $2}' list.csv`"
    sed -i "s/$A/$B/g" "$FILE"
    unix2dos "$FILE"
    L=$(($L+1))
done

将上述内容保存为脚本文件 replace.sh。

对换表保存在 list.csv 文档中，第一列为原始文本，第二列为替换文本。比如：

111,AAA
222,BBB

假设原始文本内容为 “测试内容111和测试内容222.”，替换后为 “测试内容AAA和测试内容BBB.”。

然后，下载 busybox-w32，将 busybox.exe 复制到 X:\Windows\ (X 为系统盘盘符) 目录下，在CMD中执行如下命令启动脚本：

busybox ash ./replace.sh ./1.txt

其中，1.txt 是要处理的文本（文件扩展名无所谓，只要是纯文本文件即可）。注意该方法会直接将修改写入原文件，且不可撤销，使用前要注意备份原文件。

如要处理大量文本文件，请将 list.csv 和所有要处理的文本文档放在同一目录下，然后在该目录下创建脚本文件 replace.sh 并写入如下命令：

#!/bin/sh

for FILE in *.txt
do
    L=1
    E=`awk 'END {print NR}' list.csv`

    while [ $L -le $E ]
    do
        A="`awk -F ',' -v L=$L 'NR==L {print $1}' list.csv`"
        B="`awk -F ',' -v L=$L 'NR==L {print $2}' list.csv`"
        sed -i "s/$A/$B/g" "$FILE"
        unix2dos "$FILE"
        L=$(($L+1))
    done
done

到 CMD 中执行如下命令：

busybox ash ./replace.sh

KagamineTime · 2022 年12 月 31 日 03:25

楼主可以考虑 EmEditor ，如下图操作：

不过我看了一下官网，
似乎只有专业版才有这个功能，
免费版没有……
所以你或许可以考虑找个专业版试一试，
然后再决定是否入正版～
https://zh-cn.emeditor.com/text-editor-features/history/emeditor-free/

Pixie · 2022 年12 月 31 日 06:09

这个是处理文件名吧，我需要处理的是文本文件里的内容

Pixie · 2022 年12 月 31 日 06:30

不错，就是替换表编辑起来略麻烦，留作备用

Pixie · 2022 年12 月 31 日 06:31

感谢，就是我要得功能~

seabirdr · 2022 年12 月 31 日 09:26

quicker可以，不过需要自己制作动作

dog · 2022 年12 月 31 日 09:34

嗷嗷，脑子抽了，
文件批量替换的话，这个特别好用，支持正则、特征和普通模式：
超级批量修改工具-YEStudio

VIctoryRoad · 2022 年12 月 31 日 10:02

作一点补充说明：

sed 支持正则表达式，所以之前提到的对照表 list.csv 里面可以写入正则表达式，如在其中加入 [0-9],X 可以将文档中的所有阿拉伯数字替换为 X。
上述脚本中，awk 命令后的 -F 选项可以指定分隔符。如果替换列表中使用了其他分隔符，请作相应的替换。如：对照表中为 X=Y 的形式，则可将 awk -F ',' 替换为 awk -F '='。
如在 UNIX 系统或 Linux 系统上使用该脚本，可去掉 unix2dos $FILE 命令。

参考资料：

sed 使用方法：http://c.biancheng.net/view/994.html
awk 入门指南：https://www.ruanyifeng.com/blog/2018/11/awk.html
UNIX shell 脚本教程：https://www.w3cschool.cn/unix/8qan1pd9.html

SoSo · 2022 年12 月 31 日 10:15

Excel和TXT 可以用SoSo工具集11中的批量替换的功能

Pixie · 2022 年12 月 31 日 11:05

这个以前我都在用，不知道为啥现在在我 win10 上显示了两个错误就打不开了

截图-001

截图-002

dog · 2022 年12 月 31 日 11:27

呃，你试试下载别的下载站的看看？
我是在东坡下载站下载的

yazii · 2022 年12 月 31 日 18:09

如果不用正则，直接使用字典替换文本，最通用的办法是上opencc

Pixie · 2023 年1 月 1 日 09:08

对啊，这倒是我从来没想到的用法，opencc 的确可以用来批量替换文本
以前只是用来简繁替换，果然还是我脑洞不够

NSFW · 2023 年1 月 1 日 16:52

opencc 不适合小白——普通的繁简转换都不一定会用，更何况还要自定义词汇表。对小白来说，还是现成的GUI软件省心。

VIctoryRoad · 2023 年1 月 2 日 01:56

感谢各位大佬提醒，的确 opencc 也是一个很好的方法。

Windows 上安装 opencc 可以参考这篇文章：

Linux上的话，一般软件源里面应该就有。以Ubuntu为例：sudo apt install opencc。

然后，准备两个文件：

配置文件 replace.json
字典文件 dict.txt

配置文件按如下格式书写：

{
  "name": "Just for test",
  "segmentation": {
    "type": "mmseg",
    "dict": {
      "type": "text",
      "file": "dict.txt"
    }
  },
  "conversion_chain": [{
    "dict": {
      "type": "group",
      "dicts": [{
        "type": "text",
        "file": "dict.txt"
      }]
    }
  }]
}

其中，dict.txt 是我们一会儿要用到的对换表。

对换表文件 dict.txt 按如下格式书写：

原始字段[制表符]替换字段

注意 “原始字段” 和 “替换字段” 之间要用制表符分隔，不要用空格。

将 replace.json 和 dict.txt 放在同一文件夹下，然后打开命令行，执行转换命令：

opencc -i 输入文件 -o 输出文件 -c replace.json

其中，“输入文件” 和 “输出文件” 可以是同一文件，这样就可以直接修改输入文件的内容了。

如果是要处理大量文件，在WIndows系统上，可以写一个批处理文件：

@echo off

for %%i in (*.txt) do opencc -i "%%i" -o "%%i_output".txt -c replace.json

如果想直接修改原文件，则可使用这个批处理：

@echo off

for %%i in (*.txt) do opencc -i "%%i" -o "%%i" -c replace.json

opencc 还可以接收来自其他程序的标准输出，比如要对某程序的输出结果进行替换，可执行：

cat text.txt | opencc -c replace.json

说句题外话，如果只是要进行简繁转换，执行如下命令即可：

简体到繁体：opencc -i 输入文件 -o 输出文件 -c s2t
繁体到简体：opencc -i 输入文件 -o 输出文件 -c t2s

更多功能可参考其项目主页：https://github.com/BYVoid/OpenCC/

fdjkphxvyv · 2023 年1 月 2 日 03:53

新鮮出爐！肝了兩日，搞了一個在線批量正則替換頁面：

這應是對小白來說最簡單的方式了，以後我自己也會去用它。手機上都可以使用。之前我是用手機上的vim，雖然也能搞，但麻煩很多。

希望可以選為答案！

fdjkphxvyv · 2023 年1 月 3 日 14:11

加了個常見RegExp，各位有任何文本處理的問題也可以留言，我會儘量回覆。

Pixie · 2023 年1 月 4 日 07:11

真不错，又多一种方法。感谢感谢，网址收藏了

fdjkphxvyv · 2023 年1 月 4 日 07:49

正巧我平時也很需要這個，我之前一直都用的是vim，sed偶爾用。還有akelpad等文本編輯器的正則匹配功能也都已經夠用了。但是都沒有我做的這個方便快捷。

话题		回复	浏览量
求一个文本处理工具，批量添加尾内容问题求助❓ windows	7	735	2023 年8 月 18 日
求可以按顺序执行正则查找替换的方案问题求助❓	13	1371	2023 年1 月 13 日
请教下快速建立模式化的文件目录的方法问题求助❓ windows	12	2990	2019 年8 月 29 日
像EmEdito那样能录制脚本的文本编辑器，还有什么？问题求助❓ windows	27	2579	2023 年2 月 5 日
有什么编辑器，支持基于字典的搜索替换吗？问题求助❓ 文本处理	4	1156	2018 年9 月 4 日

求推荐一款能按照对换表进行批量替换的文本替换软件

相关话题