像EmEdito那样能录制脚本的文本编辑器，还有什么？

v577 · 2023 年1 月 5 日 13:19

我知道的还有notepad++，想找个更好用的

EmEditor替换查找用起来没VSC顺手

22:18补充：

[pixiv][2021.07.10][2033916(あすてろid)][91155317_p1(CORNEA)][#オリジナル#風景#廃墟#風景5000users入り#ゲーム画面風######]
[pixiv][2022.12.08][1039353(Mika Pikazo)][103449092_p0(FREE)][1353×2600][#オリジナル#オリジナル10000users入り#女の子########]

举个例子，比如这种形式的文本有多组
要提取出pid然后把它变成链接、时间、用户id、用户名字、标签，再把它们变成CSV表格
最终是变成类似这样

类似的任务要多次执行，所以要像EmEditor那样写成脚本文件方便

Emacs、VIM能干这个？

suliveevil · 2023 年1 月 5 日 13:33

Emacs，你的终极选择。有自己的正则表达式构建工具 re-builder，有自己的正则搜索工具，还可以 1+1>2:

v577 · 2023 年1 月 5 日 13:34

这个门槛太高了，需要一个能立即上手处理任务

试过入门Emacss，没法能立即用上，而且Windows环境遇到的问题巨多，太折磨人了

v577 · 2023 年1 月 5 日 13:51

这个门槛也不低啊

v577 · 2023 年1 月 5 日 13:55

可我是需要个专门处理文本的编辑器

BackT0 · 2023 年1 月 5 日 14:01

那么就像我群里推荐的那样试试UltraEdit吧

v577 · 2023 年1 月 5 日 14:21

我的错

[pixiv][2021.07.10][2033916(あすてろid)][91155317_p1(CORNEA)][#オリジナル#風景#廃墟#風景5000users入り#ゲーム画面風######]
[pixiv][2022.12.08][1039353(Mika Pikazo)][103449092_p0(FREE)][1353×2600][#オリジナル#オリジナル10000users入り#女の子########]

比如这种形式的文本有多组
要提取出pid然后把它变成链接、时间、用户id、用户名字、标签，再把它们变成CSV表格
最终是变成类似这样

Emacs、VIM能干这个？

allor · 2023 年1 月 5 日 14:33

原文这么规律，支持正则的编辑器都可以吧
用类似$1$2$3 > $2$1$3 的方式调整顺序并插入分隔符

v577 · 2023 年1 月 5 日 14:39

要多次执行，不是执行一次就不用

allor · 2023 年1 月 5 日 14:45

正则表达式也不是一次性的东西呀？？？
只要处理的是同样规律的文本，写好的表达式保存成宏或者找个 txt 存起来就行了

如果每次处理的文本规律都不一样，那先前你录制的宏是怎么实现需求的？

v577 · 2023 年1 月 5 日 14:50

用到的情况正则大多时候是一样的，即使有变动也只有正则，替换下就行

allor · 2023 年1 月 5 日 15:28

正则可以简化一下，然后你脚本后面的拼接网址和添加分隔符也可以加到正则表达式里一步完成

简化的正则式（匹配括号内容）：

(?<=\[|\()[^\]\()]+

赶着打卡，没空写完整了

v577 · 2023 年1 月 5 日 15:51

……正则我会写，这只是举个例子

allor · 2023 年1 月 5 日 16:45

那就直接搜支持宏的文本编辑器
除了上面提到的 Emacs、Vim、UltraEdit，还有 Sublime Text、Atom，就连你自己一开始提到的VS Code也是支持宏的

补充一个万能的：Excel

NSFW · 2023 年1 月 5 日 22:36

具体说说怎么个不顺手？~~我直觉 EmEditor 就是最适合你的编辑器，这个问题将不成问题~~

VIctoryRoad · 2023 年1 月 6 日 00:52

您这个问题可以用 busybox-w32 里面的UNIX命令行工具解决。

我们先将原始数据保持在 data.txt 中。

首先，您给出的这段数据，如果将其中的所有 [ 和 ) 删去，并将所有 ] 和 ( 替换为 , ，则可得到一张二维表：

sed -e 's/\[//g; s/\]/,/g; s/(/,/g; s/)//g' data.txt > data.csv

效果如下：

不过很显然，第1行没有分辨率信息，故会出现串行。为此要将前面是大写字母的 ,# 替换为 ,,#，即为分辨率信息留出空的单元格：

sed -E -i 's/([A-Z])([A-Z])\>,#/,,#/g' data.csv

这里参考了 https://blog.csdn.net/u011584949/article/details/126933992

效果如下：

剩下的就好办了，把每一列提取出来，再将您感兴趣的列拼接在一起即可。

按列分析文本是 awk 的看家本领。可如我们要提取 “日期”、“画师名” 和 “插画ID” 两列（即第2列、第4列和第5列），可以这样做：

awk -F ',' '{print $2}' data.csv > date.list
awk -F ',' '{print $4}' data.csv > artist.list
awk -F ',' '{print $5}' data.csv > pic_id.list

然后，将这些文本以 , 为分隔符，按列拼接，即可得到一个 csv 表格。这是 paste 工具擅长的。命令如下：

paste -d ',' pic_id.list artist.list date.list > pic_data.csv

其中，-d 选项用于指定分隔符，> 符号前的文件排列顺序，就是输出文档中各列的顺序。

综上，可写成如下脚本：

#!/bin/sh

# 数据预处理
sed -e 's/\[//g; s/\]/,/g; s/(/,/g; s/)//g' data.txt > data.csv
sed -E -i 's/([A-Z])([A-Z])\>,#/,,#/g' data.csv

# 剥离列
awk -F ',' '{print $2}' data.csv > date.list
awk -F ',' '{print $4}' data.csv > artist.list
awk -F ',' '{print $5}' data.csv > pic_id.list

# 列重组
paste -d ',' pic_id.list artist.list date.list > pic_data.csv

# 清理临时文件
rm data.csv
rm *.list

在WIndows下，可将上述命令保存为脚本文件 script.sh，然后安装 busybox-w32（官网：https://frippery.org/busybox/）：下载 busybox.exe（或 busybox64.exe·，用于64位系统），将其放在 X:\Windows` 目录下（X 是系统盘盘符），然后在命令行中执行：

busybox ash ./script.sh
# 或：busybox64 ash ./script.sh

不过，这样得到的 csv 文档是以 UTF-8 编码的，在Excel上读取时可能会出一些问题（我用的是Office 2019，读取 UTF-8 编码的 csv 文档时会乱码，可能是我的配置不正确）。

如想进一步了解awk，可以看一看这篇文章：https://www.ruanyifeng.com/blog/2018/11/awk.html。awk是一门强大的、用于数据分析的计算机语言，但其基本操作还是很简单的。

sed也是一个不错的编辑器，很适合在脚本中使用，其基本操作可以参考这篇文献：http://c.biancheng.net/view/994.html

Niceb · 2023 年1 月 6 日 01:51

word VBA

bamanzi · 2023 年1 月 6 日 02:44

emacs org-mode里面的表格编辑功能很适合这个

xiaokonglong · 2023 年1 月 6 日 09:05

对。这个也是可以的。我很多年以前一直用这个，但是这货越来越重了。

kqdssheng · 2023 年1 月 13 日 03:14

对于这种文本处理，我还是寄希望于 Excel的数据分列+公式组合。

话题		回复	浏览量
兄弟们，怎么在删除换行的同时保留空行啊问题求助	8	1783	2021 年10 月 13 日
求能够对多个TXT文本内容进行比对并去重的软件问题求助	13	2123	2022 年9 月 19 日
编辑文本时如何同时匹配多个关键字并进行替换？问题求助文本处理	19	2957	2022 年3 月 8 日
找重命名工具，替换多个字符串，最好支持正则表达式问题求助	23	2992	2022 年12 月 11 日
Vim 键盘映射稻米鼠的频道 vim	13	1814	2023 年2 月 6 日

像EmEdito那样能录制脚本的文本编辑器，还有什么？

相关话题