IT之家 2024年09月14日
利用 3 个新增的 Excel 正则函数进行文本插入、文本拆分
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了 Excel 中新增的三个正则函数:REGEXREPLACE、REGEXEXTRACT 和 REGEXTEST,并通过实际案例展示了如何使用它们进行文本插入、拆分等操作。文章还详细解释了正则表达式中常用的符号和语法,帮助读者更好地理解和运用正则函数。

😁 **文本插入:** 借助 REGEXREPLACE 函数,可以利用正则表达式中的分组功能,在文本中指定位置插入分隔符。例如,在中文和英文/数字之间插入“-”,公式为 `=REGEXREPLACE(A2, "(.*[一-龟])(\w+)", "$1-$2")`。其中,`(.*[一-龟])` 匹配中文部分,`(\w+)` 匹配英文/数字部分,`$1-$2` 代表将匹配到的两部分用“-”连接起来。

😄 **文本拆分:** REGEXEXTRACT 函数可以根据正则表达式提取文本中的特定部分。例如,要提取日期之间的姓名,可以使用 `=REGEXEXTRACT(A2, "[^0-9-]+", 1)`,其中 `[^0-9-]+` 表示匹配除数字和“-”以外的字符,`1` 表示匹配所有匹配项。

😉 **正则表达式语法:** 文章详细介绍了正则表达式中常用的符号和语法,例如 `[]` 代表字符集,`^` 代表取反,`()` 代表分组,`$n` 代表第 n 个分组。了解这些语法可以帮助读者更好地编写正则表达式,从而实现更复杂的文本操作。

😎 **总结:** 正则函数可以帮助用户更灵活地处理文本数据,提高工作效率。通过学习正则表达式的语法和使用技巧,可以更方便地进行文本匹配、提取、替换、插入和拆分等操作。

🥳 **进阶学习:** 文章最后提到了更深的正则语法,鼓励读者继续深入学习,掌握更强大的文本处理能力。

原文标题:《这 3 个新增的 Excel 正则函数,太牛 X 了!》

大家好,我是会 Excel 数据处理的小爽~

之前我们讲过 WPS 新增的、一个非常强大的文本处理函数 —— Regex 函数。(文章请戳)

它既可以做文本判断,也可以做文本提取,甚至可以做文本替换。

Regex 函数其实就是下面三个正则函数的集合版本。

分别是 :

文本判断:Regextest

文本提取:Regexextract

文本替换:Regexreplace

如今,Office 365 中的 Excel,也更新这三个正则函数了,WPS 和 Excel 的正则函数语法差不多,大家可以对照着学习。

鉴于有小伙伴想看看进阶一点的正则函数。

今天,小爽就继续来聊聊正则函数。

我们在日常工作中,除了需要对文本进行判断,提取,替换外,还可能需要对文本进行插入,拆分等操作。

大家跟我一起往下看,进一步认识其他的正则表达式。

正则表达式是一种用于匹配和操作文本的强大工具,它是由一系列字符和特殊字符组成的模式,用于描述要匹配的文本模式。

正则表达式可以在文本中查找、替换、提取和验证特定的模式。

PS.本文使用 Excel 里面的正则函数进行演示。

1、文本插入

如下图,我们需要在中文和英文 / 数字中,插入一个分隔符「-」,以便更好地查看信息。

传统的做法是:利用字节数确定文本的位置,然后进行替换。

=REPLACE(A2,LENB(A2)-LEN(A2)+1,0"-")

这种做法也可以,但是如果单元格开头不是文本,公式就会出错!!

所以,最好的方法就是利用强大的正则函数!

如下图:

=REGEXREPLACE(A2"(*[一-龟])(\w+)""$1-$2")

我们来看看这个公式:

=REGEXREPLACE(A2"(*[一-龟])(\w+)""$1-$2")

Regexreplace 语法:

=REGEXREPLACE (字符串,正则表达式,替换表达式,[指定替换实例],[是否区分大小写])

字符串:A2 单元格

正则表达式:"(.*[一-龟])(\w+)"

替换表达式:"$1-$2"

假设字符串为 "excel 小爽 xiaoshuang"。

(.*[一-龟]):第一分组

.*  除换行符之外的任意字符,* 代表 0 到多个

[一-龟]:后面紧接着一个中文字符

第一组匹配到的字符为 excel 小爽。

(\w+):第二分组:

\w:在正则表达式中,它表示字母数字字符,包括所有字母(a-z、A-Z)和数字(0-9)的字符。它等同于 "[A-Za-z0-9_]"

\w+ 也就是代表一个到多个

第二组匹配到的字符为 xiaoshuang。

替换表达式:"$1-$2"

$1 代表第一分组的内容,也就是 "excel 小爽"

$2 代表第二分组的内容,也就是 "xiaoshuang"

"$1-$2",也就是 "Excel 小爽-xiaoshuang"。

拆分函数 Textsplit 目前还不能进行正则语法拆分,不过我们可以借助正则函数 Regexextract!

2、文本拆分

如下图所示:我想提取出日期之间的姓名。

用 Textsplit 函数来做,需要先把数字和分隔符进行数组拼接后,再进行拆分。

=TEXTSPLIT(A2,VSTACK(SEQUENCE(10,1,0)"-")1)

如果用正则函数来做,不需要像拆分函数那样进行拼接,只要把需要拆分的字符,放在中括号中取反即可。

=REGEXEXTRACT(A2"[^0-9-]+"1)

Regexextract 语法:

=REGEXEXTRACT (字符串,正则表达式,[匹配方式])

匹配方式中:

0 - 第一个匹配项 (默认值)

1 - 所有匹配项

2 - 捕获第一个匹配项的组

第三参数为 1,因为我们是要匹配所有的匹配项。

=REGEXEXTRACT(A2,"[^0-9-]+",1)

重点看第二参数:正则表达式

"[^0-9-]+"

[] 中括号:用于指定一个字符集合或区间,可以让正则表达式匹配特定的字符或范围。

^ 号:在字符集合开头表示取反,即匹配除字符集合以外的其他字符。

- 号:在字符集合中间表示范围,但是如果它在开头或结尾,则只表示普通字符-

该表达式的意思是:取除了 0 到 9 和-之外的字符,取一个或者多个,尽可能多的匹配。

只匹配数字和-之外的字符,是不是相当于按照数字和-,进行拆分了呢~

3、最后的话

今天我们再一次学到新的正则表达式:

在 Regexreplace 函数中:

正则表达式,() 代表分组,有几个括号就代表几个分组

替换表达式,$n 代表第几个分组

我们可以利用分组灵活的插入字符串

\w 代表,数字字母下划线 [0-9a-zA-Z_]

\W 就是,非数字字母下划线 [^0-9a-zA-Z_]

拆分中,我们可以通过中括号取反的方式进而实现正则拆分:

[] 代表字符集,中括号中开头 ^ 代表取反 [^..]

那大家也不难想到:

\d 取反是 \D,也就是 [^\d] 和 \D 是一样的。

好了,本文就到这里结束啦~

看到这里,小伙伴是不是觉得,正则也就是这么一回事呢~

后面文章我们会接着继续聊聊更深的正则语法。

本文来自微信公众号:秋叶 Excel (ID:excel100),作者:小爽

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Excel 正则表达式 文本处理 REGEXREPLACE REGEXEXTRACT REGEXTEST
相关文章