我们通过上面代码发现,这个函数它能够通过我们对 end_flag (结束符号)来进行修改,实现自定义特定的句子切分方式,比如加入 ; 等符号 。
当然,也可以用正则表达式来完成分句,使用 re.split 的方法 。
import re def cut_sentences(content): sentences = re.split(r'(.|!|?| 。|!|?|.{6})', content) return sentences content = content = '在处理文本时,会遇到需要将文本以 句子 为单位进行切分(分句)的场景,而文本又可以分为 中文文本 和 英文文本 ,处理的方法会略有不同 。本文会介绍 Python 是如何处理 分句 的 。' sentences = cut_sentences(content) print(' '.join(sentences)) 在处理文本时,会遇到需要将文本以 句子 为单位进行切分(分句)的场景,而文本又可以分为 中文文本 和 英文文本 , 处理的方法会略有不同 。 本文会介绍 Python 是如何处理 分句 的 。【在python中如何分句?这些代码你非常需要】以上就是小编给大家带来的在python中分句的方法了,希望大家通过阅读小编的文章之后能够有所收获!如果大家觉得小编的文章不错的话,可以多多分享给有需要的人 。
猜你喜欢
- python脚本文件的扩展名是什么?这篇文章值得一看
- python如何检验安装成功?这两个方法你可能用得上
- python怎么模拟键盘操作?这篇文章你值得一看
- python怎么写延时?这个方法非常有用
- python几个数如何比大小?通过这俩个知识点非常简单
- mongodb在命令中怎么启动不了?这个方法你一定用得上
- python的注释符是什么?这篇文章值得你阅读
- python中的strip是什么意思?这篇文章告诉你什么是strip
- python列表和字典区别?这篇文章值得我们阅读
- 如何查看python内置函数源码?这篇文章非常推荐你阅读
