热门

最新

红包

立Flag

投票

同城

我的

发布
henanlion
PythonFun 河南城建学院讲师
4 月前
truehenanlion

两个非常好用的Python模块:精准分句和debug
1. pysbd分句模块,可以分中文和英文,尤其是对于Dr. etc. Mr.这样的也能准确识别。样例代码如下:
import pysbd
seg = pysbd.Segmenter(language="zh", clean=True)
print(seg.segment("我是中国人,我来自河南。你来自哪里?"))
seg = pysbd.Segmenter("en",clean=True)
print(seg.segment("Hello, Dr. Wang? Where are you from? Look! Mr. Li is coming. I have some books,etc."))
2. pdb代码检测模型。可以通过set_trace()来设置断点,通过快捷键n(下一步),p(打印变量), s(进入函数),c(进入到下一个断点),l(显示当前代码位置)代码样如下:
import pdb
def calculate_average(numbers):
pdb.set_trace()
total = sum(numbers)
count = len(numbers)
average = total / count
return average
# 测试函数
data = [1, 2, 3, 4, 5]
result = calculate_average(data)
print(f"平均值: {result}")

CSDN App 扫码分享
分享
评论
点赞
打赏
  • 复制链接
  • 举报
下一条动态
立即登录