程序的目录下有一文件data. txt,是一个来源于网上的技术信息资料。对文件data. txt进行分词,对长度不少于3个字符的关键词,统计出现的次数,按照出现次数由大到小的顺序输出到文件out1. txt, 每行一个关键词及其出现次数,例如:
人工智能:24
同心圆:3
计算机:3
一部分:2
DeepMind:2
AlphaGo:2
learning:2
1956:2
科学家:2
日常生活:1
……
请完善下面的程序。
data.txt
import jieba
f=open("data.txt","r")
data=f.read()
f.close()
f=open("out1.txt","w")
data1=jieba.lcut(data)
d={}
for x in data1:
if _____________>=3:
d[x]=____________ +1
ls=list(d.items())
ls.sort(key=lambda x:_________,reverse=True)
for lis in ls:
f.write(lis[0]+':'+____________+'\n')
f.close()
求大神指导