python统计个单词数目要求是get_word_frequencies(file_name) 打开了FILE NAME这文件后运用dictionary统计出文章中各单词的数目 效果如下:{'all':1,'forget':1,'-':3,'years':1,'proposition':1,'continent':1,'liberty,':1,'We':

来源:学生作业帮助网 编辑:作业帮 时间:2024/05/07 23:26:42
python统计个单词数目要求是get_word_frequencies(file_name) 打开了FILE NAME这文件后运用dictionary统计出文章中各单词的数目 效果如下:{'all':1,'forget':1,'-':3,'years':1,'proposition':1,'continent':1,'liberty,':1,'We':

python统计个单词数目要求是get_word_frequencies(file_name) 打开了FILE NAME这文件后运用dictionary统计出文章中各单词的数目 效果如下:{'all':1,'forget':1,'-':3,'years':1,'proposition':1,'continent':1,'liberty,':1,'We':
python统计个单词数目
要求是get_word_frequencies(file_name) 打开了FILE NAME这文件后运用dictionary统计出文章中各单词的数目 效果如下:
{'all':1,'forget':1,'-':3,'years':1,'proposition':1,'continent':1,'liberty,':1,'We':2,...
PS:‘-’这种不属于单词的东西不要统计在内

python统计个单词数目要求是get_word_frequencies(file_name) 打开了FILE NAME这文件后运用dictionary统计出文章中各单词的数目 效果如下:{'all':1,'forget':1,'-':3,'years':1,'proposition':1,'continent':1,'liberty,':1,'We':
楼上的程序存在诸多问题,如没有处理标点,文件读取方法错误等.
请问楼主要区分大小写吗?如果区分的话,就按照下面的来:
import re
def get_word_frequencies(file_name):
\x09dic = {}
\x09txt = open(filename, 'r').read().splitlines()
\x09#下面这句替换了除了'-'外的所有标点,因为'-'可能存在于单词中.
\x09txt = re.sub(r'[^\u4e00-\u94a5\w\d\-]', ' ', txt)
\x09#替换单独的'-'
\x09txt = re.sub(r' - ', ' ', txt)
\x09for line in :
\x09\x09for word in line.split():
\x09\x09#如果不区分大小写,那就一律按照小写处理,下面那句改为dic.setdefault(word.lower(), 0)
\x09\x09\x09dic.setdefault(word, 0)
\x09\x09\x09dic[word] += 1
\x09print dic
\x09
if __name__ = '__main__':
\x09get_word_frequencies('test.txt')
有问题继续追问吧

python统计个单词数目要求是get_word_frequencies(file_name) 打开了FILE NAME这文件后运用dictionary统计出文章中各单词的数目 效果如下:{'all':1,'forget':1,'-':3,'years':1,'proposition':1,'continent':1,'liberty,':1,'We': python中如何统计两个字典中相同单词数量有多少个? 如何用python统计一篇英语文章里单词总数和句子总数 python 统计单词平均长度,统计a出现的次数有一个txt文件叫123.txt,里面是很多很多单词我想统计这些单词的平均长度,然后找出a出现的次数请根据这个框架写code,包括之前怎样打开那个txt文件def C语言编写,英语短文统计某各个字母的个数、统计句子的长短、统计单词的数目、统计特定单词.要具体运行程序,程序越大越好. 怎样统计菌落数目 从键盘输入一段英文,统计并输出单词个数额 是c++的 写一个python的script,要求生成1000个随机的[a,b,c]数列;a,b,c在0和1之间rt.这是project的一部分.其他部分都搞定了.但是这部分始终不会写 用python做一个判断多个数字是否为偶数或奇数的程序用python做一个判断4个数字是否为偶数或奇数的程序,并且在最后说出1.奇数的数目比偶数多 2.偶数比奇数多 3.奇数和偶数一样多 急求河北工业大学计算机软件技术基础(VC) 课程设计 数据统计、平均值、方差要求用C++语言编程,在Visual C++环境下调试完成.问题功能描述:键盘输入20个数据.统计1:统计其中奇数个数是 vb统计在一个文本框内各英文单词出现的次数统计在一个文本框内各英文单词出现的次数(不区分大小写),并按英文字母的先后顺序输出各个单词与其对应的出现次数,要求将统计个单词出现 C++数据统计 double型我的实际数据是 0.10—0.60随机的10000个数 我要画出他的直方图 把这组数按大小 分为100个组 每组相差(0.6 - 0.1)/100 我要统计每一组的所含有的数目 要怎么统计?如果把 i = (求高手)java程序 :统计一篇文章中一共出现了多少个单词并且排序要求如下:1)一共出现了多少个单词2)有多少个互不相同的单词3)给出每个单词出现的频率,并将这些单词按频率大小 输出单词按照字典序排列 c++有条题目:输入若干行,统计单词出现的次数.输出单词按照字典序排列.要求使用map容器实现.就是不了解字典序排列是怎样呢.本人新手. 求酵母菌数目统计实验的具体步骤. 从文件中提取符合要求的数据,编程语言不限,最好是perl/python/shell/vb/c其中的一种,采纳后另附送30分有一文件,其格式为:共3列,第1列是方位(north,west...),第2列是坐标,第3列是判定条件(共4个 请帮忙写个图书管理系统统计高等教育出版社出版的图书数目算法(用c伪代码)谢谢 R语言 与python 在数据统计上 哪个更强