电源信息提取--课后程序(Python程序开发案例教程-黑马程序员编著-第11章-课后作业)
创始人
2024-06-03 01:32:38
0

实例2:电影信息提取

在“电影.txt”文件中,包含电影排名、电影名称、评分、类别、演员等信息。虽然该文件中数据杂乱,不能很清晰地了解全部数据信息,但是每种数据都有相对应的标签,例如title标签对应着电影名称、rating标签对应着电影评分、rank标签对应着电影排名。为了能够提取指定的数据信息,可以使用正则表达式。图1所示为“电影.txt”文件中数据。

 

  1.  电影.txt

本实例要求编写程序,实现提取排名前20的电影名称与评分信息的功能。

实例目标

  1. 掌握re模块中compile()函数的使用
  2. 掌握re模块中findall()方法的使用

实例分析

在使用正则表达式匹配之前,我们需要先读取“电影.txt”文件中的数据,将读取的数据作为正则表达式待匹配的目标文本对象。由于实例要求提取排名前20的电影名称及评分,所以需要编写符合要求的正则表达式,具体如下:

  1. 电影名称对应的正则表达式为title":"(.*?)。
  2. 电影评分对应的正则表达式为rating":\["(.*?)","\d+"\]。
  3. 电影排名对应的正则表达式为rank":(\d+)。

代码实现

import re

data = open("电影.txt", 'r', encoding='utf-8').read()

# 定义正则表达式分别匹配电影名称/评分/排名

title = r'"title":"(.*?)"'

rating = r'"rating":\["(.*?)","\d+"\]'

rank = r'"rank":(\d+)'

# 预编译正则表达式

pattern_title = re.compile(title)

pattern_rating = re.compile(rating)

pattern_rank = re.compile(rank)

# 查找全部匹配的数据(返回列表)

data_title = pattern_title.findall(data)

data_rating = pattern_rating.findall(data)

data_rank = pattern_rank.findall(data)

for i in range(20):

    print("排名:", data_rank[i] + "\t\t" + "电影名:" + data_title[i]

 + "\t\t" + "评分:" + data_rating[i])

以上代码首先导入了re模块,打开“电影.txt”文件并将读取的数据赋值给data,然后编写了分别匹配电影名称、电影评分、电影排名的正则表达式title、rating、rank,使用complie()函数预编译正则表达式,通过findall()方法查找匹配的内容,最后遍历输出前20条数据,即排名前20的电影信息。

代码测试

运行代码,控制台输出结果如下:

排名: 1     电影名:肖申克的救赎       评分:9.6

排名: 2     电影名:霸王别姬           评分:9.6

排名: 3     电影名:控方证人           评分:9.6

排名: 4     电影名:伊丽莎白           评分:9.6

排名: 5     电影名:美丽人生           评分:9.5

排名: 6     电影名:辛德勒的名单       评分:9.5

排名: 7     电影名:这个杀手不太冷     评分:9.4

排名: 8     电影名:阿甘正传           评分:9.4

排名: 9     电影名:十二怒汉           评分:9.4

排名: 10    电影名:泰坦尼克号 3D版    评分:9.4

排名: 11    电影名:背靠背,脸对脸     评分:9.4

排名: 12    电影名:灿烂人生          评分:9.4

排名: 13    电影名:茶馆              评分:9.4

排名: 14    电影名:十二怒汉          评分:9.4

排名: 15    电影名:巴黎圣母院        评分:9.4

排名: 16    电影名:控方证人          评分:9.4

排名: 17    电影名:罗密欧与朱丽叶     评分:9.4

排名: 18    电影名:盗梦空间          评分:9.3

排名: 19    电影名:泰坦尼克号        评分:9.3

排名: 20    电影名:千与千寻          评分:9.3

相关内容

热门资讯

常用商务英语口语   商务英语是以适应职场生活的语言要求为目的,内容涉及到商务活动的方方面面。下面是小编收集的常用商务...
六年级上册英语第一单元练习题   一、根据要求写单词。  1.dry(反义词)__________________  2.writ...
复活节英文怎么说 复活节英文怎么说?复活节的英语翻译是什么?复活节:Easter;"Easter,anniversar...
2008年北京奥运会主题曲 2008年北京奥运会(第29届夏季奥林匹克运动会),2008年8月8日到2008年8月24日在中华人...
英语道歉信 英语道歉信15篇  在日常生活中,道歉信的使用频率越来越高,通过道歉信,我们可以更好地解释事情发生的...
六年级英语专题训练(连词成句... 六年级英语专题训练(连词成句30题)  1. have,playhouse,many,I,toy,i...
上班迟到情况说明英语   每个人都或多或少的迟到过那么几次,因为各种原因,可能生病,可能因为交通堵车,可能是因为天气冷,有...
小学英语教学论文 小学英语教学论文范文  引导语:英语教育一直都是每个家长所器重的,那么有关小学英语教学论文要怎么写呢...
英语口语学习必看的方法技巧 英语口语学习必看的方法技巧如何才能说流利的英语? 说外语时,我们主要应做到四件事:理解、回答、提问、...
四级英语作文选:Birth ... 四级英语作文范文选:Birth controlSince the Chinese Governmen...
金融专业英语面试自我介绍 金融专业英语面试自我介绍3篇  金融专业的学生面试时,面试官要求用英语做自我介绍该怎么说。下面是小编...
我的李老师走了四年级英语日记... 我的李老师走了四年级英语日记带翻译  我上了五个学期的小学却换了六任老师,李老师是带我们班最长的语文...
小学三年级英语日记带翻译捡玉... 小学三年级英语日记带翻译捡玉米  今天,我和妈妈去外婆家,外婆家有刚剥的`玉米棒上带有玉米籽,好大的...
七年级英语优秀教学设计 七年级英语优秀教学设计  作为一位兢兢业业的人民教师,常常要写一份优秀的教学设计,教学设计是把教学原...
我的英语老师作文 我的英语老师作文(通用21篇)  在日常生活或是工作学习中,大家都有写作文的经历,对作文很是熟悉吧,...
英语老师教学经验总结 英语老师教学经验总结(通用19篇)  总结是指社会团体、企业单位和个人对某一阶段的学习、工作或其完成...
初一英语暑假作业答案 初一英语暑假作业答案  英语练习一(基础训练)第一题1.D2.H3.E4.F5.I6.A7.J8.C...
大学生的英语演讲稿 大学生的英语演讲稿范文(精选10篇)  使用正确的写作思路书写演讲稿会更加事半功倍。在现实社会中,越...
VOA美国之音英语学习网址 VOA美国之音英语学习推荐网址 美国之音网站已经成为语言学习最重要的资源站点,在互联网上还有若干网站...
商务英语期末试卷 Part I Term Translation (20%)Section A: Translate ...