我爱python...
生工学院py大一实验报告
生工学院大二py实验报告2(sklearn)
外国语学院大二py实验报告1(NLP-nltk)
外国语学院py实验报告
外国语学院大二py实验报告4.1
外国语学院大二py实验报告4.2
豆瓣爬虫
ECUST - 2022年下半年大二上学期外语学院python期末考试真题题库(python与语言智能)
ECUST - 2022年下半年大二上学期外语学院python备考资料
c语言求解n的阶乘1
c语言随机生成数组并排序
c语言编写递归,求解阶乘之和
2025 openvpn入门:用openvpn+云服务器实现私有网络代理
本文档使用 MrDoc 发布
-
+
首页
ECUST - 2022年下半年大二上学期外语学院python期末考试真题题库(python与语言智能)
### 代码编程题 1.批量合并txt文件 ```python def accum(Dir,allFile): # 批量合并txt文件 targetfile=glob.glob(pathname=Dir) print(targetfile) for file in targetfile: with open(file,'r',encoding='utf-8')as f: alltext=f.readlines() with open(allFile,'a',encoding='utf-8')as nf: nf.writelines(alltext) accum(r'data:/*.txt',r'data:/all.txt') ``` 2.统计字符串中不同种类字符个数 ```python str1 = "sentence:Hello! I`m Jacky!" digit_num,space_num,alpha_num = 0,0,0 for c in str1: if c.isdigit(): digit_num = digit_num + 1 if c.isspace(): space_num = space_num + 1 if c.isalpha(): alpha_num = alpha_num + 1 rest_num = len(str1)-(digit_num+space_num+alpha_num) print(digit_num,space_num,alpha_num,rest_num) ``` ### 代码填空题 1.文本提取二连词 2.去标点符号 3.翻页获取多个网页新闻语料 4.提取网页中url 5.去停用词 6.遍历单词词典 ### 简答题 (答案仅供参考) 1.自然语言情感分析有几种粒度,并通过例子简要说明。 ``` 自然语言情感分析有单词级、句子级、篇章段落级粒度,即通过对不同粒度的内容打情感标签来分析目标文本的情感。例如对一篇文章进行单词级的情感分析,就需要把文章按照单词划分开,通过对不同情感的单词打标签并做处理,可以实现对整篇文章的情感分析。 ``` 2.给出浏览器进行浏览网页的流程。 ``` 1、DNS解析域名,查找网页对应的IP地址 2、客户端和服务器通过三次握手建立TCP连接 3、发出HTTP请求 4、服务器处理请求并返回HTTP响应报文 5、浏览器解析渲染界面 6、四次挥手释放TCP连接 ``` 3.给出爬虫的流程。 ``` 爬虫的基本流程: 1.发起请求: 通过HTTP库向目标站点发起请求,即发送一个Request,请求可以包含额外的headers、data等信息,然后等待服务器响应。这个请求的过程就像我们打开浏览器,在浏览器地址栏输入网址:www.baidu.com,然后点击回车。这个过程其实就相当于浏览器作为一个浏览的客户端,向服务器端发送了 一次请求。 2.获取响应内容: 如果服务器能正常响应,我们会得到一个Response,Response的内容便是所要获取的内容,类型可能有HTML、Json字符串,二进制数据(图片,视频等)等类型。这个过程就是服务器接收客户端的请求,进过解析发送给浏览器的网页HTML文件。 3.解析内容: 得到的内容可能是HTML,可以使用正则表达式,网页解析库进行解析。也可能是Json,可以直接转为Json对象解析。可能是二进制数据,可以做保存或者进一步处理。这一步相当于浏览器把服务器端的文件获取到本地,再进行解释并且展现出来。 4.保存数据: 保存的方式可以是把数据存为文本,也可以把数据保存到数据库,或者保存为特定的jpg,mp4 等格式的文件。这就相当于我们在浏览网页时,下载了网页上的图片或者视频。 ``` 4.举例说明python在语言分析和研究中的作用。 ``` 略 ``` ### 选择题 1.列表相关 2.字符串相关 3.元组相关 4.字典相关 (答案仅供参考)
zhy@@ldy
2022年12月24日 15:07
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
PDF文档(打印)
分享
链接
类型
密码
更新密码