06-06 实例10-文本词频统计
一、"文本词频统计"问题分析 1.1 问题分析 文本词频统计 需求:一篇文章,出现了哪些词?哪些词出现得最多? 该怎么做呢? 英文文本 --> 中文文本 英文文本:Hamlet 分析词频 中文文本:《三国演义》 分析人物 二、"Hamlet英文词频统计"实例讲解 文本去噪及归一化 使用字典表达词频 # …
06-07 组合数据类型小结
一、数字类型及操作 整数类型的无限范围及4种进制表示 浮点数类型的近似无限范围、小尾数及科学计数法 +、-、*、/、//、%、**、二元增强赋值操作符 abs()、divmod()、pow()、round()、max()、min() int()、float()、complex() # DayDayUpQ3.py dayup = 1.0 dayfac…
07-01 文件操作
一、概述 文件的类型 文件的打开和关闭 文件内容的读取 数据的文件写入 二、文件的类型 2.1 文件的理解 文件是数据的抽象和集合 文件是存储在辅助存储器上的数据序列 文件是数据存储的一种形式 文件展现形态:文本文件和二进制文件 文本文件 vs. 二进制文件 文件文件和二进制文件只是文件的展示方式 本质上,所有文件都是二进制形式存储 形式上,所有文…