06-04 字典类型及操作
一、概述 字典类型定义 字典处理函数及方法 字典类型应用场景 二、字典类型定义 2.1 理解“映射” 映射是一种键(索引)和值(数据)的对应 序列类型由0..N整数作为数据的默认索引 映射类型则由用户为数据定义索引 2.2 字典类型定义 字典类型是“映射”的体现 键值对:键是数据索引的扩展 字典是键值对的集合,键值对之间无序 采用大括号{}和dic…
06-05 模块5-jieba库的使用
一、jieba库基本介绍 1.1 jieba库概述 jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌握一个函数 1.2 jieba库的安装 pip install jieba(cmd命令行) 1.3 jieba分词的原理 Jieba分…
06-06 实例10-文本词频统计
一、"文本词频统计"问题分析 1.1 问题分析 文本词频统计 需求:一篇文章,出现了哪些词?哪些词出现得最多? 该怎么做呢? 英文文本 --> 中文文本 英文文本:Hamlet 分析词频 中文文本:《三国演义》 分析人物 二、"Hamlet英文词频统计"实例讲解 文本去噪及归一化 使用字典表达词频 # …