【Python】数据分析与处理库
pandas、numpy、jieba、gensim。
【Python】数据分析与处理库
pandas
Pandas是基于Numpy的专业数据分析工具, 可以灵活高效的处理各种数据集。它提供了的数据结构有DataFrame和Series等,可以简单的把DataFrame理解为Excel里面的一张表,而Series就是表中的某一列
pip安装命令:
1
pip install pandas
导包示例:
1
import pandas as pd
numpy
NumPy是Python中科学计算的基础包。它是一个Python库,提供多维数组对象,各种派生对象(如掩码数组和矩阵),以及用于数组快速操作的各种API,有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、基本线性代数,基本统计运算和随机模拟等等。 NumPy包的核心是 ndarray 对象。它封装了python原生的同数据类型的 n 维数组,为了保证其性能优良,其中有许多操作都是代码在本地进行编译后执行的。
pip安装命令:
1
pip install numpy
导包示例:
1
import numpy as np
jieba
pip安装命令:
1
pip install jieba
导包示例:
1
2
import jieba.analyse as analyse
import jieba
gensim
pip安装命令:
1
pip install gensim
导包示例:
1
2
from gensim import corpora, models, similarities
import gensim
本文由作者按照 CC BY 4.0 进行授权