跳转至

Python 笔记 | 常用库推荐

这是本专栏 Python 基础教程的最后一课!Python 拥有众多功能强大的库,这些库在数据处理、可视化、机器学习、Web开发等领域发挥着重要作用。

笔者在该专栏主页就说到:学了 Python 但是不了解 PyTorch 有点可惜。笔者十分建议对数学与计算机科学感兴趣的一定要了解一下深度学习,试试 PyTorch 库。

以下是一些 Python 常用库的介绍及小案例,具体用法可查看官方文档或询问大语言模型:

NumPy(科学计算)

简介:NumPy 是 Python 中用于科学计算的基础包。它提供了高性能的多维数组对象和用于数组操作的工具。

应用:广泛用于数据处理、数学运算、统计分析、线性代数等领域。

小案例:计算数组的均值

Python
1
2
3
4
5
import numpy as np

arr = np.array([1, 2, 3, 4, 5])
mean = np.mean(arr)
print(mean)  # 输出: 2.5

Pandas(数据分析)

简介:Pandas 是 Python 中用于数据分析和操作的库。它提供了快速、灵活、易用的数据结构和数据处理工具。

应用:常用于数据清洗、数据重塑、数据分组、时间序列分析等任务。

小案例:读取 CSV 文件并筛选数据

Python
1
2
3
4
5
6
7
8
import pandas as pd

# 读取CSV文件
df = pd.read_csv('data.csv')

# 筛选数据(假设我们要筛选'column_name'列中值大于10的行)
filtered_df = df[df['column_name'] > 10]
print(filtered_df)

Matplotlib(绘制图表)

简介:Matplotlib 是 Python 中用于绘制各种类型图表和可视化的库。

应用:可用于创建折线图、散点图、直方图、饼图等各种图表。

小案例:绘制数据的折线图

Python
import matplotlib.pyplot as plt
import numpy as np

x = np.linspace(0, 10, 100)
y = np.sin(x)

plt.plot(x, y)
plt.title('Sine Curve')
plt.xlabel('x')
plt.ylabel('y')
plt.show()

Scikit-learn(机器学习*)

简介:Scikit-learn 是 Python 中用于机器学习的库。它包含了许多经典的机器学习算法和工具。

应用:常用于数据挖掘、模式识别、预测分析等任务。

小案例:使用 K-means 算法进行聚类

Python
1
2
3
4
5
6
7
8
9
from sklearn.cluster import KMeans
import numpy as np

# 假设我们有一些二维数据
data = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])

# 使用KMeans进行聚类
kmeans = KMeans(n_clusters=2, random_state=0).fit(data)
print(kmeans.labels_)  # 输出每个数据点的聚类标签

TensorFlow/PyTorch*(深度学习*)

简介:TensorFlow 和 PyTorch 是两个流行的深度学习框架,用于构建、训练和部署神经网络模型。

应用:广泛用于图像识别、自然语言处理、语音识别等领域。

由于深度学习框架的使用通常涉及较复杂的模型和训练过程,这里不直接给出小案例,但你可以通过官方文档和教程学习如何构建和训练神经网络模型。

Flask/Django*(Web 应用框架)

简介:Flask 和 Django 是 Python 中最流行的 Web 框架之一,用于构建 Web 应用。

应用:Flask 适合快速开发小型应用,而 Django 适合构建大型、复杂的 Web 应用。

由于 Web 框架的使用涉及较多的代码和配置,这里也不直接给出小案例,但你可以通过官方文档和教程学习如何构建 Web 应用。

以上只是Python常用库中的一部分,实际上还有很多其他库和工具可以根据具体需求进行选择和使用。

Python 包管理工具

要想使用上述第三方库,那就离不开包管理工具,来对第三方库进行快捷管理。

pip 是一个现代的、通用的 Python 包管理工具,全称为 “Python Package Index” ,它是 Python 开发者必备的工具之一。pip 提供了对 Python 包的查找、下载、安装、卸载等功能,极大地提高了开发效率和代码质量。

注意

通常在 Python 虚拟环境中安装第三方库,避免污染全局环境,详见 Python 虚拟环境 ,进入项目虚拟环境后,再使用 pip 安装自己项目所需的第三方库即可。

若使用 PyCharm 开发项目,该 IDE 自动会使用虚拟环境创建项目。

主要功能

  1. 安装 Python 包:pip 可以从 Python Package Index (PyPI) 下载并安装 Python 包。例如,使用pip install numpy 命令即可安装numpy库。
  2. 卸载 Python 包:如果不再需要某个 Python 包,可以使用 pip 的卸载功能将其从系统中移除。例如,pip uninstall requests 命令将卸载 requests 库。
  3. 升级 Python 包:pip 还支持升级已安装的 Python 包到最新版本。使用 pip install --upgrade numpy 命令即可升级 numpy 库。
  4. 查看已安装的 Python 包:通过 pip的 list 命令,可以列出系统中已安装的所有 Python 包。
  5. 搜索 PyPI 查找包:pip 的 search 命令允许开发者在 PyPI 上搜索特定的 Python 包。

使用示例

  1. 安装 Django 包:在命令行或终端中输入 pip install django 命令,即可安装 Django 包。
  2. 安装并指定包的版本:如果需要安装特定版本的 Python 包,可以在包名后加上版本号。例如, pip install requests==2.22.0 将安装 requests 包的 2.22.0 版本。
  3. 从 requirements.txt 文件安装包:开发者可以将所需的包及其版本号保存在一个名为 requirements.txt 的文件中,然后通过 pip install -r requirements.txt 命令来安装这些包。

    requirements.txt
    1
    2
    3
    4
    5
    # 格式为 package_name==version_number 
    # 除了直接指定版本号外,还可以使用操作符(>、>=、<、<=)来指定允许的版本范围
    numpy==1.18.5
    pandas==1.0.1
    matplotlib>=3.2.1