(编辑:jimmy 日期: 2025/1/6 浏览:2)
一、前言
\quad \quad 有时候在使用Python处理比较耗时操作的时候,为了便于观察处理进度,这时候就需要通过进度条将处理情况进行可视化展示,以便我们能够及时了解情况。这对于第三方库非常丰富的Python来说,想要实现这一功能并不是什么难事。
\quad \quad tqdm就能非常完美的支持和解决这些问题,可以实时输出处理进度而且占用的CPU资源非常少
,支持循环处理
、多进程
、递归处理
、还可以结合linux的命令
来查看处理情况,等进度展示。
我们先来看一下进度条的效果。
from tqdm import tqdm for i in tqdm(range(int(9e6))): pass
可以看到,当我们的代码的运行需要较长时间时,进度条可以很好的帮助我们了解整个代码的运行进度。
1、安装
tqdm的安装十分简单,只需要通过pip或conda就可以安装。
2、pip安装
pip install tqdm
3、conda安装
conda install -c conda-forge tqdm
二、tqdm相关操作
1、迭代对象处理
对于可以迭代的对象
都可以使用下面这种方式,来实现可视化进度,非常方便。
from tqdm import tqdm import time for i in tqdm(range(100)): time.sleep(0.1) pass
100%|████████████████████████████████████████████████████████████████████████████████| 100/100 [00:10<00:00, 9.88it/s]
2、观察处理的数据
通过tqdm
提供的set_description
方法可以实时查看每次处理的数据。
from tqdm import tqdm import time pbar = tqdm(["A","B","C","D","E","F"]) for c in pbar: time.sleep(1) pbar.set_description("Processing %s"%c)
3、pandas中使用tqdm
在pandas
中对大量数据进行相关操作或者遍历表格的行列时,我们可以使用tqdm
来了解代码运行情况。
import pandas as pd df = pd.DataFrame({ 'Month':[1,2,3,4,5,2,3,4,5,1,2,3,4], 'Name':['张三','张三','张三','张三','张三','李四','李四','李四','李四','王五','王五','王五','王五'], 'Sex':['男','男','女','女','女','男','男','男','男','女','女','女','女']}) for i in tqdm(['Month','Name','Sex']): pass
100%|██████████████████████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00, 4707.41it/s]
4、多进程进度条
在使用多进程或者嵌套循环处理任务的时候,我们通过tqdm可以实时查看每一个进程任务的处理情况
from tqdm import tqdm import time for i in tqdm(range(5), ascii=True,desc="1st process"): for j in tqdm(range(5), ascii=True,desc="2nd process"): time.sleep(0.01)
1st process: 0%| | 0/5 [00:00<"htmlcode">from tqdm import tqdm import time #total参数设置进度条的总长度为100 with tqdm(total=100) as pbar: for i in range(100): time.sleep(0.05) #每次更新进度条的长度为1 pbar.update(1)除了上述方法之外,我们还能通过另外一种方法来实现操作。
from tqdm import tqdm import time #total参数设置进度条的总长度为100 pbar = tqdm(total=100) for i in range(100): time.sleep(0.05) #每次更新进度条的长度为1 pbar.update(1) #关闭占用的资源 pbar.close()另外,我们还能通过
set_description
和set_postfix
方法设置进度条显示信息。from tqdm import trange from random import random,randint import time with trange(100) as t: for i in t: #设置进度条左边显示的信息 #注意:代码中的HVAE是可以手动换成其他内容的 t.set_description("GEN %i"%i) #设置进度条右边显示的信息 #注意:此处代码中的gen lr lst是可以手动换成其他内容的 t.set_postfix(loss=random(),gen=randint(1,999),lr="h",lst=[1,2]) time.sleep(0.1)GEN 99: 100%|███████████████████████████████| 100/100 [00:10<00:00, 9.77it/s, gen=190, loss=0.00811, lr=h, lst=[1, 2]]令人震惊的是,当我们将进度条
显示的信息设置
为中文
时,竟然不会出现乱码!!!!from tqdm import trange from random import random,randint import time with trange(100) as t: for i in t: #设置进度条左边显示的信息 t.set_description("进度 %i"%i) #设置进度条右边显示的信息 t.set_postfix(loss=random(),随机=randint(1,999),名字="h",列表=[1,2]) time.sleep(0.1)进度 99: 100%|████████████████████████████████████| 100/100 [00:10<00:00, 9.75it/s, loss=0.975, 列表=[1, 2], 名字=h, 随机=469]三、其他相关操作
"htmlcode">
from tqdm import tqdm,trange import time for i in trange(100): time.sleep(0.1) pass100%|████████████████████████████████████████████████████████████████████████████████| 100/100 [00:10<00:00, 9.90it/s]2、当我们在
jupyter notebook
中使用进度条时,我们会发现整个进度条十分的难看,而在可能会出现多条进度条的情况,这样会让我们的代码显得十分的难看,这显然不是我们想要得到的结果。我们先来感受一下,这种丑丑的运行结果。
from tqdm import tqdm for i in tqdm(range(int(200))): print('tqdm',end=' ')