(编辑:jimmy 日期: 2025/1/12 浏览:2)
需求描述
在利用numpy进行数据分析时,常有的一个需求是:根据已知的数组生成新数组。这个问题又可以分为两类:
下面简单总结.
生成子数组
情况1
已知数组a,以及若干筛选条件conds,要求从数组a中生成一个子数组b。
解决办法:b=a[conds]
。比如b=a[a>0],b=a[(a>=1)|(a<=-2)], b=a[(a>=1)&(a<=3)]
实例:如下
# 实例1.1:已知数组a,要求找出所有a>0的元素,然后生成一个新数组。 a = np.arange(-5,5,1) print('原数组a:',a) b = a[a>0] print('实例1结果:',b) # 实例1.2:已知数组a,要求找出所有a>=1或a<=-2的元素,然后生成一个新数组。 b = a[(a>=1) | (a<=-2)] print('实例2结果:',b) # 实例1.3:已知数组a,要求找出所有a>=1并且a<=3的元素,然后生成一个新数组。 b = a[(a>=1) & (a<=3)] print('实例3结果:',b)
运行结果:
原数组a: [-5 -4 -3 -2 -1 0 1 2 3 4]
实例1结果: [1 2 3 4]
实例2结果: [-5 -4 -3 -2 1 2 3 4]
实例3结果: [1 2 3]
情况2
已知数组a和数组b(shape相同),以及对数组a的筛选条件conds_a。要求从数组b中生成一个子数组c,其中的元素id,与满足筛选条件的数组a的元素id一一对应。
解决办法:
c = b[conds_a],
比如c = b[(a>=1) & (a<=3)]
实例:如下
a = np.arange(-5,5,1) b = np.arange(-50,50,10) print('数组a:',a) print('数组b:',b) c = b[(a>=1) & (a<=3)] print('新数组c:', c)
运行结果:
数组a: [-5 -4 -3 -2 -1 0 1 2 3 4]
数组b: [-50 -40 -30 -20 -10 0 10 20 30 40]
新数组c: [10 20 30]
变换成新数组
已知数组a,以及若干变换条件conds,要求生成一个新数组b(与原数组shape相同)。解决办法:
方法1:np.where(where(condition, [x, y]))
使用场景:当变换条件只有两个以下时,比如实例2.1。该方法等价于:if condition x else y
方法2: np.select(condlist, choicelist, default=0)
使用场景:当变换条件有任意多个时,比如实例2.2。该方法等价于:
if condlist[0]: choicelist[0] elif condilist[1]: choicelist[1] ... else: default
方法3:np.piecewise(x, condlist, funclist, *args, **kw)
使用场景:同方法2,只不过变换条件较复杂,无法直接写出,要用函数来表示。
实例:如下
# 实例2.1:已知数组a,要求对所有a<0的元素取绝对值,对其他元素设为0,然后生成一个新数组 a = np.arange(-5,5,1) print(a) b = np.where(a<0, abs(a),0) print('实例2.1结果:',b) # 实例2.2:已知数组a,要求对所有a<0的元素取绝对值,对a=0的元素+100,对a>0的元素平方,然后生成一个新数组 b = np.select([a<0, a==0, a>0], [abs(a), a+100, a**2]) print('实例2.2结果:',b)
运行结果:
[-5 -4 -3 -2 -1 0 1 2 3 4]
实例2.1结果: [5 4 3 2 1 0 0 0 0 0]
实例2.2结果: [5 4 3 2 1 100 1 4 916]