nan 값을 0으로 변환
저는 2D numpy 배열을 가지고 있습니다.이 배열의 일부 값은 다음과 같습니다.NaN
이 배열을 사용하여 특정 작업을 수행합니다.예를 들어, 다음과 같은 배열을 생각해 보십시오.
[[ 0. 43. 67. 0. 38.]
[ 100. 86. 96. 100. 94.]
[ 76. 79. 83. 89. 56.]
[ 88. NaN 67. 89. 81.]
[ 94. 79. 67. 89. 69.]
[ 88. 79. 58. 72. 63.]
[ 76. 79. 71. 67. 56.]
[ 71. 71. NaN 56. 100.]]
각 행을 한 번에 하나씩 역순으로 정렬하여 행에서 최대 3개의 값을 가져오고 평균을 취하려고 합니다.제가 시도한 코드는 다음과 같습니다.
# nparr is a 2D numpy array
for entry in nparr:
sortedentry = sorted(entry, reverse=True)
highest_3_values = sortedentry[:3]
avg_highest_3 = float(sum(highest_3_values)) / 3
다음을 포함하는 행에는 작동하지 않습니다.NaN
제 질문은, 모든 것을 빠르게 변환할 수 있는 방법이 있는지 여부입니다.NaN
2D numpy 배열에서 0으로 값을 지정하면 정렬 및 기타 작업에 문제가 없습니다.
어디에A
2D 어레이입니다.
import numpy as np
A[np.isnan(A)] = 0
함수isnan
위치를 나타내는 부울 배열을 생성합니다.NaN
값은 입니다.부울 배열을 사용하여 동일한 모양의 배열을 인덱싱할 수 있습니다.마스크처럼 생각해보세요.
이렇게 하면 됩니다.
from numpy import *
a = array([[1, 2, 3], [0, 3, NaN]])
where_are_NaNs = isnan(a)
a[where_are_NaNs] = 0
위의 경우_are_NaNs는 다음과 같습니다.
In [12]: where_are_NaNs
Out[12]:
array([[False, False, False],
[False, False, True]], dtype=bool)
효율성에 대한 보완.아래 예제는 numpy 1.21.2로 실행되었습니다.
>>> aa = np.random.random(1_000_000)
>>> a = np.where(aa < 0.15, np.nan, aa)
>>> %timeit a[np.isnan(a)] = 0
536 µs ± 8.11 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)
>>> a = np.where(aa < 0.15, np.nan, aa)
>>> %timeit np.where(np.isnan(a), 0, a)
2.38 ms ± 27.8 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
>>> a = np.where(aa < 0.15, np.nan, aa)
>>> %timeit np.nan_to_num(a, copy=True)
8.11 ms ± 401 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
>>> a = np.where(aa < 0.15, np.nan, aa)
>>> %timeit np.nan_to_num(a, copy=False)
3.8 ms ± 70.2 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
결과적으로a[np.isnan(a)] = 0
더 빠릅니다.
nan_to_num()은 어떻습니까?
당신이 가지고 있는 곳을 찾는 데 사용할 수 있습니다.NaN
:
import numpy as np
a = np.array([[ 0, 43, 67, 0, 38],
[ 100, 86, 96, 100, 94],
[ 76, 79, 83, 89, 56],
[ 88, np.nan, 67, 89, 81],
[ 94, 79, 67, 89, 69],
[ 88, 79, 58, 72, 63],
[ 76, 79, 71, 67, 56],
[ 71, 71, np.nan, 56, 100]])
b = np.where(np.isnan(a), 0, a)
In [20]: b
Out[20]:
array([[ 0., 43., 67., 0., 38.],
[ 100., 86., 96., 100., 94.],
[ 76., 79., 83., 89., 56.],
[ 88., 0., 67., 89., 81.],
[ 94., 79., 67., 89., 69.],
[ 88., 79., 58., 72., 63.],
[ 76., 79., 71., 67., 56.],
[ 71., 71., 0., 56., 100.]])
드레이크의 답변에 사용할 코드 예제:
>>> import numpy as np
>>> A = np.array([[1, 2, 3], [0, 3, np.NaN]])
>>> A = np.nan_to_num(A)
>>> A
array([[ 1., 2., 3.],
[ 0., 3., 0.]])
numpy.nan_to_num을 사용할 수 있습니다.
numpy.nan_to_num(x) : nan을 0으로, inf를 유한 숫자로 바꿉니다.
예(문서 참조):
>>> np.set_printoptions(precision=8)
>>> x = np.array([np.inf, -np.inf, np.nan, -128, 128])
>>> np.nan_to_num(x)
array([ 1.79769313e+308, -1.79769313e+308, 0.00000000e+000,
-1.28000000e+002, 1.28000000e+002])
nan은 nan과 절대 같지 않습니다.
if z!=z:z=0
그래서 2D 어레이의 경우
for entry in nparr:
if entry!=entry:entry=0
1D 배열의 예와 같이 람다 함수를 사용할 수 있습니다.
import numpy as np
a = [np.nan, 2, 3]
map(lambda v:0 if np.isnan(v) == True else v, a)
그러면 다음과 같은 결과가 표시됩니다.
[0, 2, 3]
모든 항목이 다음과 같이 저장되는 경우, 사용자의 목적을 위해str
사용 중인 대로 정렬된 상태로 사용한 다음 첫 번째 요소를 확인하고 '0'으로 대체합니다.
>>> l1 = ['88','NaN','67','89','81']
>>> n = sorted(l1,reverse=True)
['NaN', '89', '88', '81', '67']
>>> import math
>>> if math.isnan(float(n[0])):
... n[0] = '0'
...
>>> n
['0', '89', '88', '81', '67']
언급URL : https://stackoverflow.com/questions/5124376/convert-nan-value-to-zero
'programing' 카테고리의 다른 글
ID에 대한 보기를 찾을 수 없는 Android 조각? (0) | 2023.07.26 |
---|---|
어레이를 Json으로 변환 (0) | 2023.07.26 |
AppCompat v22.1.0으로 업그레이드되었으며 지금 불법 인수를 받습니다.예외:AppCompat은 현재 테마 기능을 지원하지 않습니다. (0) | 2023.07.26 |
Java 저장 프로시저 대 PL/SQL 저장 프로시저 (0) | 2023.07.21 |
python3에서 OrderedDict를 정규 dict로 변환하는 방법 (0) | 2023.07.21 |