총 수만 개의 요소로 구성된 numpy 배열. 이제 각 요소 앞에 숫자 000001 등을 유지하고 중복된 항목을 제거하고 고유한 숫자만 남기고 싶습니다. 결과는 ['000001','000002','000003','000004']for 문을 사용하는 것 외에 더 효율적인 방법이 있습니까?
['000001','000002','000003','000004']
ringa_lee
NumPy를 쓰자~
파이썬3
다음과 같이 작성할 수도 있습니다. np.frompyfunc'|S6'는 문자열을 6바이트에 저장하는 것입니다
np.frompyfunc
'|S6'
'<U6'是以6个小端序Unicode字符문자열 저장
'<U6'
小端序Unicode字符
두 형제의 글쓰기 방식을 바탕으로@agree 및 @xiaojieluoff 수락
숫자 길이가 처음 6자리로 고정된 경우 아래 첫 번째 숫자를 쓰는 것이 가장 빠르게 작성됩니다
지도 및 익명 기능 사용
출력:
다음 코드를 실행하면 6백만 개의 데이터로 지도가
테스트 데이터를 6천만개로 확대하면 격차는 더욱 벌어질 것입니다
NumPy를 쓰자~
파이썬3
으아악다음과 같이 작성할 수도 있습니다.
np.frompyfunc
'|S6'
는 문자열을 6바이트에 저장하는 것입니다
으아악'<U6'
是以6个小端序Unicode字符
문자열 저장두 형제의 글쓰기 방식을 바탕으로
@agree 및 @xiaojieluoff 수락
숫자 길이가 처음 6자리로 고정된 경우 아래 첫 번째 숫자를 쓰는 것이 가장 빠르게 작성됩니다
으아악지도 및 익명 기능 사용
으아악출력:
으아악다음 코드를 실행하면 6백만 개의 데이터로 지도가
보다 약 0.6초 더 빠른 것을 확인할 수 있습니다. 으아악출력:
으아악테스트 데이터를 6천만개로 확대하면 격차는 더욱 벌어질 것입니다
으아악