하드웨어 SIMD 벡터 포인터와 해당 유형 간의 캐스트를 재해석하는 것이 C에서 정의되지 않은 동작입니까?
하드웨어 SIMD 벡터 포인터와 해당 유형 간의 재해석 캐스팅이 정의되지 않은 동작인가요?
C에서는 float를 재해석_캐스트하는 것이 허용됩니까? __m256으로 이동하여 액세스 다른 포인터 유형을 통해 객체를 띄우나요?
다음 코드 예제는 이를 보여줍니다.
#include <immintrin.h> constexpr size_t _m256_float_step_sz = sizeof(__m256) / sizeof(float); alignas(__m256) float stack_store[100 * _m256_float_step_sz ]{}; __m256& hwvec1 = *reinterpret_cast<__m256*&>(&stack_store[0 * _m256_float_step_sz]); using arr_t = float[_m256_float_step_sz]; arr_t& arr1 = *reinterpret_cast<float(*)[_m256_float_step_sz]&>(&hwvec1);
hwvec1과 arr1에 정의되지 않은 동작이 있습니까? 엄격한 앨리어싱 규칙([basic.lval]/11)을 위반했습니까? 또는 내장 방식이 하나만 정의되어 있습니까?
__m256 hwvec2 = _mm256_load_ps(&stack_store[0 * _m256_float_step_sz]); _mm256_store_ps(&stack_store[1 * _m256_float_step_sz], hwvec2);
답변:
ISO C는 __m256을 정의하지 않으므로 무엇이 정의되는지 살펴봐야 합니다. 이를 지원하는 구현에 대한 그들의 행동. Intel의 내장 기능은 ISO C에서 char을 별칭으로 정의하는 것과 마찬가지로 __m256과 같은 벡터 포인터를 다른 항목의 별칭으로 허용하도록 정의합니다. (그러나 그 반대는 아닙니다. UB이며 실제로 __m256i에서 int*를 가리키고 참조를 해제하는 것이 중단됩니다.)
그렇습니다. _mm256_load_ps(를 사용하는 대신 __m256을 역참조하는 것이 안전합니다. ) 정렬 부하 고유. 그러나 특히 float/double의 경우 float에서의 캐스팅도 처리하므로 내장 함수를 사용하는 것이 더 쉬운 경우가 많습니다. 정수의 경우 AVX512 로드/저장 내장 함수는 void를 취하는 것으로 정의되지만 AVX2 및 이전 버전에는 (__m256i)&arr[i]와 같은 캐스트가 필요합니다. 이는 꽤 투박한 API 설계이며 이를 사용하여 코드를 복잡하게 만듭니다.
movd/movq와 같은 void를 사용하여 AVX512가 아닌 몇 가지 내장 함수도 추가되었습니다. 로드/저장 정렬 및 _mm_loadu_si32(void)와 같은 앨리어싱 안전 내장 함수. 이전에 Intel은 int를 직접 안전하게 로드해야 하는 _mm_cvtsi32_si128을 사용할 것이라고 가정했습니다. 이는 UB를 피하기 위해 memcpy를 사용하는 것을 의미했습니다(적어도 클래식 ICC 및 MSVC 이외의 컴파일러에서 정렬되지 않은 int*를 허용하고 엄격한 기준을 적용하지 않는 경우). 앨리어싱).
이때가 Intel이 LLVM으로의 마이그레이션을 고려하기 시작한 시기였을 것입니다. ICX/ICPX/OneAPI, 그리고 엄격한 앨리어싱을 시행하는 컴파일러에서 좁은 로드를 처리하는 것이 얼마나 혼란스러운지 깨달았습니다.
위 내용은 하드웨어 SIMD 벡터 포인터와 해당 유형 간의 캐스트를 재해석하는 것이 C에서 정의되지 않은 동작입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

C#과 C의 역사와 진화는 독특하며 미래의 전망도 다릅니다. 1.C는 1983 년 Bjarnestroustrup에 의해 발명되어 객체 지향 프로그래밍을 C 언어에 소개했습니다. Evolution 프로세스에는 자동 키워드 소개 및 Lambda Expressions 소개 C 11, C 20 도입 개념 및 코 루틴과 같은 여러 표준화가 포함되며 향후 성능 및 시스템 수준 프로그래밍에 중점을 둘 것입니다. 2.C#은 2000 년 Microsoft에 의해 출시되었으며 C와 Java의 장점을 결합하여 진화는 단순성과 생산성에 중점을 둡니다. 예를 들어, C#2.0은 제네릭과 C#5.0 도입 된 비동기 프로그래밍을 소개했으며, 이는 향후 개발자의 생산성 및 클라우드 컴퓨팅에 중점을 둘 것입니다.

C# 및 C 및 개발자 경험의 학습 곡선에는 상당한 차이가 있습니다. 1) C#의 학습 곡선은 비교적 평평하며 빠른 개발 및 기업 수준의 응용 프로그램에 적합합니다. 2) C의 학습 곡선은 가파르고 고성능 및 저수준 제어 시나리오에 적합합니다.

C 학습자와 개발자는 StackoverFlow, Reddit의 R/CPP 커뮤니티, Coursera 및 EDX 코스, GitHub의 오픈 소스 프로젝트, 전문 컨설팅 서비스 및 CPPCon에서 리소스와 지원을받을 수 있습니다. 1. StackoverFlow는 기술적 인 질문에 대한 답변을 제공합니다. 2. Reddit의 R/CPP 커뮤니티는 최신 뉴스를 공유합니다. 3. Coursera와 Edx는 공식적인 C 과정을 제공합니다. 4. LLVM 및 부스트 기술 향상과 같은 GitHub의 오픈 소스 프로젝트; 5. JetBrains 및 Perforce와 같은 전문 컨설팅 서비스는 기술 지원을 제공합니다. 6. CPPCON 및 기타 회의는 경력을 돕습니다

C는 XML과 타사 라이브러리 (예 : TinyXML, Pugixml, Xerces-C)와 상호 작용합니다. 1) 라이브러리를 사용하여 XML 파일을 구문 분석하고 C- 처리 가능한 데이터 구조로 변환하십시오. 2) XML을 생성 할 때 C 데이터 구조를 XML 형식으로 변환하십시오. 3) 실제 애플리케이션에서 XML은 종종 구성 파일 및 데이터 교환에 사용되어 개발 효율성을 향상시킵니다.

C는 여전히 현대 프로그래밍과 관련이 있습니다. 1) 고성능 및 직접 하드웨어 작동 기능은 게임 개발, 임베디드 시스템 및 고성능 컴퓨팅 분야에서 첫 번째 선택이됩니다. 2) 스마트 포인터 및 템플릿 프로그래밍과 같은 풍부한 프로그래밍 패러다임 및 현대적인 기능은 유연성과 효율성을 향상시킵니다. 학습 곡선은 가파르지만 강력한 기능은 오늘날의 프로그래밍 생태계에서 여전히 중요합니다.

C의 미래는 병렬 컴퓨팅, 보안, 모듈화 및 AI/기계 학습에 중점을 둘 것입니다. 1) 병렬 컴퓨팅은 코 루틴과 같은 기능을 통해 향상 될 것입니다. 2)보다 엄격한 유형 검사 및 메모리 관리 메커니즘을 통해 보안이 향상 될 것입니다. 3) 변조는 코드 구성 및 편집을 단순화합니다. 4) AI 및 머신 러닝은 C가 수치 컴퓨팅 및 GPU 프로그래밍 지원과 같은 새로운 요구에 적응하도록 촉구합니다.

c is nontdying; it'sevolving.1) c COMINGDUETOITSTIONTIVENICICICICINICE INPERFORMICALEPPLICATION.2) thelugageIscontinuousUllyUpdated, witcentfeatureslikemodulesandCoroutinestoimproveusActionalance.3) despitechallen

C에서 정적 분석의 적용에는 주로 메모리 관리 문제 발견, 코드 로직 오류 확인 및 코드 보안 개선이 포함됩니다. 1) 정적 분석은 메모리 누출, 이중 릴리스 및 초기화되지 않은 포인터와 같은 문제를 식별 할 수 있습니다. 2) 사용하지 않은 변수, 데드 코드 및 논리적 모순을 감지 할 수 있습니다. 3) Coverity와 같은 정적 분석 도구는 버퍼 오버플로, 정수 오버플로 및 안전하지 않은 API 호출을 감지하여 코드 보안을 개선 할 수 있습니다.
