d[IA]gnosis: Healt용 IRIS를 사용하여 RAG 애플리케이션 개발
IRIS에 벡터 데이터 유형과 벡터 검색 기능이 도입되면서 애플리케이션 개발에 대한 가능성이 무궁무진해졌습니다. 이러한 애플리케이션의 예는 제가 최근 공개 콘테스트에서 공개한 것을 본 것입니다. 발렌시아 보건부는 AI 모델을 사용하여 ICD-10 코딩을 지원하는 도구를 요청했습니다.
요청한 것과 유사한 애플리케이션을 어떻게 구현할 수 있습니까? 무엇이 필요한지 살펴보겠습니다.
- 일반 텍스트 내에서 진단을 검색하기 위해 RAG 애플리케이션의 컨텍스트로 사용할 ICD-10 코드 목록입니다.
- ICD-10 코드에서 동등성을 찾을 텍스트를 벡터화하는 훈련된 모델입니다.
- ICD-10 코드 및 텍스트의 수집 및 벡터화에 필요한 Python 라이브러리입니다.
- 가능한 진단을 찾는 텍스트를 지원하는 친숙한 프런트 엔드.
- 프런트엔드에서 받은 요청을 조정합니다.
위 요구사항을 충족하기 위해 IRIS는 무엇을 제공하나요?
- RecordMapper 기능을 사용하거나 Embedded Python을 사용하여 직접 CSV 가져오기
- Embedded Python을 사용하면 선택한 모델을 사용하여 벡터를 생성하는 데 필요한 Python 코드를 구현할 수 있습니다.
- 프런트엔드 애플리케이션에서 호출될 REST API를 게시합니다.
- IRIS 내에서 정보를 추적할 수 있는 상호 운용성 프로덕션.
개발된 예제만 보면 됩니다.
d[IA]그노시스
이 기사와 관련하여 개발된 애플리케이션에 액세스할 수 있으며, 다음 기사에서는 모델 사용, 벡터 저장, 벡터 검색 사용 등 각 기능을 구현하는 방법을 자세히 살펴보겠습니다. .
지원서를 검토해 보겠습니다.
ICD-10 코드 가져오기
구성 화면에는 CSV 파일이 가져올 ICD-10 코드를 준수해야 한다는 형식이 표시됩니다. 로딩 및 벡터화 프로세스는 많은 시간과 리소스를 소비하므로 Docker 컨테이너 배포에서는 Docker가 사용할 수 있는 RAM 메모리뿐 아니라 요구 사항이 할당된 RAM을 초과하는 경우를 대비해 디스크 메모리도 구성합니다.
# iris iris: init: true container_name: iris build: context: . dockerfile: iris/Dockerfile ports: - 52774:52773 - 51774:1972 volumes: - ./shared:/shared environment: - ISC_DATA_DIRECTORY=/shared/durable command: --check-caps false --ISCAgent false mem_limit: 30G memswap_limit: 32G
ICD-10 코드가 포함된 파일은 프로젝트 경로 /shared/cie10/icd10.csv에서 사용할 수 있으며, 100%에 도달하면 애플리케이션을 사용할 수 있습니다.
우리 애플리케이션에서는 진단 코딩을 위한 두 가지 기능을 정의했습니다. 하나는 시스템에서 수신된 HL7 메시지를 기반으로 하고 다른 하나는 일반 텍스트를 기반으로 합니다.
HL7의 진단 캡처
프로젝트에는 테스트용으로 준비된 일부 HL7 메시지가 포함되어 있습니다. /shared/hl7/messagesa01_en.hl7 파일을 /shared/HL7In 폴더에 복사하고 관련 생산업체는 진단을 추출하여 웹 애플리케이션에 표시할 책임이 있습니다.
진단 요청 화면에서는 HL7 메시지를 통해 받은 모든 진단을 볼 수 있습니다. ICD-10으로 코딩하려면 돋보기를 클릭하기만 하면 받은 진단과 가장 가까운 ICD-10 코드 목록이 표시됩니다.
선택하면 목록에 진단 및 관련 ICD-10 코드가 표시됩니다. 봉투 아이콘이 있는 버튼을 클릭하면 원본을 사용하고 진단 세그먼트 내에서 선택한 새 메시지를 포함하는 메시지가 생성됩니다.
MSH|^~\&|HIS|HULP|EMPI||||ADT^A08|592956|P|2.5.1 EVN|A01| PID|||1556655212^^^SERMAS^SN~922210^^^HULP^PI||GARCÍA PÉREZ^JUAN^^^||20150403|M|||PASEO PEDRO ÁLVAREZ 195 1 CENTRO^^LEGANÉS^MADRID^28379^SPAIN||555283055^PRN^^JUAN.GARCIA@YAHOO.COM|||||||||||||||||N| PV1||N DG1|1||O10.91^Unspecified pre-existing hypertension complicating pregnancy^CIE10-ES|Gestational hypertension||A||
이 메시지는 /shared/HL7Out
경로에서 확인할 수 있습니다.일반 텍스트 진단 스크린샷
텍스트 분석기 옵션에서 사용자는 분석 프로세스가 수행될 일반 텍스트를 포함할 수 있습니다. 애플리케이션은 3개의 표제어로 구성된 단어 튜플을 검색합니다(관사, 대명사 및 관련성이 낮은 기타 단어 제거). 분석이 완료되면 시스템은 관련 밑줄이 그어진 텍스트와 가능한 진단 위치를 표시합니다:
분석이 완료되면 분석 내역에서 언제든지 확인할 수 있습니다.
분석 내역
수행된 모든 분석은 기록되고 언제든지 참조할 수 있으며 사용 가능한 모든 ICD-10 코드를 볼 수 있습니다.
다음 글에서...
Embedded Python을 사용하여 컨텍스트와 자유 텍스트로 사용할 ICD-10 코드의 벡터화를 위해 특정 LLM 모델을 사용하는 방법을 살펴보겠습니다.
질문이나 제안사항이 있으시면 언제든지 기사에 댓글을 남겨주세요.
위 내용은 d[IA]gnosis: Healt용 IRIS를 사용하여 RAG 애플리케이션 개발의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

Python은 데이터 과학, 웹 개발 및 자동화 작업에 적합한 반면 C는 시스템 프로그래밍, 게임 개발 및 임베디드 시스템에 적합합니다. Python은 단순성과 강력한 생태계로 유명하며 C는 고성능 및 기본 제어 기능으로 유명합니다.

Python은 게임 및 GUI 개발에서 탁월합니다. 1) 게임 개발은 Pygame을 사용하여 드로잉, 오디오 및 기타 기능을 제공하며 2D 게임을 만드는 데 적합합니다. 2) GUI 개발은 Tkinter 또는 PYQT를 선택할 수 있습니다. Tkinter는 간단하고 사용하기 쉽고 PYQT는 풍부한 기능을 가지고 있으며 전문 개발에 적합합니다.

2 시간 이내에 파이썬의 기본 사항을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우십시오. 이를 통해 간단한 파이썬 프로그램 작성을 시작하는 데 도움이됩니다.

2 시간 이내에 Python의 기본 프로그래밍 개념과 기술을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우기, 2. 마스터 제어 흐름 (조건부 명세서 및 루프), 3. 기능의 정의 및 사용을 이해하십시오. 4. 간단한 예제 및 코드 스 니펫을 통해 Python 프로그래밍을 신속하게 시작하십시오.

Python은 배우고 사용하기 쉽고 C는 더 강력하지만 복잡합니다. 1. Python Syntax는 간결하며 초보자에게 적합합니다. 동적 타이핑 및 자동 메모리 관리를 사용하면 사용하기 쉽지만 런타임 오류가 발생할 수 있습니다. 2.C는 고성능 응용 프로그램에 적합한 저수준 제어 및 고급 기능을 제공하지만 학습 임계 값이 높고 수동 메모리 및 유형 안전 관리가 필요합니다.

Python은 웹 개발, 데이터 과학, 기계 학습, 자동화 및 스크립팅 분야에서 널리 사용됩니다. 1) 웹 개발에서 Django 및 Flask 프레임 워크는 개발 프로세스를 단순화합니다. 2) 데이터 과학 및 기계 학습 분야에서 Numpy, Pandas, Scikit-Learn 및 Tensorflow 라이브러리는 강력한 지원을 제공합니다. 3) 자동화 및 스크립팅 측면에서 Python은 자동화 된 테스트 및 시스템 관리와 같은 작업에 적합합니다.

제한된 시간에 Python 학습 효율을 극대화하려면 Python의 DateTime, Time 및 Schedule 모듈을 사용할 수 있습니다. 1. DateTime 모듈은 학습 시간을 기록하고 계획하는 데 사용됩니다. 2. 시간 모듈은 학습과 휴식 시간을 설정하는 데 도움이됩니다. 3. 일정 모듈은 주간 학습 작업을 자동으로 배열합니다.

Python은 개발 효율에서 C보다 낫지 만 C는 실행 성능이 높습니다. 1. Python의 간결한 구문 및 풍부한 라이브러리는 개발 효율성을 향상시킵니다. 2.C의 컴파일 유형 특성 및 하드웨어 제어는 실행 성능을 향상시킵니다. 선택할 때는 프로젝트 요구에 따라 개발 속도 및 실행 효율성을 평가해야합니다.
