지식 그래프로 해리포터의 세계 탐색하기
목표
해리포터 세계에 관한 모든 것을 손끝에서 보고 싶은 해리포터 팬이신가요? 아니면 단순히 해리포터의 다양한 캐릭터가 어떻게 결합되는지에 대한 멋진 차트로 친구들에게 깊은 인상을 남기고 싶으신가요? 지식 그래프만 보면 됩니다.
이 가이드는 노트북과 좋아하는 책만으로 Neo4J에서 지식 그래프를 얻는 방법을 보여줍니다.
지식그래프란 무엇인가
Wikipedia에 따르면:
지식 그래프는 그래프 구조의 데이터 모델이나 토폴로지를 이용해 데이터를 표현하고 연산하는 지식 베이스입니다.
뭐가 필요하세요
하드웨어 측면에서 필요한 것은 컴퓨터뿐입니다. 가급적 Nvidia 그래픽 카드가 장착된 컴퓨터가 좋습니다. 완전히 자급자족하기 위해 로컬 LLM 설정을 사용하겠지만 동일한 목적으로 OpenAI API를 쉽게 사용할 수도 있습니다.
설정 단계
다음이 필요합니다:
- Ollama와 여러분이 가장 좋아하는 LLM 모델
- 파이썬 환경
- Neo4J
올라마
WSL2에서 Ubuntu 24.04로 코딩하면서 GPU 작업 부하를 쉽게 통과시키기 위해 Ollama docker를 사용하고 있습니다. Ollama를 Docker 컨테이너로 실행하는 것은 먼저 Nvidia 컨테이너 툴킷을 설치한 후 다음을 수행하는 것만큼 간단합니다.
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
Nvidia GPU가 없는 경우 CLI에서 다음 명령을 사용하여 CPU 전용 Ollama를 실행할 수 있습니다.
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
완료되면 좋아하는 LLM 모델을 Ollama로 가져올 수 있습니다. Ollama에서 사용 가능한 모델 목록은 여기에서 확인하세요. 예를 들어 qwen2.5를 가져오려면 CLI에서 다음 명령을 실행할 수 있습니다.
docker exec -it ollama ollama run qwen2.5
Ollama가 끝났습니다!
Python 환경
먼저 Python 가상 환경을 생성하여 설치한 패키지나 구성 변경 사항을 전역적으로 적용하는 대신 환경 내에서만 제한하도록 할 것입니다. 다음 명령은 가상 환경 harry-potter-rag를 생성합니다:
python -m venv harry-potter-rag
그런 다음 다음 명령을 사용하여 가상 환경을 활성화할 수 있습니다.
source tutorial-env/bin/activate
다음으로 pip를 사용하여 주로 LangChain에서 관련 패키지를 설치합니다.
%pip install --upgrade --quiet langchain langchain-community langchain-openai langchain-experimental neo4j
Neo4J 설정
Neo4J를 도커 컨테이너로 설정하겠습니다. 특정 구성을 쉽게 설정할 수 있도록 docker compose를 사용합니다. 다음을 docker-compose.yaml이라는 파일에 복사한 다음 동일한 디렉터리에서 docker-compose up -d를 실행하여 Neo4J를 설정할 수 있습니다.
이 설정은 또한 데이터, 로그 및 플러그인이 로컬 폴더(예: /data)에 유지되도록 보장합니다. /로그 및 플러그인.
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
지식 그래프 구축
이제 Jupyter Notebook에서 지식 그래프 구축을 시작할 수 있습니다! 먼저 다음을 사용하여 Ollama LLM 인스턴스를 설정했습니다.
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
다음으로 LLM을 Neo4J에 연결합니다.
docker exec -it ollama ollama run qwen2.5
이제 좋아하는 해리포터 텍스트나 좋아하는 책을 선택하고 LangChain을 사용하여 텍스트를 덩어리로 분할할 차례입니다. 청킹은 긴 텍스트를 여러 부분으로 나누는 전략이며, 그런 다음 각 부분을 LLM으로 보내 이를 노드와 에지로 변환하고 각 청크의 노드와 에지를 Neo4J에 삽입할 수 있습니다. 간단한 입문서입니다. 노드는 그래프에 표시되는 원이며 각 가장자리는 두 개의 노드를 함께 연결합니다.
코드는 청크가 어떻게 생겼는지 빠르게 미리 볼 수 있도록 첫 번째 청크도 인쇄합니다.
python -m venv harry-potter-rag
이제 GPU가 무거운 작업을 수행하고 텍스트를 지식 그래프로 변환할 때입니다! 책 전체를 자세히 살펴보기 전에 LLM이 원하는 방식으로 그래프를 반환하도록 더 나은 안내를 제공하는 프롬프트를 실험해 보겠습니다.
프롬프트는 기본적으로 우리가 기대하는 것의 예이거나 응답에 표시하려는 내용에 대한 지침입니다. 지식 그래프의 맥락에서 우리는 LLM에게 사람과 조직만 노드로 추출하고 엔터티가 제공된 특정 유형의 관계만 허용하도록 지시할 수 있습니다. 예를 들어, 배우자 관계는 개인과 조직 사이가 아닌 개인과 개인 사이에서만 이루어지도록 허용할 수 있습니다.
이제 첫 번째 텍스트 덩어리에 LLMGraphTransformer를 사용하여 그래프가 어떻게 나타나는지 확인할 수 있습니다. 결과가 마음에 들 때까지 프롬프트를 조정할 수 있는 좋은 기회입니다.
다음 예에서는 개인 또는 조직이 될 수 있는 노드를 예상하며 allowed_relationships는 허용되는 관계 유형을 지정합니다. LLM이 원본 텍스트의 다양성을 캡처할 수 있도록 strict_mode도 False로 설정하여 아래에 정의되지 않은 다른 관계나 엔터티도 캡처할 수 있습니다. 대신 strict_mode를 True로 설정하면 허용되는 항목을 준수하지 않는 엔터티 및 관계가 삭제되거나 허용되는 항목으로 강제 실행될 수 있습니다(정확하지 않을 수 있음).
source tutorial-env/bin/activate
프롬프트를 미세 조정한 후 만족스러우면 이제 지식 정보를 수집할 차례입니다. try - Except는 Neo4J에 제대로 삽입될 수 없는 모든 응답을 명시적으로 처리하는 것입니다. 코드는 모든 오류가 기록되도록 설계되었지만 후속 청크를 그래프로 변환하면서 루프가 계속 진행되는 것을 차단하지 않습니다. 🎜>
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
위 루프에서는 해리포터와 마법사의 돌, 해리포터와 비밀의 방, 해리포터와 아즈카반의 죄수를 섭취하는 데 약 46분이 걸렸습니다. 결국 4868개의 고유 노드가 생겼습니다! 아래에서 빠른 미리보기를 볼 수 있습니다. 그래프가 정말 붐비고, 누가 누구와 어떤 방식으로 관련되어 있는지 구분하기 어려운 것을 볼 수 있습니다.
이제 암호 쿼리를 활용하여 Dumbledore를 살펴볼 수 있습니다!
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
자, 이제 덤블도어 본인만 알겠습니다. 해리포터와 어떤 연관이 있는지 알아보겠습니다.
docker exec -it ollama ollama run qwen2.5
자, 이제 우리는 해리와 덤블도어가 말한 내용에 관심이 있습니다.
python -m venv harry-potter-rag
우리가 찾고 있는 것을 실제로 찾기 위해 거쳐야 할 문서가 많아 그래프가 여전히 매우 혼란스럽다는 것을 알 수 있습니다. 문서를 노드로 모델링하는 것이 이상적이지 않다는 것을 알 수 있으며 그래프를 보다 직관적으로 사용하기 위해 LLMGraphTransformer에서 추가 작업을 수행할 수 있습니다.
결론
인터넷에 연결하지 않고도 로컬 컴퓨터에 지식 정보를 설정하는 것이 얼마나 쉬운지 확인할 수 있습니다.
해리포터 세계의 전체 지식 그래프도 포함하고 있는 github 저장소는 여기에서 확인하실 수 있습니다.
추신
harry_potter.graphml 파일을 Neo4J로 가져오려면 graphml 파일을 neo4j /import 폴더에 복사하고 Neo4J 브라우저에서 다음을 실행하세요.
source tutorial-env/bin/activate
위 내용은 지식 그래프로 해리포터의 세계 탐색하기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Linux 터미널에서 Python 버전을 보려고 할 때 Linux 터미널에서 Python 버전을 볼 때 권한 문제에 대한 솔루션 ... Python을 입력하십시오 ...

Python의 Pandas 라이브러리를 사용할 때는 구조가 다른 두 데이터 프레임 사이에서 전체 열을 복사하는 방법이 일반적인 문제입니다. 두 개의 dats가 있다고 가정 해

파이썬에서 문자열을 통해 객체를 동적으로 생성하고 메소드를 호출하는 방법은 무엇입니까? 특히 구성 또는 실행 해야하는 경우 일반적인 프로그래밍 요구 사항입니다.

Uvicorn은 HTTP 요청을 어떻게 지속적으로 듣습니까? Uvicorn은 ASGI를 기반으로 한 가벼운 웹 서버입니다. 핵심 기능 중 하나는 HTTP 요청을 듣고 진행하는 것입니다 ...

10 시간 이내에 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법은 무엇입니까? 컴퓨터 초보자에게 프로그래밍 지식을 가르치는 데 10 시간 밖에 걸리지 않는다면 무엇을 가르치기로 선택 하시겠습니까?

이 기사는 Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask 및 요청과 같은 인기있는 Python 라이브러리에 대해 설명하고 과학 컴퓨팅, 데이터 분석, 시각화, 기계 학습, 웹 개발 및 H에서의 사용에 대해 자세히 설명합니다.

Fiddlerevery Where를 사용할 때 Man-in-the-Middle Reading에 Fiddlereverywhere를 사용할 때 감지되는 방법 ...
