Das Lesen von Aufsätzen gehört zu unseren täglichen Aufgaben. Es gibt zu viele Aufsätze. Wie können wir sie schnell lesen und zusammenfassen? Seit dem Aufkommen von ChatGPT stehen viele Dienste zum Lesen von Artikeln zur Verfügung. Tatsächlich ist die Verwendung der ChatGPT-API sehr einfach. Wir können unsere eigene Anwendung lokal mit nur 30 Zeilen Python-Code erstellen.
Das Lesen von Aufsätzen gehört zu unseren täglichen Aufgaben. Es gibt zu viele Aufsätze. Wie können wir sie schnell lesen und zusammenfassen? Seit dem Aufkommen von ChatGPT stehen viele Dienste zum Lesen von Artikeln zur Verfügung. Tatsächlich ist die Verwendung der ChatGPT-API sehr einfach. Wir können unsere eigene Anwendung lokal mit nur 30 Zeilen Python-Code erstellen.
Die Schritte zum Zusammenfassen des Papiers mit Python und der ChatGPT-API sind einfach:
für page_num in range(len(pdf_reader.pages)):
page_text = pdf_reader.pages[page_num].extract_text().lower()
Verwenden Sie die API von openai für die Zusammenfassung
Antwort = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[{"role": "system", "content": "Sie sind ein hilfreicher Forschungsassistent."},
{ „role“: „user“, „content“: f „Zusammenfassen: {page_text}“},
], )
page_summary = Response[“choices“][0][“message“][“content“ ]
Zusammenfassung zusammenführen
pdf_summary_text += page_summary + „n“
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], „_summary.txt“)
mit open(pdf_summary_file, „w+“) as Datei:
file.write(pdf_summary_text)
Fertig, schließen Sie die PDF-Datei und recyceln Sie den Speicher
pdf_file.close()
Der vollständige Code lautet wie folgt:
import os
import PyPDF2
import re
import openai
# Hier gehe ich davon aus, dass Sie sich auf einem Jupiter-Notizbuch befinden und das Papier direkt von der URL herunterladen
!curl -o paper.pdf https://arxiv.org/pdf/2301.00810v3.pdf?utm_source=pocket_saves# Stellen Sie die ein Zeichenfolge, die die Zusammenfassung enthält: pdf_summary_text = "" (pdf_file)
# Alle Seiten in der PDF-Datei durchlaufen
für page_num in range(len(pdf_reader.pages)):# Extrahieren Sie den Text aus der Seite
page_text = pdf_reader.pages[page_num].extract_text(). Lower()
response = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "Sie sind ein hilfreicher Forschungsassistent. "},
{"role": "user", "content": f"Zusammenfassen: {page_text}"},
],
)
page_summary = Response["choices"][0]["message"] ["content"]
pdf_summary_text+=page_summary + "n"
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], "_summary.txt")
mit open(pdf_summary_file, "w+") als Datei :
file .write(pdf_summary_text)
pdf_file.close()
mit open(pdf_summary_file, "r") als Datei:
print(file.read())
Es gibt zwei Dinge, die erklärt werden müssen:
1. Das Limit für den kostenlosen API-Aufruf ist begrenzt und kostet etwa 0,2 bis 0,5 US-Dollar, was je nach Länge des Papiers variiert. 2. Ich habe die API von gpt4 nicht getestet Ich habe mich noch nicht dafür beworben, und es hängt vom Preis ab. Es ist zu teuer (20-mal teurer) und ich glaube nicht, dass es sich lohnt, aber Sie können versuchen, die Diagramme des Papiers hochzuladen, um zu sehen, ob dies der Fall ist bessere Ergebnisse (nicht sicher)
Das obige ist der detaillierte Inhalt von30 Zeilen Python-Code können die ChatGPT-API aufrufen, um den Hauptinhalt des Papiers zusammenzufassen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!