Der Herausgeber von PHP, Xiaoxin, stellt Ihnen heute ein leistungsstarkes Tool vor – OpenTelemetry, das Entwicklern dabei helfen kann, eine einheitliche Bereichsverwaltung in verschiedenen Diensten zu erreichen. In modernen verteilten Systemen bestehen Anwendungen häufig aus mehreren Mikrodiensten, von denen jeder über eigene Protokolle, Metriken und Ablaufverfolgungsinformationen verfügt. OpenTelemetry bietet eine einfache und leistungsstarke Möglichkeit, diese Informationen zu integrieren und zu verwalten, sodass Entwickler die Leistung und das Verhalten des gesamten Systems besser verstehen und debuggen können. Ob in einer lokalen Entwicklungsumgebung oder in einer Produktionsumgebung, OpenTelemetry hilft Entwicklern, ihre Anwendungen besser zu verstehen und zu optimieren.
Ich habe gerade angefangen, Opentelemetry zu verwenden und zwei (Mikro-)Dienste dafür erstellt: Standard und Geomap.
Der Endbenutzer sendet eine Anfrage an den Standard-Dienst, der wiederum eine Anfrage an Geomap sendet, um die Informationen zu erhalten, die wiederum die Ergebnisse an den Endbenutzer zurücksenden. Ich verwende grpc für die gesamte Kommunikation.
Ich habe meine Funktion so instrumentiert:
Für Standards:
type standardservice struct { pb.unimplementedstandardserviceserver } func (s *standardservice) getstandard(ctx context.context, in *pb.getstandardrequest) (*pb.getstandardresponse, error) { conn, _:= createclient(ctx, geomapsvcaddr) defer conn1.close() newctx, span1 := otel.tracer(name).start(ctx, "getstandard") defer span1.end() countryinfo, err := pb.newgeomapserviceclient(conn).getcountry(newctx, &pb.getcountryrequest{ name: in.name, }) //... return &pb.getstandardresponse{ standard: standard, }, nil } func createclient(ctx context.context, svcaddr string) (*grpc.clientconn, error) { return grpc.dialcontext(ctx, svcaddr, grpc.withtransportcredentials(insecure.newcredentials()), grpc.withunaryinterceptor(otelgrpc.unaryclientinterceptor()), ) }
Für Geokarten:
type geomapservice struct { pb.unimplementedgeomapserviceserver } func (s *geomapservice) getcountry(ctx context.context, in *pb.getcountryrequest) (*pb.getcountryresponse, error) { _, span := otel.tracer(name).start(ctx, "getcountry") defer span.end() span.setattributes(attribute.string("country", in.name)) span.addevent("retrieving country info") //... span.addevent("country info retrieved") return &pb.getcountryresponse{ country: &country, }, nil }
Beide Dienste sind so konfiguriert, dass sie ihre Spans an das Jaeger-Backend senden und fast die gleiche Hauptfunktionalität haben (subtile Unterschiede werden in den Kommentaren erwähnt):
const ( name = "mapedia" service = "geomap" //or standard environment = "production" id = 1 ) func tracerProvider(url string) (*tracesdk.TracerProvider, error) { // Create the Jaeger exporter exp, err := jaeger.New(jaeger.WithCollectorEndpoint(jaeger.WithEndpoint(url))) if err != nil { return nil, err } tp := tracesdk.NewTracerProvider( // Always be sure to batch in production. tracesdk.WithBatcher(exp), // Record information about this application in a Resource. tracesdk.WithResource(resource.NewWithAttributes( semconv.SchemaURL, semconv.ServiceName(service), attribute.String("environment", environment), attribute.Int64("ID", id), )), ) return tp, nil } func main() { tp, err := tracerProvider("http://localhost:14268/api/traces") if err != nil { log.Fatal(err) } defer func() { if err := tp.Shutdown(context.Background()); err != nil { log.Fatal(err) } }() otel.SetTracerProvider(tp) listener, err := net.Listen("tcp", ":"+port) if err != nil { panic(err) } s := grpc.NewServer( grpc.UnaryInterceptor(otelgrpc.UnaryServerInterceptor()), ) reflection.Register(s) pb.RegisterGeoMapServiceServer(s, &geomapService{}) // or pb.RegisterStandardServiceServer(s, &standardService{}) if err := s.Serve(listener); err != nil { log.Fatalf("Failed to serve: %v", err) } }
Wenn ich mir die Ablaufverfolgung ansehe, die durch die Anfrage des Endbenutzers an den StandardDienst generiert wurde, kann ich sehen, dass er wie erwartet seinen GeomapDienst aufruft:
Allerdings sehe ich keine Eigenschaften oder Ereignisse, die dem Unterbereich hinzugefügt wurden (ich habe eine Eigenschaft und zwei Ereignisse hinzugefügt, als ich die Funktion getcountry< 的 von geomap< instrumentiert habe).
Allerdings ist mir aufgefallen, dass diese Eigenschaften in einem anderen separaten Trace verfügbar sind (verfügbar unter dem „geomap“-Dienst in Jaeger), dessen Span-IDs völlig unabhängig von den Subspans im Standarddienst sind:
Was ich nun erwarte, ist, eine Ablaufverfolgung zu haben und alle Eigenschaften/Ereignisse im Zusammenhang mit der Geomap in Unterbereichen innerhalb des Standardbereichs anzuzeigen. Wie erhalte ich hier das erwartete Ergebnis?
Der Span-Kontext (der die Trace-ID und die Span-ID enthält, wie in „Dienstinstrumentierung und -begriff “ beschrieben) sollte vom übergeordneten Span an den untergeordneten Span weitergegeben werden, damit sie Teil desselben Trace werden.
Mit Opentelemetry erfolgt dies normalerweise automatisch durch Instrumentierung des Codes mithilfe von Plugins, die für verschiedene Bibliotheken, einschließlich grpc, bereitgestellt werden.
Allerdings scheint die Weitergabe in Ihrem Fall nicht richtig zu funktionieren.
In Ihrem Code hätten Sie getstandard
函数中启动一个新范围,然后在发出 getcountry
请求时使用该上下文 (newctx
)。这是正确的,因为新上下文应该包含父跨度的跨度上下文 (getstandard
).
Aber das Problem könnte mit Ihrer createclient
-Funktion zusammenhängen:
func createclient(ctx context.context, svcaddr string) (*grpc.clientconn, error) { return grpc.dialcontext(ctx, svcaddr, grpc.withtransportcredentials(insecure.newcredentials()), grpc.withunaryinterceptor(otelgrpc.unaryclientinterceptor()), ) }
Sie verwenden otelgrpc.unaryclientinterceptor
richtig. otelgrpc.unaryclientinterceptor
在这里,这应该确保上下文正确传播,但不清楚何时调用此函数。如果在调用 getstandard
函数之前调用它,则用于创建客户端的上下文将不包含来自 getstandard
Dies sollte hier sicherstellen, dass der Kontext korrekt weitergegeben wird, aber es ist nicht klar, wann diese Funktion aufgerufen wird. Wenn es vor dem Aufruf der Funktion
nicht getstandard
den Span-Kontext von
newctx
直接传递给 getcountry
函数来完成此操作,如 getstandard
Stellen Sie zum Testen sicher, dass der Client nach dem Aufruf der Funktion
getcountry
请求的上下文将包括来自 getstandard
Sie können dies tun, indem Sie newctx
direkt an die
-Funktion gezeigt: createclient
和 getcountry
func (s *standardservice) getstandard(ctx context.context, in *pb.getstandardrequest) (*pb.getstandardresponse, error) { newctx, span1 := otel.tracer(name).start(ctx, "getstandard") defer span1.end() conn, _:= createclient(newctx, geomapsvcaddr) defer conn.close() countryinfo, err := pb.newgeomapserviceclient(conn).getcountry(newctx, &pb.getcountryrequest{ name: in.name, }) //... return &pb.getstandardresponse{ standard: standard, }, nil }
-Anfrage verwendet wird, enthält jetzt Span-Kontexte von
und sie sollten als Teil derselben Ablaufverfolgung in Jaeger erscheinen.und Fehler zurückgegeben werden, die der Kürze halber hier nicht angezeigt werden.) a> Außerdem:
Überprüfen Sie auch Ihren Propagator: Stellen Sie sicher, dass Sie in beiden Diensten denselbenKontextpropagatormain
verwenden, vorzugsweise den
Sie können den Propagator explizit wie folgt festlegen:
otel.settextmappropagator(propagation.tracecontext{})
Fügen Sie die obige Zeile am Anfang beider Dienstfunktionen hinzu. getcountry
ctx, span := otel.tracer(name).start(ctx, "getcountry") sc := trace.spancontextfromcontext(ctx) log.printf("trace id: %s, span id: %s", sc.traceid(), sc.spanid()) defer span.end()
并在 getstandard
函数中执行相同的操作:
newCtx, span1 := otel.Tracer(name).Start(ctx, "GetStandard") sc := trace.SpanContextFromContext(newCtx) log.Printf("Trace ID: %s, Span ID: %s", sc.TraceID(), sc.SpanID()) defer span1.End()
如果上下文正确传播,两个服务中的跟踪 id 应该匹配。
Das obige ist der detaillierte Inhalt vonVereinheitlichen Sie den Umfang verschiedener Dienste mithilfe von OpenTelemetry. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!