首页 后端开发 Python教程 如何使用 python 连接到 AWS OpenSearch 或 Elasticsearch 集群

如何使用 python 连接到 AWS OpenSearch 或 Elasticsearch 集群

Dec 20, 2024 pm 08:49 PM

How to connect to AWS OpenSearch or Elasticsearch clusters using python

使用 Python 连接到在 AWS 中运行的 OpenSearch (ES) 服务非常痛苦。我在网上找到的大多数示例要么不起作用,要么已经过时,让我不断修复相同的问题。为了节省时间和减少挫败感,这里提供了截至 2024 年 12 月最新的工作代码片段集合。

  • 使用 opensearch-py 库 (OpenSearch ElasticSearch) 连接
  • 使用elasticsearch库连接(仅限ElasticSearch)
    • elasticsearch >= 8
    • 弹性搜索

使用 opensearch-py 库 (OpenSearch ElasticSearch) 连接

这是我连接到 AWS 管理的 ES 实例的首选方式。它适用于 ElasticSearch 和 OpenSearch 集群,并且身份验证可以利用 AWS 配置文件。

安装 opensearch-py 和 boto3(用于身份验证):

pip install opensearch-py boto3
登录后复制
登录后复制

在撰写本文时,这将安装 opensearch-py==2.8.0 和 boto3==1.35.81。

现在,您可以使用以下命令创建客户端:

import boto3

from opensearchpy import (
    AWSV4SignerAuth,
    OpenSearch,
    RequestsHttpConnection,
)

es_host = "search-my-aws-esdomain-5k2baneoyj4vywjseocultv2au.eu-central-1.es.amazonaws.com"
aws_access_key = "AKIAXCUEGTAF3CV7GYKA"
aws_secret_key = "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"
region = "eu-central-1"

# Note: you can also use boto3.Session(profile_name="my-profile") or other ways
session = boto3.Session(
    aws_access_key_id=aws_access_key,
    aws_secret_access_key=aws_secret_key,
    region_name=region,
)

client = OpenSearch(
    hosts=[{"host": es_host, "port": 443}],
    http_auth=AWSV4SignerAuth(session.get_credentials(), region, "es"),
    connection_class=RequestsHttpConnection,
    use_ssl=True,
)
登录后复制
登录后复制

请注意,boto3.Session 支持多种创建会话的方式:使用配置文件、环境变量等。我让你看看!

获得后,请使用以下命令检查连接:

client.ping() # should return True
client.info() # use this to get a proper error message if ping fails
登录后复制

检查索引:

# List all indices
client.cat.indices()
client.indices.get("*")

# Check the existence of an indice
client.indices.exists("my-index")
登录后复制

使用elasticsearch库连接(仅限ElasticSearch)

?这仅适用于 ElasticSearch 集群!连接到 OpenSearch 集群会引发

UnsupportedProductError:客户端注意到服务器不是 Elasticsearch,我们不支持此未知产品

弹性搜索>= 8

大多数代码片段仍然引用 RequestsHttpConnection,该类已在 elasticsearch 8.X 中删除。如果您在谷歌上搜索错误无法从“elasticsearch”导入名称“RequestsHttpConnection”,那么您来对地方了!

安装elasticsearch(这也应该安装elastic-transport)和requests_aws4auth。后者根据请求需要处理 AWS 的身份验证:

pip install elasticsearch requests-aws4auth
登录后复制

在撰写本文时,这将安装 elastic-transport==8.15.1、elasticsearch==8.17.0 和 requests-aws4auth==1.3.1。

现在,您可以使用以下命令创建客户端:

from elastic_transport import RequestsHttpNode
from elasticsearch import Elasticsearch
from requests_aws4auth import AWS4Auth

es_endpoint = "search-my-aws-esdomain-5k2baneoyj4vywjseocultv2au.eu-central-1.es.amazonaws.com"
aws_access_key = "AKIAXCUEGTAF3CV7GYKA"
aws_secret_key = "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"
region = "eu-central-1"

es = Elasticsearch(
    f"https://{es_host}",
    http_auth=AWS4Auth(
        aws_access_key, 
        aws_secret_key, 
        region,
        "es",
    ),
    verify_certs=True,
    node_class=RequestsHttpNode,
)
登录后复制

获得后,请使用以下命令检查连接:

es.ping() # should return True
es.info() # use this to get a proper error message if ping fails
登录后复制

弹性搜索

如果您仍在使用旧版本的elasticsearch:

pip install "elasticsearch<8" requests-aws4auth
登录后复制

当前elasticsearch==7.17.12,requests-aws4auth==1.3.1。

现在,您可以使用以下命令创建客户端:

pip install opensearch-py boto3
登录后复制
登录后复制

检查连接:

import boto3

from opensearchpy import (
    AWSV4SignerAuth,
    OpenSearch,
    RequestsHttpConnection,
)

es_host = "search-my-aws-esdomain-5k2baneoyj4vywjseocultv2au.eu-central-1.es.amazonaws.com"
aws_access_key = "AKIAXCUEGTAF3CV7GYKA"
aws_secret_key = "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"
region = "eu-central-1"

# Note: you can also use boto3.Session(profile_name="my-profile") or other ways
session = boto3.Session(
    aws_access_key_id=aws_access_key,
    aws_secret_access_key=aws_secret_key,
    region_name=region,
)

client = OpenSearch(
    hosts=[{"host": es_host, "port": 443}],
    http_auth=AWSV4SignerAuth(session.get_credentials(), region, "es"),
    connection_class=RequestsHttpConnection,
    use_ssl=True,
)
登录后复制
登录后复制

以上是如何使用 python 连接到 AWS OpenSearch 或 Elasticsearch 集群的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

如何在使用 Fiddler Everywhere 进行中间人读取时避免被浏览器检测到? 如何在使用 Fiddler Everywhere 进行中间人读取时避免被浏览器检测到? Apr 02, 2025 am 07:15 AM

使用FiddlerEverywhere进行中间人读取时如何避免被检测到当你使用FiddlerEverywhere...

在Linux终端中使用python --version命令时如何解决权限问题? 在Linux终端中使用python --version命令时如何解决权限问题? Apr 02, 2025 am 06:36 AM

Linux终端中使用python...

如何在10小时内通过项目和问题驱动的方式教计算机小白编程基础? 如何在10小时内通过项目和问题驱动的方式教计算机小白编程基础? Apr 02, 2025 am 07:18 AM

如何在10小时内教计算机小白编程基础?如果你只有10个小时来教计算机小白一些编程知识,你会选择教些什么�...

如何绕过Investing.com的反爬虫机制获取新闻数据? 如何绕过Investing.com的反爬虫机制获取新闻数据? Apr 02, 2025 am 07:03 AM

攻克Investing.com的反爬虫策略许多人尝试爬取Investing.com(https://cn.investing.com/news/latest-news)的新闻数据时,常常�...

Python 3.6加载pickle文件报错ModuleNotFoundError: No module named '__builtin__'怎么办? Python 3.6加载pickle文件报错ModuleNotFoundError: No module named '__builtin__'怎么办? Apr 02, 2025 am 06:27 AM

Python3.6环境下加载pickle文件报错:ModuleNotFoundError:Nomodulenamed...

使用Scapy爬虫时,管道文件无法写入的原因是什么? 使用Scapy爬虫时,管道文件无法写入的原因是什么? Apr 02, 2025 am 06:45 AM

使用Scapy爬虫时管道文件无法写入的原因探讨在学习和使用Scapy爬虫进行数据持久化存储时,可能会遇到管道文�...

See all articles