Python が ES を操作する方法とデータを Mysql と同期する方法-mysql チュートリアル-php.cn

Python で Elasticsearch を運用する 2 つの方法

Mysql と Elasticsearch でデータを同期する

haystack の使用

ホームページ

データベース

mysql チュートリアル

Python が ES を操作する方法とデータを Mysql と同期する方法

王林

Jun 01, 2023 pm 09:49 PM

mysql python es

Python で Elasticsearch を運用する 2 つの方法

# 官方提供的：Elasticsearch
# pip install elasticsearch
# GUI：pyhon能做图形化界面编程吗？
	-Tkinter
  -pyqt
# 使用（查询是重点）
# pip3 install elasticsearch
https://github.com/elastic/elasticsearch-py
from elasticsearch import Elasticsearch
obj = Elasticsearch([&#39;127.0.0.1:9200&#39;,&#39;192.168.1.1:9200&#39;,&#39;192.168.1.2:9200&#39;],)
# 创建索引（Index）
# body:用来干什么？mapping：{},setting:{}
# result = obj.indices.create(index=&#39;user&#39;,ignore=400)
# print(result)
# 删除索引
# result = obj.indices.delete(index=&#39;user&#39;, ignore=[400, 404])
# 插入和查询数据（文档的增删查改），是最重要
# 插入数据
# POST news/politics/1
# {&#39;userid&#39;: &#39;1&#39;, &#39;username&#39;: &#39;lqz&#39;,&#39;password&#39;:&#39;123&#39;}
# data = {&#39;userid&#39;: &#39;1&#39;, &#39;username&#39;: &#39;lqz&#39;,&#39;password&#39;:&#39;123&#39;}
# result = obj.create(index=&#39;news&#39;, doc_type=&#39;politics&#39;, id=1, body=data)
# print(result)
# 更新数据
&#39;&#39;&#39;
不用doc包裹会报错
ActionRequestValidationException[Validation Failed: 1: script or doc is missing
&#39;&#39;&#39;
# data ={&#39;doc&#39;:{&#39;userid&#39;: &#39;1&#39;, &#39;username&#39;: &#39;lqz&#39;,&#39;password&#39;:&#39;123ee&#39;,&#39;test&#39;:&#39;test&#39;}}
# result = obj.update(index=&#39;news&#39;, doc_type=&#39;politics&#39;, body=data, id=1)
# print(result)
# 删除数据
# result = obj.delete(index=&#39;news&#39;, doc_type=&#39;politics&#39;, id=1)
# 查询
# 查找所有文档
# query = {&#39;query&#39;: {&#39;match_all&#39;: {}}}
#  查找名字叫做jack的所有文档
# query = {&#39;query&#39;: {&#39;match&#39;: {&#39;desc&#39;: &#39;娇憨可爱&#39;}}}
# query = {&#39;query&#39;: {&#39;term&#39;: {&#39;from&#39;: &#39;sheng&#39;}}}
query = {&#39;query&#39;: {&#39;term&#39;: {&#39;name&#39;: &#39;娘子&#39;}}}
# term和match的区别
# term是短语查询，不会对term的东西进行分词
# match 会多match的东西进行分词，再去查询
# 查找年龄大于11的所有文档
# allDoc = obj.search(index=&#39;lqz&#39;, doc_type=&#39;doc&#39;, body=query)
allDoc = obj.search(index=&#39;lqz&#39;, doc_type=&#39;doc&#39;, body=query)
print(allDoc)
import json
print(json.dumps(allDoc))
# print(allDoc[&#39;hits&#39;][&#39;hits&#39;][0][&#39;_source&#39;])
# 如何集成到django项目中：创建索引，提前创建好就行了
# 插入数据，查询数据，修改数据
# query = {&#39;query&#39;: {&#39;term&#39;: {&#39;name&#39;: &#39;娘子&#39;}}}
# allDoc = obj.search(index=&#39;lqz&#39;, doc_type=&#39;doc&#39;, body=query)
# json格式直接返回
# saas ：软件即服务，不是用人家服务，而是写服务给别人用----》正常的开发
# 舆情监测系统：（爬虫）
# 只监控微博---》宜家：微博，百度贴吧，上市公司
# 公安：负面的，---》追踪到哪个用户发的---》找上门了
# qq群，微信群----》舆情监控（第三方做不了，腾讯出的舆情监控，第三方机构跟腾讯合作，腾讯提供接口，第三方公司做）
# 平台开发出来，别人买服务---》买一年的微博关键字监控

ログイン後にコピー

ERP: コーポレートファイナンス、サプライチェーン

大企業 Kingdee、UFIDA がソフトウェアを開発しました---->>御社そのもの購入するサーバー ---》ソフトウェアはサーバー上で実行されます
saas モデル: 会社がサービスを購入し、10 年間のサービスを提供します--->> アカウントとパスワード --->> ログインすると操作可能になります --->>問題があります。UFIDA に連絡してください --->>サーバーは他人の場所にあります--->>政府クラウド、さまざまなクラウド---すべてのものはクラウドに行きます

---政府がお金を使っているもの購入する---》UFIDAはあえてリークするつもりですか？
---将来のクラウドコンピューティング--->> インターネットにのみアクセス可能--->> コンピュータのコンピューティング能力には限界があります--->> クラウド上でサービスを購入--->> コンピューティング 1. 。。 100 ---》コンピューティングサービスを購入して結果を直接取得する

# 第二种使用方式
# https://github.com/elastic/elasticsearch-dsl-py
# pip3 install elasticsearch-dsl
from datetime import datetime
from elasticsearch_dsl import Document, Date, Nested, Boolean,analyzer, InnerDoc, Completion, Keyword, Text,Integer
from elasticsearch_dsl.connections import connections
connections.create_connection(hosts=["localhost"])
class Article(Document):
    title = Text(analyzer=&#39;ik_max_word&#39;, search_analyzer="ik_max_word", fields={&#39;title&#39;: Keyword()})
    author = Text()
    class Index:
        name = &#39;myindex&#39;  # 索引名
    def save(self, ** kwargs):
        return super(Article, self).save(** kwargs)
if __name__ == &#39;__main__&#39;:
    # Article.init()  # 创建映射
    # 保存数据
    # article = Article()
    # article.title = "测试数据"
    # article.author = "egon"
    # article.save()  # 数据就保存了
    #查询数据
    # s=Article.search()
    # s = s.filter(&#39;match&#39;, title="测试")
    # results = s.execute()
    # # 类比queryset对象，列表中一个个对象
    # # es中叫Response，当成一个列表，列表中放一个个对象
    # print(results)
    #删除数据
    # s = Article.search()
    # s = s.filter(&#39;match&#39;, title="测试").delete()
    #修改数据
    s = Article().search()
    s = s.filter(&#39;match&#39;, title="测试")
    results = s.execute()
    print(results[0])
    results[0].title="xxx"
    results[0].save()
    # 其他操作，参见文档

ログイン後にコピー

Mysql と Elasticsearch でデータを同期する

# 只要article表插入一条数据，就自动同步到es中
# 第一种方案：
	-每当aritcle表插入一条数据（视图类中，Article.objects.create()，update）
  -往es中插入一条
  -缺陷：代码耦合度高，改好多地方
# 第二种方案：
	-重写create方法，重写update方法
  -缺陷：同步操作---》es中插入必须返回结果才能继续往下走
# 第三种方案：
	-用celery，做异步
  -缺陷：引入celery，还得有消息队列。。。
# 第四种方案：（用的最多）
	-重写create方法，重写update方法，用信号存入，异步操作
  -缺陷：有代码侵入
# 第五种方案：（项目不写代码，自动同步），第三方开源的插件
	-https://github.com/siddontang/go-mysql-elasticsearch----go写
  -你可以用python重写一个，放到git上给别人用（读了mysql的日志）
  -跟平台无关，跟语言无关
  -如何使用：
  	-源码下载---》交叉编译---》可执行文件--》运行起来--》配置文件配好，就完事了
    # 配置文件
    [[source]]
    schema = "数据库名"
    tables = ["article"]
    [[rule]]
    schema = "数据库名"
    table = "表明"
    index = "索引名"
    type = "类型名"
  # 缺陷：
  	-es跟mysql同步时，不希望把表所有字段都同步，mysql的多个表对着es的一个类型
  # 话术升级：
  	-一开始同步
    -用了开源插件（读取mysql日志，连接上es，进行同步）
    -用信号自己写的
    -再高端：仿着他的逻辑，用python自己写的，----》（把这个东西开源出来）

ログイン後にコピー

haystack の使用

django Aサードパーティモジュール---》使用したサードパーティの Django モジュールは何ですか?
django で全文検索が実現可能
ORM と同等-->>Docking es、solr、whoosh
https://www.yisu.com/article/218631.htm
## はバージョン 6 以降の es をサポートしていません

#1  只有5种数据结构：
	-多种数据结构：字符串，hash，列表，集合，有序集合
#2  单线程，速度为什么这么快？
  -本质还是因为是内存数据库
  -epoll模型（io多路复用）
  -单线程，没有线程，进程间的通信
#3 linux上 安装redis#下载
  https://redis.io/download/
  #解压
  tar -xzf redis-5.0.7.tar.gz
  #建立软连接
  ln -s redis-5.0.7 redis
  cd redis
  make&&make install
  # bin路径下几个命令：redis-cli,redis-server,redis-sentinel
  # 在任意位置能够执行redis-server 如何做？配置环境变量
#4  启动redis的三种方式
  	-方式一：(一般不用，没有配置文件)
    	-redis-server
    -方式二：（用的也很少）
    	redis-serve --port 6380
    -方式三：（都用这种，配置文件）
    	daemonize yes #是否以守护进程启动
      pidfile /var/run/redis.pid   #进程号的位置，删除
      port 6379    #端口号
      dir "/opt/soft/redis/data"  #工作目录
      logfile 6379.log #日志位置  
      # 启动：redis-server redis.conf1
#5 客户端连接
  redis-cli -h 127.0.0.1 -p 6379
#6 使用场景
  -看md文档

ログイン後にコピー

以上がPython が ES を操作する方法とデータを Mysql と同期する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7488

CakePHP チュートリアル

1377

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

phpmyadminを開く方法 Apr 10, 2025 pm 10:51 PM

次の手順でphpmyadminを開くことができます。1。ウェブサイトコントロールパネルにログインします。 2。phpmyadminアイコンを見つけてクリックします。 3。MySQL資格情報を入力します。 4.「ログイン」をクリックします。

2時間のPython計画：現実的なアプローチ Apr 11, 2025 am 12:04 AM

2時間以内にPythonの基本的なプログラミングの概念とスキルを学ぶことができます。 1.変数とデータ型、2。マスターコントロールフロー（条件付きステートメントとループ）、3。機能の定義と使用を理解する4。

Redisキューの読み方 Apr 10, 2025 pm 10:12 PM

Redisのキューを読むには、キュー名を取得し、LPOPコマンドを使用して要素を読み、空のキューを処理する必要があります。特定の手順は次のとおりです。キュー名を取得します：「キュー：キュー」などの「キュー：」のプレフィックスで名前を付けます。 LPOPコマンドを使用します。キューのヘッドから要素を排出し、LPOP Queue：My-Queueなどの値を返します。空のキューの処理：キューが空の場合、LPOPはnilを返し、要素を読む前にキューが存在するかどうかを確認できます。

phpmyAdmin接続mysql Apr 10, 2025 pm 10:57 PM

phpmyadminを使用してmysqlに接続する方法は？ phpmyadminにアクセスするためのURLは、通常、http：// localhost/phpmyadminまたはhttp：// [サーバーIPアドレス]/phpMyAdminです。 MySQLユーザー名とパスワードを入力します。接続するデータベースを選択します。 [接続]ボタンをクリックして、接続を確立します。

Redisでサーバーを開始する方法 Apr 10, 2025 pm 08:12 PM

Redisサーバーを起動する手順には、以下が含まれます。オペレーティングシステムに従ってRedisをインストールします。 Redis-Server（Linux/Macos）またはRedis-Server.exe（Windows）を介してRedisサービスを開始します。 Redis-Cli ping（Linux/macos）またはRedis-Cli.exePing（Windows）コマンドを使用して、サービスステータスを確認します。 Redis-Cli、Python、node.jsなどのRedisクライアントを使用して、サーバーにアクセスします。

Redisのサーバーバージョンを表示する方法 Apr 10, 2025 pm 01:27 PM

質問：Redisサーバーバージョンを表示する方法は？コマンドラインツールRedis-Cli-versionを使用して、接続されたサーバーのバージョンを表示します。 Info Serverコマンドを使用して、サーバーの内部バージョンを表示し、情報を解析および返信する必要があります。クラスター環境では、各ノードのバージョンの一貫性を確認し、スクリプトを使用して自動的にチェックできます。スクリプトを使用して、Pythonスクリプトとの接続やバージョン情報の印刷など、表示バージョンを自動化します。

SQLデータベースエラーを表示する方法 Apr 10, 2025 pm 12:09 PM

SQLデータベースエラーを表示する方法は次のとおりです。1。エラーメッセージを直接表示します。 2。エラーを表示し、警告コマンドを表示します。 3.エラーログにアクセスします。 4.エラーコードを使用して、エラーの原因を見つけます。 5.データベース接続とクエリ構文を確認します。 6.デバッグツールを使用します。

メモリに対するRedisの持続性の影響は何ですか？ Apr 10, 2025 pm 02:15 PM

Redis Persistenceは余分なメモリを取り、RDBはスナップショットを生成するときに一時的にメモリの使用量を増加させ、AOFはログを追加するときにメモリを取り上げ続けます。影響要因には、データのボリューム、永続性ポリシー、Redis構成が含まれます。影響を緩和するために、RDBスナップショットポリシーを合理的に構成し、AOF構成を最適化し、ハードウェアをアップグレードし、メモリの使用量を監視できます。さらに、パフォーマンスとデータセキュリティのバランスを見つけることが重要です。

See all articles

Python が ES を操作する方法とデータを Mysql と同期する方法

Python で Elasticsearch を運用する 2 つの方法

Mysql と Elasticsearch でデータを同期する

haystack の使用

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック