史上最简单的数据抽取
史上最简单的数据抽取 做为一名全职DBA,在之前的工作中,常会收到这样的需求,需要我配合开发定时的从几张目标表取出他们需要的数据,并存放到临时表中,开发们再从临时表中取出数据展现给前端页面。 收到这样的需求,我觉得应该考虑以下几点: (1)目标表有
史上最简单的数据抽取
做为一名全职DBA,在之前的工作中,常会收到这样的需求,需要我配合开发定时的从几张目标表取出他们需要的数据,并存放到临时表中,开发们再从临时表中取出数据展现给前端页面。
收到这样的需求,我觉得应该考虑以下几点:
(1)目标表有哪几张,它们的关联关系如何,这决定了我如何取数据
(2)定时抽取,意味着要周期性的提取数据,此抽取周期是多少?每次抽取数据的频率是多久?
(3)周期性的抽取数据,那么临时表的命名要有规则,通过就是"临时表名_日期时间",这样命名方便开发前端取数
(4)周期性的抽取数据,那么临时表的保留及清理也要考虑一下,防止表空间使用率过高
(5)如果每一次抽取数据消耗的时间比较长,那么要有1个监控的手段,方便查看本次抽取数据的进度
(6)数据抽取的过程中,如果本次抽取数据时发现有问题,那么你抽数的存储过程要可以复用。
也就是说,当前你第2次执行抽数的存储过程时,本次操作之前抽取出的脏数据要清空掉。
那么什么是数据抽取?
最简单的解释就是,从原始数据中抽取出感兴趣数据的过程。
针对上面我总结出的6点,咱们开始模拟一套最简单的数据抽取案例。
(一)、表结构及字段说明
(二)、模拟业务需求
(1)、从emp和dept表中抽取出:emp.empno、emp.ename、emp.job、emp.deptno、dept.dname、dept.loc、sysdate字段,构造产生临时表:T_EMP_DEPT (2)、emp和dept表的关联关系:emp表的deptno字段 参照引用 dept表的deptno字段 (3)、开发人员每天13点会查询使用当天产生的临时表 (4)、每次产生的临时表,保留周期是30天,超过30天的临时表可以被清理掉
(三)、给出解决方案
(1)、从emp和dept表关联查询出需要的字段,关联字段是deptno,并创建临时表:T_EMP_DEPT (2)、每天抽取一次,我们在每天13点之前把临时表创建好就可以了 (3)、临时表的命名规则:T_EMP_DEPT_yyyymmdd(取当前系统的年月日) (4)、抽取数据的存储过程中,加入逻辑判断,取当前系统时间,并将30天前的临时表清除(先truncate,再drop) (5)、单独写1个存储过程及表,用来保存每次抽取数据的进度情况,方便我们监控抽取数据的进度 (6)、在抽取数据的存储过程中,每次都要先truncate临时表、drop临时表,然后再进行本次的数据抽取。实现数据抽取的复用
既然全想清楚了,那么我们就开始操练起来吧
1、创建日志表(存储抽取进度)
650) this.width=650;" title="日志表.png" alt="wKioL1WOS2GjvszPAAUrB8R9cvE643.jpg" />
2、创建监控进度的存储过程
650) this.width=650;" title="监控抽取进度存储过程.png" alt="wKiom1WOSdfCkIcaAASKc1-toA4015.jpg" />
3、创建抽取数据的存储过程
CREATE OR REPLACE PROCEDURE prc_emp_dept authid current_user is table_name_1 varchar2(100); --临时表名 table_flag number; --标识临时表是否存在 0:不存在 1:存在 create_sql varchar2(5000);--创建临时表的SQL语句 insert_sql varchar2(5000);--Insert操作SQL语句 date_30 varchar2(20); --数据过期的时间 30天以前 date_cur varchar2(20); --当前日期 log_detail varchar2(4000); --日志明细参数 begin date_cur := to_char(sysdate, 'yyyymmdd'); --当前日期 date_30 := to_char(sysdate - 30, 'yyyymmdd'); --30天以前的日期 table_flag := 0; --初始状态0,目标不存在 table_name_1 := 'T_EMP_DEPT'||date_cur; ---如果临时表存在先清空、再干掉(实现功能复用) execute immediate 'select count(*) from user_tables where table_name='''||table_name_1|| '''' into table_flag; if table_flag = 1 then execute immediate 'truncate table '||table_name_1; execute immediate 'drop table '||table_name_1; --日志明细信息 log_detail := '删除临时表的时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','00',log_detail); end if; ---创建中间表T_EMP_DEPTyyyymmdd create_sql :='create table '|| table_name_1 || ' nologging as select e.EMPNO , e.ENAME , e.JOB , e.MGR , e.HIREDATE, e.SAL , e.COMM , e.DEPTNO , d.DNAME , d.LOC , sysdate as current_time from emp e,dept d where e.deptno=d.deptno'; execute immediate create_sql; --日志明细信息 log_detail := '中间表创建完毕时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','01',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第1次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','02',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第2次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','03',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第3次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','04',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第4次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','05',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第5次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','06',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第6次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','07',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第7次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','08',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第8次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','09',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第9次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','10',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第10次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','11',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第11次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','12',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第12次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','13',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第13次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','14',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第14次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','15',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第15次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','16',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第16次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','17',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第17次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','18',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第18次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','19',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第19次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','20',log_detail); insert_sql :='insert into '|| table_name_1 ||' select * from '|| table_name_1; execute immediate insert_sql; commit; --日志明细信息 log_detail := '第20次往中间表插入数据完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','21',log_detail); P_INSERT_LOG(sysdate,'prc_emp_dept','22','抽取数据部分结束了!'); ---删除30天以前的临时表 execute immediate 'select count(*) from user_TABLES where table_name=''T_EMP_DEPT'||date_30 || '''' into table_flag; if table_flag = 1 then --找到了30天前的表 execute immediate ' truncate table T_EMP_DEPT' ||date_30; execute immediate ' drop table T_EMP_DEPT' ||date_30; log_detail := '删除30天前临时表完成时间:' ||to_char(sysdate, 'yyyy-mm-dd hh24:mi:ss'); P_INSERT_LOG(sysdate,'prc_emp_dept','23',log_detail); end if; end prc_emp_dept; /
4、使用sys用户显示授权给scott,防止dbms_job调用存储过程时报没有权限
5、查看监控日志表(新表什么也没有)
6、手工执行抽取数据的存储过程
7、查看监控日志表(记录得比较详细)
朋友们,咱们的数据抽取功能、监控抽取进度、业务的需求咱们基本就全完成了。
现在还差1项就是把抽取数据的存储过程设置成定时任务,然后周期性的执行。
常用的定时任务有2种:
a.crontab (操作系统层面的)
b.dbms_job (oracle自带的)
将咱们的数据抽取存储过程加入到定时任务,让它自己周期性的执行就可以了。
8、我使用的是dbms_job,详细如下图
好了,朋友们至此,本套史上最简单的数据自动抽取文章就结束了!
此篇文章中涵盖了以下知识点:
1、SQL多表联合查询
2、关于业务的分析及思考
3、数据的自动抽取
4、数据抽取的进度监控
5、定时任务
6、表的管理
结束语:
相信大家已经发现了,本次文章中使用到的操作用户是scott,咱们oracle中基础练习的用户。
本篇文章是我上课的一个小案例,我的学生们反应不错,他们说接受起来比较容易。
所以我就把这个小案例移植到了51的博客上,分享给更多需要的朋友们!
其实每个人都有拖延症,都会害怕去尝试新鲜事物,所以我想说本篇文章:
送给想做数据抽取的朋友们、
送给对数据处理感兴趣的朋友们、
送给想学习oracle开发方向的朋友们、
送给想和做不同步的朋友们、
送给想学习的朋友们
附:本篇文章中的代码,全部手工测试过没有问题。如果朋友们在操作过程中发现报错,请好好检查一下代码。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









DDREASE は、ハード ドライブ、SSD、RAM ディスク、CD、DVD、USB ストレージ デバイスなどのファイル デバイスまたはブロック デバイスからデータを回復するためのツールです。あるブロック デバイスから別のブロック デバイスにデータをコピーし、破損したデータ ブロックを残して正常なデータ ブロックのみを移動します。 ddreasue は、回復操作中に干渉を必要としないため、完全に自動化された強力な回復ツールです。さらに、ddasue マップ ファイルのおかげでいつでも停止および再開できます。 DDREASE のその他の主要な機能は次のとおりです。 リカバリされたデータは上書きされませんが、反復リカバリの場合にギャップが埋められます。ただし、ツールに明示的に指示されている場合は切り詰めることができます。複数のファイルまたはブロックから単一のファイルにデータを復元します

0.この記事は何をするのですか?私たちは、多用途かつ高速な最先端の生成単眼深度推定モデルである DepthFM を提案します。従来の深度推定タスクに加えて、DepthFM は深度修復などの下流タスクでも最先端の機能を実証します。 DepthFM は効率的で、いくつかの推論ステップ内で深度マップを合成できます。この作品について一緒に読みましょう〜 1. 論文情報タイトル: DepthFM: FastMonocularDepthEstimationwithFlowMatching 著者: MingGui、JohannesS.Fischer、UlrichPrestel、PingchuanMa、Dmytr

Excel で複数の条件によるフィルタリングを使用する方法を知る必要がある場合は、次のチュートリアルで、データを効果的にフィルタリングおよび並べ替えできるようにするための手順を説明します。 Excel のフィルタリング機能は非常に強力で、大量のデータから必要な情報を抽出するのに役立ちます。設定した条件でデータを絞り込み、条件に合致した部分のみを表示することができ、データ管理を効率化できます。フィルター機能を利用すると、目的のデータを素早く見つけることができ、データの検索や整理の時間を節約できます。この機能は、単純なデータ リストに適用できるだけでなく、複数の条件に基づいてフィルタリングすることもできるため、必要な情報をより正確に見つけることができます。全体として、Excel のフィルタリング機能は非常に実用的です。

Google が推進する JAX のパフォーマンスは、最近のベンチマーク テストで Pytorch や TensorFlow のパフォーマンスを上回り、7 つの指標で 1 位にランクされました。また、テストは最高の JAX パフォーマンスを備えた TPU では行われませんでした。ただし、開発者の間では、依然として Tensorflow よりも Pytorch の方が人気があります。しかし、将来的には、おそらくより大規模なモデルが JAX プラットフォームに基づいてトレーニングされ、実行されるようになるでしょう。モデル 最近、Keras チームは、ネイティブ PyTorch 実装を使用して 3 つのバックエンド (TensorFlow、JAX、PyTorch) をベンチマークし、TensorFlow を使用して Keras2 をベンチマークしました。まず、主流のセットを選択します

iPhone のモバイル データ接続に遅延や遅い問題が発生していませんか?通常、携帯電話の携帯インターネットの強度は、地域、携帯ネットワークの種類、ローミングの種類などのいくつかの要因によって異なります。より高速で信頼性の高いセルラー インターネット接続を実現するためにできることがいくつかあります。解決策 1 – iPhone を強制的に再起動する 場合によっては、デバイスを強制的に再起動すると、携帯電話接続を含む多くの機能がリセットされるだけです。ステップ 1 – 音量を上げるキーを 1 回押して放します。次に、音量小キーを押して、もう一度放します。ステップ 2 – プロセスの次の部分は、右側のボタンを押し続けることです。 iPhone の再起動が完了するまで待ちます。セルラーデータを有効にし、ネットワーク速度を確認します。もう一度確認してください 修正 2 – データ モードを変更する 5G はより優れたネットワーク速度を提供しますが、信号が弱い場合はより適切に機能します

世界は狂ったように大きなモデルを構築していますが、インターネット上のデータだけではまったく不十分です。このトレーニング モデルは「ハンガー ゲーム」のようであり、世界中の AI 研究者は、データを貪欲に食べる人たちにどのように餌を与えるかを心配しています。この問題は、マルチモーダル タスクで特に顕著です。何もできなかった当時、中国人民大学学部のスタートアップチームは、独自の新しいモデルを使用して、中国で初めて「モデル生成データフィード自体」を実現しました。さらに、これは理解側と生成側の 2 つの側面からのアプローチであり、両方の側で高品質のマルチモーダルな新しいデータを生成し、モデル自体にデータのフィードバックを提供できます。モデルとは何ですか? Awaker 1.0 は、中関村フォーラムに登場したばかりの大型マルチモーダル モデルです。チームは誰ですか?ソフォンエンジン。人民大学ヒルハウス人工知能大学院の博士課程学生、ガオ・イージャオ氏によって設立されました。

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機(VISTA)で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランク ケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

今週、OpenAI、Microsoft、Bezos、Nvidiaが投資するロボット企業FigureAIは、7億ドル近くの資金調達を受け、来年中に自立歩行できる人型ロボットを開発する計画であると発表した。そしてテスラのオプティマスプライムには繰り返し良い知らせが届いている。今年が人型ロボットが爆発的に普及する年になることを疑う人はいないだろう。カナダに拠点を置くロボット企業 SanctuaryAI は、最近新しい人型ロボット Phoenix をリリースしました。当局者らは、多くのタスクを人間と同じ速度で自律的に完了できると主張している。人間のスピードでタスクを自律的に完了できる世界初のロボットである Pheonix は、各オブジェクトを優しくつかみ、動かし、左右にエレガントに配置することができます。自律的に物体を識別できる
