oracle 分表分區

2020-03-27 09:43:06 土土豆jin

oracle 分表分區

一、查詢表所佔存儲空間

每張表都是作為“段”來存儲的，可以通過user_segments視圖查看其相應信息。段（segments）的定義：如果創建一個堆組織表，則該表就是一個段。

<code>SELECT segment_name AS TABLENAME,BYTES FROM user_segments WHERE segment_name='表名';/<code>

解釋： segment_name 就是要查詢的表名（大寫），BYTES 為表存儲所佔用的字節數。本sql的意思就是查詢出表名和表所佔的存儲空間大小。

二、分表

如果歷史表中存儲了很多年的數據，會造成嚴重的數據冗餘。那如果將歷史表分表存儲，比如每年創建一個表，數據存儲到對應的年表中，必定會減少很多數據量。

三、分區

1. 基礎

Oracle提供了分區技術以支持VLDB(Very Large DataBase)。分區表通過對分區列的判斷，把分區列不同的記錄，放到不同的分區中。分區完全對應用透明。
Oracle的分區表可以包括多個分區，每個分區都是一個獨立的段（SEGMENT），可以存放到不同的表空間中。查詢時可以通過查詢表來訪問各個分區中的數據，也可以通過在查詢時直接指定分區的方法來進行查詢。

When to Partition a Table什麼時候需要分區表，官網的2個建議如下：

Tables greater than 2GB should always be considered for partitioning.
Tables containing historical data, in which new data is added into the newest partition. A typical example is a historical table where only the current month's data is updatable and the other 11 months are read only.

在oracle 10g中最多支持：1024k-1個分區： Tables can be partitioned into up to 1024K-1 separate partitions

2. 分區優點

減少SQL操作的數據量，從而提升查詢效率。表分區後，邏輯上仍然是一張表，只不過將表中的數據在物理上存放到多個表空間上。這樣在查詢數據時，會查詢相應分區的數據，避免了全表掃描。

1) 增強可用性：如果表的某個分區出現故障，表在其他分區的數據仍然可用；
2) 維護方便：如果表的某個分區出現故障，需要修復數據，只修復該分區即可；
3) 均衡I/O：可以把不同的分區映射到磁盤以平衡I/O，改善整個系統性能；
4) 改善查詢性能：對分區對象的查詢可以僅搜索自己關心的分區，提高檢索速度

3. 分區類型

水平分區
就是對行進行分區，舉個例子來說，就是一個表中有1000萬條數據，每100萬條數據劃一個分區，這樣就將表中數據分到10個分區中去。水平分區要通過某個特定的屬性列進行分區，比如Date時間。
垂直分區
通過對錶垂直劃分來減少表的寬度，從而提升查詢效率。比如一個學生表中，有他相關的信息列，還有論文列以CLOB存儲。這些以CLOB存儲的論文並不會經常被訪問到，這時候就要把這些不經常使用的CLOB劃分到另一個分區，需要訪問時再調用它。

4. 分區方法

1） Range分區
Range分區是應用範圍比較廣的表分區方式，它是以列的值的範圍來做為分區的劃分條件，將記錄存放到列值所在的range分區中。
如按照時間劃分，2010年1月的數據放到a分區，2月的數據放到b分區，在創建的時候，需要指定基於的列，以及分區的範圍值。
在按時間分區時，如果某些記錄暫無法預測範圍，可以創建maxvalue分區，所有不在指定範圍內的記錄都會被存儲到maxvalue所在分區中。 create table pdba (id number, time date) partition by range (time) ( partition p1 values less than (to_date('2010-10-1', 'yyyy-mm-dd')), partition p2 values less than (to_date('2010-11-1', 'yyyy-mm-dd')), partition p3 values less than (to_date('2010-12-1', 'yyyy-mm-dd')), partition p4 values less than (maxvalue) )
2） Hash分區
對於那些無法有效劃分範圍的表，可以使用hash分區，這樣對於提高性能還是會有一定的幫助。hash分區會將表中的數據平均分配到你指定的幾個分區中，列所在分區是依據分區列的hash值自動分配，因此你並不能控制也不知道哪條記錄會被放到哪個分區中，hash分區也可以支持多個依賴列。
3） List分區
4）組合分區
如果某表按照某列分區之後，仍然較大，或者是一些其它的需求，還可以通過分區內再建子分區的方式將分區再分區，即組合分區的方式。

四、使用ORACLE在線重定義將普通表改為分區表

將普通錶轉換成分區表有4種方法：

Export/import method
Insert with a subquery method
Partition exchange method
DBMS_REDEFINITION
另外，INTERVAL分區是Oracle11g新增的特性，它是針對Range類型分區的一種功能拓展。對連續數據類型的Range分區，如果插入的新數據值與當前分區均不匹配，Interval-Partition特性可以實現自動的分區創建。 INTERVAL分區：由range分區派生而來，以定長寬度創建分區（比如年、月、具體的數字（比如100、500等）），分區字段必須是number或date類型。用戶其實根本不用關心其屬於哪個分區，也感覺不到，Oracle會自動管理並使其發揮分區的作用。具體參考：https://www.cnblogs.com/flowerszhong/p/4535206.html

此處主要講解在線重定義：DBMS_REDEFINITION。

1、首先建立測試表，並插入測試數據：

<code>create table myPartition(id number,code varchar2(5),identifier varchar2(20));
insert into myPartition values(1,'01','01-01-0001-000001');
insert into myPartition values(2,'02','02-01-0001-000001');
insert into myPartition values(3,'03','03-01-0001-000001');
insert into myPartition values(4,'04','04-01-0001-000001');
commit;
alter table myPartition add constraint pk_test_id primary key (id);/<code>

2.檢查下這張表是否可以在線重定義，無報錯表示可以，報錯會給出錯誤信息：

<code>--管理員權限執行begin
SQL> exec dbms_redefinition.can_redef_table('scott', 'myPartition');
PL/SQL procedure successfully completed
–管理員權限執行end/<code>

3. 建個和源表表結構一樣的分區表，作為中間表：

<code>create table t_temp(id number,code varchar2(5),
identifier varchar2(20)) partition by range(id)(  
          partition TAB_PARTOTION_01 values less than (2),  
          partition TAB_PARTOTION_02 values less than (3),  
          partition TAB_PARTOTION_03 values less than (4),  
          partition TAB_PARTOTION_04 values less than (5),  
          partition TAB_PARTOTION_OTHER values less THAN (MAXVALUE)  
);

alter table t_temp add constraint pk_temp_id2 primary key (id);/<code>

技巧：使用Navicat導出源表的結構sql，改下源表名為新表名，在命令行上跑這些sql語句即可。

4.啟動在線重定義：

<code>--管理員權限執行sql命令行執行
exec dbms_redefinition.start_redef_table('scott', 'myPartition', 't_temp');
--管理員權限執行sql命令行執行/<code>

這裡dbms_redefinition包的start_redef_table模塊有3個參數，分別是SCHEMA名字、原表的名字、中間表的名字。

5.啟動在線重定義後，中間表就可以查到原表的數據。

<code>select * from t_temp;/<code>

6.由於在生成系統中，在線重定義的過程中原數據表可能會發生數據改變，向原表中插入數據模擬數據改變。

<code>insert into myPartition values(5,'05','05-01-0001-000001');
commit;/<code>

7.此時原表被修改，中間表並沒有更新。

<code>select * from myPartition;
select * from t_temp;/<code>

8.使用dbms_redefinition包的sync_interim_table模塊刷新數據後，中間表也可以看到數據更改

<code>--管理員權限執行sql命令行執行,同步兩邊數據
exec dbms_redefinition.sync_interim_table('scott', 'myPartition', 't_temp');
--管理員權限執行sql命令行執行/<code>

查詢同步後的兩邊數據是否一致：

<code>select * from myPartition;
select * from t_temp;/<code>

9.結束在線重定義

<code>--管理員權限執行sql命令行執行，結束重定義
exec dbms_redefinition.finish_redef_table('scott', 'myPartition', 't_temp');
--管理員權限執行sql命令行執行/<code>

10.驗證數據

<code>select * from myPartition;
select * from t_temp;/<code>

11.查看各分區數據是否正確

<code>-- table_name必須大寫
select table_name, partition_name from user_tab_partitions where table_name = 'myPartition';

select * from myPartition partition(TAB_PARTOTION_01);/<code>

12.在線重定義後，中間表已經沒有意義，可留作備份或者刪掉

<code>drop table t_temp purge; /<code>

13.轉成分區表後，原普通表的增刪改查語句可以一成不動，可以平穩過渡。

*注意: * 如果執行在線重定義的過程中出錯,可以在執行dbms_redefinition.start_redef_table之後到執行dbms_redefinition.finish_redef_table之前的時間裡執行：DBMS_REDEFINITION.abort_redef_table('test', 't', 't_new')以放棄執行在線重定義。

五、本地索引和全局索引

分區表創建好了之後，如果需要最大化分區表的性能就需要結合索引的使用，分區表有兩種索引：本地索引和全局索引。既然存在著兩種的索引類型，相信存在即合理。既然存在就會有存在的原因，也就是在特定的場景中就更能發揮出索引的性能的

當查詢的條件是需要跨分區查詢內容的時候，LOCAL INDEX的效率比GLOBAL INDEX的效率要低
如果查詢的條件是在單個分區裡面查詢的時候，那麼LOCAL INDEX的效率比GLOBAL INDEX的效率要高。
參考鏈接: https://blog.csdn.net/sunbocong/article/details/80648209

分享到:

閱讀更多 土土豆jin 的文章

關鍵字: 分區數據庫分表

MapReduce的shuffle過程詳解（分片、分區、合併、歸併，）

Linux 下如何掛載並讀寫 NTFS 分區

阿里大牛實戰歸納——Kafka架構原理

Zookeeper 在 Kafka 中的作用

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"

oracle 分表分區

oracle 分表分區

一、 查詢表所佔存儲空間

二、 分表

三、 分區

1. 基礎

2. 分區優點

3. 分區類型

4. 分區方法

四、 使用ORACLE在線重定義將普通表改為分區表

1、首先建立測試表，並插入測試數據：

2.檢查下這張表是否可以在線重定義，無報錯表示可以，報錯會給出錯誤信息：

3. 建個和源表表結構一樣的分區表，作為中間表：

4.啟動在線重定義：

5.啟動在線重定義後，中間表就可以查到原表的數據。

6.由於在生成系統中，在線重定義的過程中原數據表可能會發生數據改變，向原表中插入數據模擬數據改變。

7.此時原表被修改，中間表並沒有更新。

8.使用dbms_redefinition包的sync_interim_table模塊刷新數據後，中間表也可以看到數據更改

9.結束在線重定義

10.驗證數據

11.查看各分區數據是否正確

12.在線重定義後，中間表已經沒有意義，可留作備份或者刪掉

13.轉成分區表後，原普通表的增刪改查語句可以一成不動，可以平穩過渡。

五、 本地索引和全局索引

相關文章:

MapReduce的shuffle過程詳解（分片、分區、合併、歸併，）

Linux 下如何掛載並讀寫 NTFS 分區

阿里大牛實戰歸納——Kafka架構原理

Zookeeper 在 Kafka 中的作用

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

Redis內存分析工具--rdr安裝與使用

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

一行代碼提升遷移性能

利用相似幾何信息，做可泛化3D形狀分割模型

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

分佈式緩存，真香

特徵工程的力量

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

SpringBoot如何優雅的使用RocketMQ

css代碼規範工具stylelint

一、查詢表所佔存儲空間

二、分表

三、分區

四、使用ORACLE在線重定義將普通表改為分區表

五、本地索引和全局索引

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪