使用oracle中的范围分区,我们将大量数据按年值进行了分区。我们使用了范围分区,但每个分区仅包含一年的数据。当我们编写针对特定年份的查询时,oracle从该分区获取信息,但仍会检查年份是否是我们指定的年份。由于今年列不是索引的一部分,因此它从表中获取年份并进行比较。我们已经看到,每当查询去获取表数据时,它就会变得太慢。
我们可以以某种方式避免oracle比较年份值,因为我们确定知道分区仅包含一年的信息。
更新:
执行分区的年份数据类型为类型编号。
我们没有选择任何其他列。我只是执行一个,count(*)并且没有选择任何列。
count(*)
如果我们删除条件并将查询目标定位到特定分区, select count(*) from table_name partition(part_2004)则它会更快,而 select count(*) from table where year = 2004速度会更慢。
select count(*) from table_name partition(part_2004)
select count(*) from table where year = 2004
分区在年份列上,该列是一个数字,并执行以下操作
年,少于2005 part_2004
不足2006年的年份part_2005
年份,少于2007 part_2006
…很快
没有解释计划或表定义,很难说出发生了什么。我的第一个猜测是,您有没有该year列的LOCAL分区索引。它们可以帮助您解决分区上的COUNT(*),但是当您查询单个年份(至少在10.2.0.3上)时似乎没有使用它们。
year
这是一个重现您的发现(和解决方法)的小示例:
SQL> CREATE TABLE DATA ( 2 YEAR NUMBER NOT NULL, 3 ID NUMBER NOT NULL, 4 extra CHAR(1000) 5 ) PARTITION BY RANGE (YEAR) ( 6 PARTITION part1 VALUES LESS THAN (2010), 7 PARTITION part2 VALUES LESS THAN (2011) 8 ); Table created SQL> CREATE INDEX ix_id ON DATA (ID) LOCAL; Index created SQL> INSERT INTO DATA 2 (SELECT 2009+MOD(ROWNUM, 2), ROWNUM, 'A' FROM DUAL CONNECT BY LEVEL <=1e4); 10000 rows inserted SQL> EXEC dbms_stats.gather_table_stats(USER, 'DATA', CASCADE=>TRUE); PL/SQL procedure successfully completed
现在比较两个说明计划:
SQL> SELECT COUNT(*) FROM DATA WHERE YEAR=2010; Execution Plan ---------------------------------------------------------- 0 SELECT STATEMENT Optimizer=ALL_ROWS (Cost=197 Card=1 Bytes=4) 1 0 SORT (AGGREGATE) 2 1 PARTITION RANGE (SINGLE) (Cost=197 Card=5000 Bytes=20000) 3 2 TABLE ACCESS (FULL) OF 'DATA' (TABLE) (Cost=197 Card=5000...) SQL> SELECT COUNT(*) FROM DATA PARTITION (part1); Execution Plan ---------------------------------------------------------- 0 SELECT STATEMENT Optimizer=ALL_ROWS (Cost=11 Card=1) 1 0 SORT (AGGREGATE) 2 1 PARTITION RANGE (SINGLE) (Cost=11 Card=5000) 3 2 INDEX (FULL SCAN) OF 'IX_ID' (INDEX) (Cost=11 Card=5000)
如您所见,直接查询年份时 不 使用索引。将年份添加到本地索引时,将使用该年份。我使用COMPRESS 1指令告诉Oracle压缩第一列。结果索引的大小几乎与原始索引相同(由于压缩),因此性能不应受到影响。
SQL> DROP INDEX ix_id; Index dropped SQL> CREATE INDEX ix_id ON DATA (year, ID) LOCAL COMPRESS 1; Index created SQL> SELECT COUNT(*) FROM DATA WHERE YEAR=2010; Execution Plan ---------------------------------------------------------- 0 SELECT STATEMENT Optimizer=ALL_ROWS (Cost=12 Card=1 Bytes=4) 1 0 SORT (AGGREGATE) 2 1 PARTITION RANGE (SINGLE) (Cost=12 Card=5000 Bytes=20000) 3 2 INDEX (RANGE SCAN) OF 'IX_ID' (INDEX) (Cost=12 Card=5000...)