'분류 전체보기' 카테고리의 글 목록 (7 Page)

트랜잭션 복제에서 SP 실행 게시

SQL Server 2009. 6. 15. 22:06

게시에서 SP 실행을 복제할 수 있습니다.
아래 그림처럼 SP를 복제하면서 복제 방식을 "저장 프로시저 실행" or "SP의 직렬화된 트랜잭션에서 실행"을 선택하면 게시에서 실행한 SP가 구독에서 그대로 실행되게 됩니다.

복제되는 SP를 실행할 경우 구독에서 다음과 같이 SP를 그대로 수행하는것을 확인할 수 있습니다.

SQL 2000에서부터 사용 가능한 기능입니다. :)

하만철 / Ha Man cheol
EMail : feisia@hanmail.net

AND

ENT 에디션에서 만든 파티션 테이블을 STD 에디션에 복구하면?

SQL Server 2009. 6. 8. 23:06

ENT 에디션에서 만든 파티션 테이블을 STD 에디션에 복구하면 어떻게 될까?

SQL은 오류나면서 복원이 안되네요; 쩝;;
(오라클은 복원하여 사용은 가능하지만 추가로 파티션 테이블을 생성하는건 안되지만 합니다. ㅎㅎ~ 참고링크)
복원을 모두 수행한 다음 파티션 테이블이 있는지를 체크하는 것 같습니다.
또, 복원후 DB파일과 DB는 존재하지만 사용은 할 수 없는 상태가 됩니다. (뭔가 좀;; ^^; )

파티션 테이블을 포함한 DB 버전
select @@version
Microsoft SQL Server 2005 - 9.00.3310.00 (Intel X86)
Dec 19 2008 00:58:18
Copyright (c) 1988-2005 Microsoft Corporation
Developer Edition on Windows NT 5.1 (Build 2600: Service Pack 3)

파티션 테이블을 포함한 DB 를 복원한 DB 버전
select @@version
Microsoft SQL Server 2005 - 9.00.4035.00 (Intel X86)
Nov 24 2008 13:01:59
Copyright (c) 1988-2005 Microsoft Corporation
Standard Edition on Windows NT 5.2 (Build 3790: Service Pack 2)

@@ 파티션 테이블을 포함하는 DB 생성
-- drop database partTest
CREATE DATABASE [partTest]
ON PRIMARY
( NAME = N'partTest', FILENAME = N'E:\SQL2K5\partTest.mdf'
, SIZE = 3 , MAXSIZE = UNLIMITED, FILEGROWTH = 1 )
, FILEGROUP fg1
( NAME = 'partTest1', FILENAME = N'E:\SQL2K5\partTest1.ndf'
    , SIZE = 3, MAXSIZE = UNLIMITED, FILEGROWTH = 1 )
, FILEGROUP fg2
( NAME = 'partTest2', FILENAME = N'E:\SQL2K5\partTest2.ndf'
    , SIZE = 3, MAXSIZE = UNLIMITED, FILEGROWTH = 1 )
, FILEGROUP fg3
( NAME = 'partTest3', FILENAME = N'E:\SQL2K5\partTest3.ndf'
    , SIZE = 3, MAXSIZE = UNLIMITED, FILEGROWTH = 1 )
, FILEGROUP fg4
( NAME = 'partTest4', FILENAME = N'E:\SQL2K5\partTest4.ndf'
    , SIZE = 3, MAXSIZE = UNLIMITED, FILEGROWTH = 1 )
LOG ON
( NAME = N'partTest_log', FILENAME = N'E:\SQL2K5\partTest_log.LDF'
, SIZE = 1 , MAXSIZE = UNLIMITED , FILEGROWTH = 1)
go
use partTest
GO

-- drop partition function PF1
CREATE PARTITION FUNCTION PF1 (int)
AS RANGE LEFT FOR VALUES (1, 100, 1000) ;
GO

-- drop partition scheme Ps1
CREATE PARTITION SCHEME PS1
AS PARTITION PF1
TO (fg1, fg2, fg3, fg4) ;
GO

CREATE TABLE PT1 (col1 int, col2 int)
ON PS1 (col1)
GO

insert into pt1 select 1, 1
insert into pt1 select 2, 1
insert into pt1 select 101, 1
insert into pt1 select 102, 1
insert into pt1 select 1001, 1
insert into pt1 select 1002, 1

set statistics profile on
select * from pt1 where col1 = 101
select * from pt1 where col1 = 1001
set statistics profile off

|--Table Scan(OBJECT:([partTest].[dbo].[PT1]), WHERE:([partTest].[dbo].[PT1].[col1]=(101)) PARTITION ID:((3)))
|--Table Scan(OBJECT:([partTest].[dbo].[PT1]), WHERE:([partTest].[dbo].[PT1].[col1]=(1001)) PARTITION ID:((4)))

backup database partTest to disk = 'e:\sql2k5\partTest.BAK'

@@ 파티션 테이블을 포함하는 DB를 복사해 가서 복원

restore database partTest
from disk = 'D:\Backup\partTest.BAK'
with move 'partTest' to 'D:\mssql\data\partTest.mdf'
,move 'partTest1' to 'D:\mssql\data\partTest1.ndf'
,move 'partTest2' to 'D:\mssql\data\partTest2.ndf'
,move 'partTest3' to 'D:\mssql\data\partTest3.ndf'
,move 'partTest4' to 'D:\mssql\data\partTest4.ndf'
,move 'partTest_log' to 'D:\mssql\data\partTest_log.LDF'

파일 1에서 데이터베이스 'partTest', 파일 'partTest'에 대해 176개의 페이지를 처리했습니다 .
파일 1에서 데이터베이스 'partTest', 파일 'partTest1'에 대해 16개의 페이지를 처리했습니다 .
파일 1에서 데이터베이스 'partTest', 파일 'partTest2'에 대해 16개의 페이지를 처리했습니다 .
파일 1에서 데이터베이스 'partTest', 파일 'partTest3'에 대해 16개의 페이지를 처리했습니다 .
파일 1에서 데이터베이스 'partTest', 파일 'partTest4'에 대해 16개의 페이지를 처리했습니다 .
파일 1에서 데이터베이스 'partTest', 파일 'partTest_log'에 대해 7개의 페이지를 처리했습니다 .
메시지 3167, 수준 16, 상태 1, 줄 1
RESTORE에서 데이터베이스 'partTest'을(를) 시작할 수 없습니다.
메시지 3013, 수준 16, 상태 1, 줄 1
RESTORE DATABASE이(가) 비정상적으로 종료됩니다.
메시지 905, 수준 21, 상태 1, 줄 1
데이터베이스 'partTest'은(는) 파티션 함수 'PF1'을(를) 포함하므로 이 버전의 SQL Server에서 시작할 수 없습니다. 분할은 SQL Server Enterprise Edition에서만 지원됩니다.

AND

[복제] 유니크 제약조건이 있는 게시 데이터 update시 구독에 반영하는 방식 - part2

SQL Server 2009. 5. 17. 23:22

이전에 유니크 제약조건이 있는 게시 데이터 update시 구독에 반영하는 방식에 대해 이야기 한적이 있습니다.
찾아보니 이렇게 유니크인덱스 또는 PK 컬럼이 update 되었을때 delete / insert 로 반영되는것을 "deferred update" 라고 한다는 것을 알았습니다.

          - http://support.microsoft.com/kb/238254
          - http://support.microsoft.com/kb/302341/EN-US/
          - http://support.microsoft.com/kb/160181/EN-US/

그리고 구독의 SP를 변경하여 사용하는 경우 update 명령이 delete / insert로 변경되어 적용될 경우 문제가 될수도 있기 때문에 다음 trace flag를 통하여 어떤 방식으로 update 명령을 구독에 반영할 지 제어 할 수 있습니다.

-- update로 동작
dbcc traceon (8207)

-- delete / insert로 동작
dbcc traceon (8202)

이 중 8207 flag의 경우 다음 경우에 문제가 될 수 있으므로 주의해야 한다고 말하고 있습니다.

From this point forward, an update to a unique column affects only one row (a singleton update) and is replicated as an UPDATE and not as a DELETE or INSERT pair. If the update affects multiple rows, the update is still replicated as a DELETE or INSERT pair.
(여러개 row가 업데이트 되는 경우는 delete / insert로 동작함 (민석형님 감사합니다. ㅎㅎ~))

Important: Typically, you use trace flag 8207 with read-only transactional replication. Do not use trace flag 8207 with updatable subscriptions if:

A primary key update can occur at the subscriber.
(구독에서 PK가 업데이트 되는 경우)

An update to a column that is included in a unique constraint can occur at the subscriber.
(구독의 유니크 제약조건에 포함된 컬럼이 업데이트 되는 경우)

An update to a column that is included in a unique index can occur at the subscriber.
(구독의 유니크 인덱스에 포함된 컬럼이 업데이트 되는 경우)

이상한점은, 복제의 경우 로그를 읽어 데이터를 반영하는 방식이기 때문에 동일한 update문을 수행했더라도 유니크 제약조건에 의해 update 와 delete / insert의 경우 로그가 다르게 쌓일거라고 생각했지만 동일하게 쌓인것을 확인할 수 있었습니다.
확인은 ::fn_dblog 명령을 통해 하였고 엑셀에 붙여서 확인해본 결과 완전히 동일하게 로그가 쌓인것을 확인할 수 있었습니다.

혹시 "해당 테이블의 인덱스를 참조 하는건가?" 하는 생각이 들어 다음과 같이 데이터 변경 후 인덱스를 변경하는 방식으로 수행해 보았는데 update 구문이 실행 당시의 인덱스 상황에 의해 update 또는 delete / insert로 풀리는것을 확인할 수 있었습니다.
즉, 로그리더는 게시의 로그파일만 읽어서 배포로 넘기지 테이블의 인덱스 정보를 참조하지는 않았습니다.

update t1 set col2 = 4 where col2 = 3
create unique index ix_t1_col2 on t1 (col2)

update t1 set col2 = 3 where col2 = 4
drop index t1.ix_t1_col2

혹시 로그리더가 읽어가는 데이터에 대해 좀 더 자세히 아시거나 좀더 상세히 로그를 확인할 수 있는 방법을 알고 계신분이 계시다면 알려 주시면 감사하겠습니다. ^^

하만철 / Ha Man cheol
EMail : feisia@hanmail.net

AND

[복제] 유니크 제약조건이 있는 게시 데이터 update시 구독에 반영하는 방식

SQL Server 2009. 5. 3. 21:01

트랜잭션 복제 환경에서 게시자에서 변경된 데이터는 SP 또는 ad-hoc 쿼리의 형태로 구독자에 반영하게 된다. 예를들어 2개의 row를 한번에 업데이트 하는 구문이 게시자에서 수행되면 구독자에서는 각각의 row 를 업데이트하는 SP가 2번 수행되어 변경된 값을 반영하게 된다.

이때 게시자에서 변경된 데이터가 유니크 인덱스의 컬럼중 하나라면 유니크 제약조건을 보장해 주는데 문제가 발생할 수 있다. 예를 들어 게시자에서 다음과 같은 스크립트를 수행하여 데이터를 업데이트 한다고 가정해 보자.

-- 테이블 생성. 이 테이블이 복제에 사용된다고 가정
create table t1 (

col1 int not null constraint PK_t1 primary key
, col2 int

)

-- 테스트 데이터 입력.
insert into t1 select 1, 1
insert into t1 select 2, -1

-- 유니크 인덱스 생성
create unique index uni_t1_col2 on t1 (col2)

-- 데이터 업데이트.
update t1 set col2 = col2*(-1)

마지막 라인에서 데이터 업데이트시 "한번에 2개 row를 업데이트 했다"는 내용을 2개의 SP에 나눠서 구독에 적용할 경우 유니크 조건을 만족시키기 위하여 구독에서는 update 대신 delete 후 insert 의 동작으로 변경하여 반영한다. 따라서 구독에서는 다음과 같은 동작으로 변경된다.

delete t1 where col1 = 1
delete t1 where col1 = 2
insert into t1 (col1, col2) values (1, -1)
insert into t1 (col1, col2) values (1, 1)

따라서 트랜잭션 복제 환경에서 아티클에 유니크 제약조건이 걸려있는 컬럼을 업데이트 하는 경우 동기화에 좀 더 많은 비용이 든다는것을 고려해야 한다.

select @@version
Microsoft SQL Server 2000 - 8.00.2282 (Intel X86)
        Dec 30 2008 02:22:41
        Copyright (c) 1988-2003 Microsoft Corporation
        Developer Edition on Windows NT 5.1 (Build 2600: Service Pack 3)

하만철 / Ha Man cheol
EMail : feisia@hanmail.net

AND

불면증

생활 2008. 12. 15. 03:05

저녁에 자던 시간을 훨씬 넘어서 잔게 몇일이나 지났는지 모르겠다.
원래 자고 싶을때 누우면 바로 잠들어서 다른 사람들이 엄청 부러워 했었는데 요즘엔 통 잠을 자지 못하는것 같다.
이런 생활패턴이 습관화 되지 않도록 해야 하는데.. 음.. 그냥 하루동안 안자고 그다음날 저녁에 일찍 잠들어 볼까 싶기도 하고..

요즘 너무 축 쳐져서 지내는게 아닌가 싶어서 기운을 좀 낼겸 해서 "바람의 파이터"를 다시한번 보았다.
"너는 내가 넘어야 할 하나의 산에 지나지 않는다."
멋진 말인것 같다. 그리고 아직 갈길이 많이 남았는데 이렇게 축쳐져 있어서 되겠어? 라는 생각이 들면서 몸에 기운이 좀 도는것 같다.
많이 힘들어도 기운을 내자.
어차피 나의 인생은 내가 만드는 것이다.

AND

로그 축소 테스트

SQL Server 2008. 12. 15. 02:41

예전에 로그백업 후 로그를 축소했는데 용량이 원하는 만큼 줄어들지 않고 다시한번 로그백업 후 축소를 하면 원하는대로 줄어드는 현상이 있어 확인해본 결과 로그 축소시 활성 VLF의 뒷부분만 축소가 된다는 것을 알게 되었었다.

오늘은 이 부분에 대해 실제로 테스트를 해 보았다.

select @@version

-- 집에 있는 노트북에 패치가 안되어 있었네요; 인터넷이 열악한 상황이라 패치하기가 힘드니 뭐라하지 마세요~ ^^;

Microsoft SQL Server 2005 - 9.00.1399.06 (Intel X86)

Oct 14 2005 00:33:37

Standard Edition on Windows NT 5.1 (Build 2600: Service Pack 3)

-- drop database logtest

CREATE DATABASE [logTest] ON PRIMARY

( NAME = N'logTest', FILENAME = N'D:\logTest.mdf' , SIZE = 10MB , MAXSIZE = UNLIMITED, FILEGROWTH = 1MB )

LOG ON

( NAME = N'logTest_log', FILENAME = N'D:\logTest_log.LDF' , SIZE = 1MB , MAXSIZE = 2048GB , FILEGROWTH = 1MB)

go

use logTest

go

-- Full backup을 한번 한다

backup database logTest to disk = 'd:\logtest.bak' with init

-- 로그 파일을 1M씩 2회 증가 시킨다.

dbcc loginfo

alter database [logTest] modify file (name = 'logTest_log', SIZE = 2MB)

alter database [logTest] modify file (name = 'logTest_log', SIZE = 3MB)

dbcc loginfo

-- 로그를 적당히 쌓고 한다. 2.3M정도 로그가 쌓인 것을 확인할 수 있다.

create table t1 (col1 int, col2 char(7000))

go

insert into t1 select 1,''

go 260

dbcc loginfo

-- 로그백업 후 변화를 확인한다. 논리로그 끝을 포함한 VLF만 활성상태로 남았다.

backup log logtest to disk = 'd:\logtest.trn' with init

dbcc loginfo

-- 로그 축소를 하면 확성 VLF뒷부분만 잘린 것을 확인할 수 있다. 즉 뒤쪽 3개의 VLF만 반환된 것을 확인할 수 있다.

dbcc shrinkfile (logTest_log, 1)

-- 다시한번 로그백업 다음

backup log logtest to disk = 'd:\logtest.trn' with init

dbcc loginfo

-- 다시 로그 축소를 하면 역시 뒷부분만 잘려 원하는 크기로 줄어든 것을 확인할 수 있다.

dbcc shrinkfile (logTest_log, 1)

하만철 / Ha Man cheol

AND

주말동안 뒹굴뒹굴...

생활 2008. 12. 7. 17:40

이번 주말은 거의 TV앞에서만 붙어서 지낸것 같다. 영화보고 드라마 보고.. 다운받아 놨던것들 중에 골라서 몇가지를 몰아서 열심히 봐버렸다.

- 다크나이트
전부터 보고 싶었는데 보지 못해서 그냥 본 영화..
이곳저곳에 눈에 익을 배우들이 보인다. 나 영화배우 잘 모르는데..뭐지? ㅎㅎ
그럭저럭 재미있었던거 같은데 기억에 남는건 별로 없는것 같다.
조커는 오직 혼란을 만들기 위해 노력하고, 배트맨은 혼란을 바로잡기위해 노력하는것 정도?

- 연애 그 참을 수 없는 가벼움
아무 생각없이 선택해서 본 영화인데 괜찮았던것 같다.
영화를 보면 영운의 잘못이 큰데 연아는 반지하의 집에서 힘들게 살아가야 하고 그것마저도 버려야 하지만 영운은 가정을 가지고 밝은곳에서 살 수 있는 환경이 주어진다.
연아라는 캐릭터의 인생에 몰입하면 눈물이 나오는 영화..
예전에 어딘가에서 본 기억에 남는 대사가 연아의 대사인줄 몰랐다..
"그년이랑 떡치는건 화가 않나는데..같이 나란히 누워서 얘기하는거 생각하니까 피가 거꾸로 솟는것 같아.."
연인끼리는 안보는게 좋을 것 같은 영화인것 같다. 감독은 제목에 반어법을 사용했다.

- 오렌지 데이즈
일본 드라마를 찾다가 괜찮다는 말이 많아서 다운받아 뒀다가 한번에 다 봐버렸다.
정말 재미있었고, 해피엔딩이라서 더 좋았던거 같다. (베드엔딩은 본뒤에 기분도 우울해져서.. ㅎㅎ)
보는 내도록 저렇게 순수한 시절에 대한 기억들이 나게 만들어준 드라마.
카이와 사에 사이의 대화에서 기억에 남을 대사가 많았던것 같다..
일본 여자얼굴형을 별로 좋아하지 않는데 약간은 마음이 바뀌게 만들어준 드라마..
한번 더 보고 싶은 드라마.. ^^

- 녹색의자
역시 영화라 좀 오바가 섞였고 헛점들도 보이긴 했지만 사회적 약자의 위치에 있는 여성의 이야기를 다시한번 볼 수 있게 해주고 어이없는 사회의 시선을 알 수 있게 영화였다.
재미없다는 이야기가 많아서 전혀 기대를 안하고 봐서 그런지 그럭저럭 볼만했다.
반항적인 성향이 있어서 그런지 나름 마음에 들었던 영화이다.

AND

음악을 듣다가..

생활 2008. 9. 23. 23:35

밤에 음악을 들으면 마음이 편안하게 너무 좋은것 같다.

내 MP3에는 2개의 폴더밖에 없다. "대충넣은노래", "좋은노래" ㅎㅎ~

아는 노래가 많이 없어서 대충 좋아보이는 노래들을 "대충넣은노래" 폴더에 집어넣고 몇번을 들어본 다음 괜찮은것 같으면 "좋은노래" 폴더로 옮겨둔다.

처음에 2곡으로 시작된 "좋은노래" 폴더가 이제는 11곡이 되었다. ^^

이런 좋은 음악을 들려주는 내 MP3와 이어폰~

MP3는 FORYOUDIGITAL의 Mu-905 , 이어폰은 BANG & OLUFSEN의 A8이다.

1000원짜리 이어폰만 사용하다가 친구의 추천으로 난생처음 사치를 부려서 구매한 이어폰인데 잘산것 같다.

요즘 문서작업때문에 완전 스트레스인데 잠시 쉬면서 내 블로그를 봤더니 내 생활에 관한 글이 너무 없는것 같아서 잠시 끄적여 봤다~ ㅎㅎ

AND

Bulk Insert 옵션에 따른 성능 비교

SQL Server 2008. 9. 19. 17:50

출처 : http://www.dbguide.net/dbqa/dbqa120001.jsp?mode=view&pg=3&idx=873

SSIS의 FastLoadOptions 를 확인하다 발견한 테스트 자료.
많은 시간을 들여 테스트 한 자료를 공유해 주신 한대성님께 감사드립니다~ ^^

--------------------------------------------------------------------------------

Bulk Insert 옵션에 따른 성능 비교

한대성

MS SQL Server MVP

에이디컨설팅 | SQLLeader.com 운영자

이전에 SQL Server 2005에서의 대량의 데이터를 로딩한 방법 별 수행 성능을 비교한 글을 올린 적이 있습니다. OPENROWSET, BCP, BULK INSERT, SSIS를 이용하여 데이터를 로딩하는 속도 비교를 측정한 글입니다. (http://www.sqlleader.com/mboard.asp?exec=view&strBoardID=SS2005TSQL&intSeq=351)

이번 글은 BULK INSERT 명령을 이용할 때 여러 경우에 대한 성능 비교 결과를 정리한 것입니다.

다음과 같은 형태의 10,000,000 건의 텍스트 파일을 Bulk Insert 명령을 이용하여 테이블로 로딩할 때 옵션에 따른 수행 시간 비교입니다. 각 경우에 대해 3회 반복 수행을 한 후, 평균 소요 시간을 이용하여 비교하였습니다.

[테스트 파일 - TestFile.txt]

Int형 순번 열, 100자리 문자 열 : 10,000,000 건

[저장 테이블 - TESTTABLE]

USE TEMPDB

GO

----------------------------------------

--TEST TABLE

-----------------------------------------

CREATE TABLE TESTTABLE

(

SEQ INT,

COL CHAR(100)

)

GO

※ DB File Size 증가로 인한 지연을 막기 위해 DB Size를 충분히 크게 늘린 후 수행함.

TEST 1) 인덱스가 없는 테이블에 로딩

--인덱스가 없는 테이블에 로딩

BULK INSERT TESTTABLE FROM 'D:\TestFile.txt'

WITH

(

FIELDTERMINATOR =',',

ROWTERMINATOR ='\n'

)

GO

처리 시간

1회 - 00:01:48

2회 - 00:01:50

3회 - 00:01:49

평균 - 00:01:49 (109초)

TEST 2) 인덱스가 없는 테이블에 로딩 + TABLOCK 옵션 적용

--인덱스가 없는 테이블에 로딩 + TABLOCK 옵션

BULK INSERT TESTTABLE FROM 'D:\TestFile.txt'

WITH

(

FIELDTERMINATOR =',',

ROWTERMINATOR ='\n',

TABLOCK

)

GO

처리 시간

1회 - 00:00:34

2회 - 00:00:33

3회 - 00:00:34

평균 - 00:00:34 (34초)

TEST 3) 인덱스가 없는 테이블에 로딩 + TABLOCK 옵션 적용 + 일괄 처리 크기 100,000으로 설정

--인덱스가 없는 테이블에 로딩 + TABLOCK 옵션 + RPB 100,000

BULK INSERT TESTTABLE FROM 'D:\TestFile.txt'

WITH

(

FIELDTERMINATOR =',',

ROWTERMINATOR ='\n',

TABLOCK,

ROWS_PER_BATCH = 100000

)

GO

처리 시간

1회 - 00:00:33

2회 - 00:00:33

3회 - 00:00:34

평균 - 00:00:33 (33초)

[Clustered Index 생성]

--Seq 컬럼에 Clustered Index 생성

CREATE CLUSTERED INDEX CIX_TESTTABLE ON TESTTABLE(SEQ)

GO

TEST 4) Clustered Index가 있는 테이블에 로딩

--Clustered Index가 있는 테이블에 로딩

BULK INSERT TESTTABLE FROM 'D:\TestFile.txt'

WITH

(

FIELDTERMINATOR =',',

ROWTERMINATOR ='\n'

)

GO

처리 시간

1회 - 00:03:40

2회 - 00:03:39

3회 - 00:03:39

평균 - 00:03:39 (219초)

TEST 5) Clustered Index가 있는 테이블에 로딩 + 일괄 처리 크기 100,000

-- Clustered Index가 있는 테이블에 로딩

-- RPB 100,000

BULK INSERT TESTTABLE FROM 'D:\TestFile.txt'

WITH

(

FIELDTERMINATOR =',',

ROWTERMINATOR ='\n',

ROWS_PER_BATCH = 100000

)

GO

처리 시간

1회 - 00:02:49

2회 - 00:02:47

3회 - 00:02:48

평균 - 00:02:48 (168초)

TEST 6) Clustered Index가 있는 테이블에 로딩 + ORDER 옵션

-- Clustered Index가 있는 테이블에 로딩

-- ORDER 옵션

BULK INSERT TESTTABLE FROM 'D:\TestFile.txt'

WITH

(

FIELDTERMINATOR =',',

ROWTERMINATOR ='\n',

ORDER(SEQ ASC)

)

GO

처리 시간

1회 - 00:02:21

2회 - 00:02:21

3회 - 00:02:20

평균 - 00:02:21 (141초)

TEST 7) Clustered Index가 있는 테이블에 로딩 + 일괄 처리 크기 100,000 + ORDER 옵션

-- Clustered Index가 있는 테이블에 로딩

-- RPB 100,000 + ORDER 옵션

BULK INSERT TESTTABLE FROM 'D:\TestFile.txt'

WITH

(

FIELDTERMINATOR =',',

ROWTERMINATOR ='\n',

ROWS_PER_BATCH = 100000,

ORDER(SEQ ASC)

)

GO

처리 시간

1회 - 00:02:20

2회 - 00:02:21

3회 - 00:02:21

평균 - 00:02:21 (141초)

TEST 8) Clustered Index가 있는 테이블에 로딩 + ORDER 옵션 + TABLOCK 옵션

-- Clustered Index가 있는 테이블에 로딩

-- ORDER 옵션 + TABLOCK 옵션

BULK INSERT TESTTABLE FROM 'D:\TestFile.txt'

WITH

(

FIELDTERMINATOR =',',

ROWTERMINATOR ='\n',

ORDER(SEQ ASC),

TABLOCK

)

GO

처리 시간

1회 - 00:00:37

2회 - 00:00:37

3회 - 00:00:37

평균 - 00:00:37 (37초)

TEST 9) Clustered Index가 있는 테이블에 로딩 + ORDER 옵션 + TABLOCK 옵션 + 일괄 처리 크기 100,000

-- Clustered Index가 있는 테이블에 로딩

-- RPB 100,000 + ORDER 옵션 + TABLOCK 옵션

BULK INSERT TESTTABLE FROM 'D:\TestFile.txt'

WITH

(

FIELDTERMINATOR =',',

ROWTERMINATOR ='\n',

ROWS_PER_BATCH = 100000,

ORDER(SEQ ASC),

TABLOCK

)

GO

처리 시간

1회 - 00:00:36

2회 - 00:00:37

3회 - 00:00:37

평균 - 00:00:37 (37초)

Clustered Index가 없는 힙(Heap) 테이블에 Bulk Insert 명령을 이용하여 로딩할 경우, TABLOCK의 옵션 설정에 따라 3배 정도의 속도 차이가 있습니다. 하지만, 일괄 처리 크기(Rows Per Batch) 설정은 성능에 별 영향을 미치지 않습니다. (34초 : 33초)

TABLOCK 옵션은 Bulk Insert 작업 수행 시 해당 테이블에 테이블 수준의 잠금을 설정함으로써, 하위 수준의 잠금 사용 시 발생하는 잠금 경합(Escalation)을 줄일 수 있을 뿐만 아니라 잠금을 설정하고 해제하는 단계를 줄여주기 때문에 처리 성능이 크게 향상될 수 있습니다. (옵션 적용 전 - 109초, 옵션 적용 - 34초) 하지만, 이 옵션을 적용하여 로딩할 경우에는 WITH (NOLOCK) 옵션 또는 WITH (READUNCOMMITTED) 옵션을 사용하더라도 로딩 중에 해당 테이블의 데이터를 읽을 수 없습니다. 따라서 로딩 중에 다른 부분에서 사용되는 테이블인 경우에는 이 옵션을 적용할 경우 블로킹을 발생시킬 수 있기 때문에 주의해야 합니다.

Clustered Index가 설정되어 있는 테이블인 경우에는 Heap 테이블과는 달리 몇 가지 옵션을 더 설정할 수 있습니다.

우선 옵션 없이 단순히 Bulk Insert를 수행할 경우, 입력된 데이터에 대해 인덱스 구성 작업을 수행해야 하기 때문에 힙 테이블의 로딩과 비교했을 때 훨씬 더 많은 시간이 소요됩니다. (Heap - 109초, Clustered Index - 219초)

일괄 처리 크기(Rows Per Batch)를 100,000건으로 설정하게 되면 전체 건(10,000,000건)의 인덱스를 한 번에 구성하는 대신 100,000건씩 나누어서 구성하기 때문에 처리 시간이 단축될 수 있습니다. (일괄 처리 - 219초, RPB 100,000건 168초)

만약 입력되는 데이터가 적재될 테이블의 Clustered 열과 동일한 순서로 정렬된 데이터인 경우에는 ORDER(열 이름 [ASC | DESC]) 옵션을 이용하여 처리 시간을 단축 시킬 수 있습니다. 본 테스트에서는 텍스트 파일의 첫 번째 열로 정렬된 데이터이며, 이 데이터가 테이블의 SEQ열로 입력되기 때문에 ORDER 옵션을 적용할 경우, 처리 시간이 단축됩니다. (옵션 미 적용 - 219초, ORDER 옵션 적용 - 141초)

또한 Heap에서와 마찬가지로 TABLOCK 옵션을 설정하여 처리할 경우, 처리 시간이 크게 단축됩니다. 10,000,000건의 텍스트 파일에 대해 아무런 옵션 없이 Bulk Insert 작업을 수행한 경우에 비해 ORDER, TABLOCK 옵션을 이용하여 처리한 수행 시간이 6배 정도 빠르게 나타났습니다. (219초 : 37초)

참고로, 이러한 사항은 BULK INSERT 명령뿐만 아니라 SSIS(Integration Services) 패키지의 데이터 로딩 작업에서도 설정할 수 있는 사항입니다.

- OLE DB 대상에서 빠른 로드 설정 후, 고급 OLE DB 대상 편집기 중 FastLoadOptions 부분에서 설정

- SQL Server 대상의 고급 Server 대상 편집기 중, BulkInsertOrder 부분에서 설정

본 게시판에 실린 글은 누구나 복사하셔서 이용하셔도 되지만, 반드시 출처(SQLLeader.com) 및 글의 링크를 밝혀주셔야 합니다.

AND

백그라운드 데이터 페이지 삭제 프로세스 테스트

SQL Server 2008. 8. 26. 23:00

SQL Leader 에서 재미있는 이슈가 있어 간단히 테스트한 내용을 옮겨둠~
http://www.sqlleader.com/mboard.asp?exec=view&strBoardID=SS2005QNA&intPage=2&intCategory=0&strSearchCategory=|s_name|s_subject|&strSearchWord=&intSeq=2369
결국 질문에 대한 답은 아니었지만 한가지 알게 되었으니 기념으로!! ^^

=============================================================================

DB에 데이터가 들어가면 내부적으로 페이지를 할당하게 됩니다.
반대로 데이터가 삭제될 경우 삭제 즉시 할당된 페이지가 반환되는게 아니라 비동기적으로 반환이 이루어지는것 같습니다.

자.. 이제 쭈아님께서 작업하시는 스토리대로 예제를 한번 만들어 보겠습니다.

예를들어 테이블에 1 ~ 1000 까지 데이터를 넣어서 1000개의 페이지가 할당되었다고 가정하고,
(사실 1페이지에는 더 많은 데이터가 들어가겠지만 계산을 쉽게 하기 위해.. ^^; )

먼저 SELECT를 해보면 정상적으로 읽기가 수행이 됩니다.

하지만 1~900까지를 삭제한 다음 잽싸게 다시 SELECT를 해보면..
ASC로 읽었을때 훨씬 많은 페이지를 읽게 됩니다.
데이터가 삭제되어서 없지만 유령 페이지가 남아있어서 실제 데이터가 나올때까지 순차적으로 읽어나가게 됩니다.
(앞쪽 데이터를 삭제해서 앞쪽에 유령 페이지가 우루루 몰려 있는 상황입니다.)

물론 몇초후 다시 조회를 해보면 할당된 페이지를 반환하고 정상적인 조회가 이루어 지는것을 확인할 수 있습니다.

아래는 테스트에 사용한 쿼리를 간략하게 정리한 내용입니다.

그럼 좋은 하루 되세요~!

use master

-- drop database db2

create database db2

use db2

-- drop table tbl

create table tbl (col1 int, col2 char(8000))

create clustered index ci_col1 on tbl (col1)

insert into tbl

select top 1000 row_number() over (order by (select 1)) , 'a'

from sysindexes a, sysindexes b, sysindexes c

set statistics io on

select top 5 * from tbl with(nolock) order by col1 asc

select top 5 * from tbl with(nolock) order by col1 desc

(5개행적용됨)

테이블'tbl'. 검색수1, 논리적읽기수10, 물리적읽기수0, 미리읽기수0, LOB 논리적읽기수0, LOB 물리적읽기수0, LOB 미리읽기수0.

(5개행적용됨)

테이블'tbl'. 검색수1, 논리적읽기수9, 물리적읽기수0, 미리읽기수0, LOB 논리적읽기수0, LOB 물리적읽기수0, LOB 미리읽기수0.

-- 삭제후 잽싸게 SELECT를 해본다

delete tbl where col1 < 900

select top 5 * from tbl with(nolock) order by col1 asc

select top 5 * from tbl with(nolock) order by col1 desc

(5개행적용됨)

테이블'tbl'. 검색수1, 논리적읽기수910, 물리적읽기수0, 미리읽기수0, LOB 논리적읽기수0, LOB 물리적읽기수0, LOB 미리읽기수0.

(5개행적용됨)

테이블'tbl' 검색수1, 논리적읽기수9, 물리적읽기수0, 미리읽기수0, LOB 논리적읽기수0, LOB 물리적읽기수0, LOB 미리읽기수0.

select top 5 * from tbl order by col1 asc

select top 5 * from tbl order by col1 desc

(5개행적용됨)

테이블'tbl'. 검색수1, 논리적읽기수910, 물리적읽기수0, 미리읽기수0, LOB 논리적읽기수0, LOB 물리적읽기수0, LOB 미리읽기수0.

(5개행적용됨)

테이블'tbl'. 검색수1, 논리적읽기수9, 물리적읽기수0, 미리읽기수0, LOB 논리적읽기수0, LOB 물리적읽기수0, LOB 미리읽기수0.

dbcc ind (DB2, tbl, -1)

-- 몇초후~ 다시해보면!!!! 오오~

(5개행적용됨)

테이블'tbl'. 검색수1, 논리적읽기수11, 물리적읽기수0, 미리읽기수0, LOB 논리적읽기수0, LOB 물리적읽기수0, LOB 미리읽기수0.

(5개행적용됨)

테이블'tbl'. 검색수1, 논리적읽기수10, 물리적읽기수0, 미리읽기수0, LOB 논리적읽기수0, LOB 물리적읽기수0, LOB 미리읽기수0.

AND

BLOG ARTICLE 분류 전체보기 | 113 ARTICLE FOUND

트랜잭션 복제에서 SP 실행 게시

ENT 에디션에서 만든 파티션 테이블을 STD 에디션에 복구하면?

[복제] 유니크 제약조건이 있는 게시 데이터 update시 구독에 반영하는 방식 - part2

[복제] 유니크 제약조건이 있는 게시 데이터 update시 구독에 반영하는 방식

불면증

로그 축소 테스트

주말동안 뒹굴뒹굴...

음악을 듣다가..

Bulk Insert 옵션에 따른 성능 비교

백그라운드 데이터 페이지 삭제 프로세스 테스트

ARTICLE CATEGORY

ARCHIVE & SEARCH

CALENDAR

RECENT ARTICLE

TAG CLOUD

RECENT COMMENT

RECENT TRACKBACK

MY LINK

COUNTER

티스토리툴바

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31